向心理论的参数化研究及其在汉语指代消解中的应用

来源 :上海外国语大学 | 被引量 : 7次 | 上传用户:my163mail12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
向心理论是一个有关语篇连贯和显著性的理论。自提出以来,该理论已被广泛的运用于指代消解,语篇连贯性分析等领域。但是向心理论的提出者,为了使该理论能被广泛地用于解释不同语言中的语言现象,并未对向心理论中的核心概念,如语句(utterance),前瞻中心(C_f)的排序(ranking),实现(realization),以及R1代词的定义进行严格的限定。在具体的指代消解算法实现中,需要对上述概念分别进行参数化的分析,以获得相对于具体指代消解任务的最佳参数设定。 本文在向心理论参数化研究的基础上,综合分析了各种基于向心理论的指代消解算法,并对向心理论在汉语指代消解中参数设定进行了实证性研究。 本文收集了来自三种语篇类型的共三万多字的语料,其中名词短语5148个。首先我们给这些名词短语标注上语法功能以及数和性等特征,然后编写程序将语料中的名词短语信息自动存入一个Access语料库。根据研究目的的需要,本文一共设计了六个基于向心理论的指代消解算法,每个算法实现一种不同的参数设定,这些算法在数据库提供的名词信息基础上对语料中的代词和零形代词进行消解。 本文研究的向心理论的参数有:语句的定义,前瞻中心的排序,以及R1代词的选定。 对于语句的定义,我们考察了两种可能的语句定义,一是将语句定义为至少包含一个述谓结构的,用标点符号隔开的语段;二是将语句定义为句子。这两种语句划分的方法在文中分别记为Udef.1和Udef.2。研究结果表明,在Udef.1划分下,零形代词的消解正确率远远高于Udef.2。然而,在这两种语句划分对于代词消解的正确率的影响不如对零形代词消解明显。 本文考察的前瞻中心排序影响因素有:语篇实体的出现顺序,语篇实体的语法角色,语法角色平行因素,后指中心(C_b)延续,和语篇实体出现的句法层次。消解结果表明,语篇实体的语法角色,相对于语篇实体出现的线形顺序,更能精确忠实地反映语篇实体的显著性。在指代消解中引入语法角色平行因素对于代词和零形代词消解均有积极的影响,这种影响在语句按照Udef.2划分的情况下更为显著。本文研究发现将C_b的延续性倾向引入指代消解算法并没有给消解结果带来积极的影响,而且在某些参数设定下,引入C_b延续性考虑还会给指代消解带来负面影响。这说明向心理论中提出的“语篇实体连贯性”(entity coherence)并不是语篇实现连贯的唯一途径。
其他文献
本文以汪繼培箋、彭鐸校正的《潛夫論箋校正》作為研究对象,並充分利用諸版本中的異文材料,綜合運用文字學、詞義學、語法學、音韻學的語言學理論和訓詁學理論以及版本、校勘
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
【目的】研究丘陵平原过渡区土壤农药残留特征,为其农业生产布局及土壤污染防治提供科学依据。【方法】以四川省五通桥区为例,利用气相色谱法检测丘陵平原过渡区103个样点的
提出了桉树人工林经营的5大目标:生态目标、经济目标、社会目标、安全目标和文化目标,针对桉树人工林经营文化目标的形成及关联因素进行了系统分析,总结了文化目标的具体内容
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
随着我国社会经济蓬勃发展,以及科学技术的不断进步,石油勘探开发技术也随之提高,同时各行各业对石油能源的需求也迅速增加,这就对石油勘探开发提出了较高的要求。显然现有的
虚拟实验平台能促进“双一流”建设中跨学科的资源共享、实验合作、实验能力分享以及协同创新。虚拟实验平台管理模式的研究包括确定平台的内涵和目标,制定平台建设和使用的