论文部分内容阅读
                            
                            
                                向心理论是一个有关语篇连贯和显著性的理论。自提出以来,该理论已被广泛的运用于指代消解,语篇连贯性分析等领域。但是向心理论的提出者,为了使该理论能被广泛地用于解释不同语言中的语言现象,并未对向心理论中的核心概念,如语句(utterance),前瞻中心(C_f)的排序(ranking),实现(realization),以及R1代词的定义进行严格的限定。在具体的指代消解算法实现中,需要对上述概念分别进行参数化的分析,以获得相对于具体指代消解任务的最佳参数设定。    本文在向心理论参数化研究的基础上,综合分析了各种基于向心理论的指代消解算法,并对向心理论在汉语指代消解中参数设定进行了实证性研究。    本文收集了来自三种语篇类型的共三万多字的语料,其中名词短语5148个。首先我们给这些名词短语标注上语法功能以及数和性等特征,然后编写程序将语料中的名词短语信息自动存入一个Access语料库。根据研究目的的需要,本文一共设计了六个基于向心理论的指代消解算法,每个算法实现一种不同的参数设定,这些算法在数据库提供的名词信息基础上对语料中的代词和零形代词进行消解。    本文研究的向心理论的参数有:语句的定义,前瞻中心的排序,以及R1代词的选定。    对于语句的定义,我们考察了两种可能的语句定义,一是将语句定义为至少包含一个述谓结构的,用标点符号隔开的语段;二是将语句定义为句子。这两种语句划分的方法在文中分别记为Udef.1和Udef.2。研究结果表明,在Udef.1划分下,零形代词的消解正确率远远高于Udef.2。然而,在这两种语句划分对于代词消解的正确率的影响不如对零形代词消解明显。    本文考察的前瞻中心排序影响因素有:语篇实体的出现顺序,语篇实体的语法角色,语法角色平行因素,后指中心(C_b)延续,和语篇实体出现的句法层次。消解结果表明,语篇实体的语法角色,相对于语篇实体出现的线形顺序,更能精确忠实地反映语篇实体的显著性。在指代消解中引入语法角色平行因素对于代词和零形代词消解均有积极的影响,这种影响在语句按照Udef.2划分的情况下更为显著。本文研究发现将C_b的延续性倾向引入指代消解算法并没有给消解结果带来积极的影响,而且在某些参数设定下,引入C_b延续性考虑还会给指代消解带来负面影响。这说明向心理论中提出的“语篇实体连贯性”(entity coherence)并不是语篇实现连贯的唯一途径。