论文部分内容阅读
本文研究了自然语言处理的语义层面,提出了汉语语义知识的表示方法,并将汉语语义知识应用到一个基于语义的汉语句法分析系统中。 语义分析是自然语言理解的基础。本文在比较了各种语义学理论、各种知识表示方法的基础上,对知识图表示方法进行了改进,提出并建立了基于知识图的汉语语义知识的层级表述体系,该体系由词图、短语图、句子图三级语义单位和语义类规则构成。词图是根据知网语义词典自动生成的,短语图是在短语分析过程中由词图合并得来的,句子图是根据句模规则由短语图合并得来的。语义类规则包括语义规则和句模规则。 在建立了汉语语义知识的层级表述体系后,本文将语义知识应用到基本的语义计算上,提出了基于知识图的词语相似度计算方法和词语关联度计算方法,并利用这些方法实现了语义规则的优选工作;提出了知识图评价值的计算方法,并利用其实现了知识图的优选工作;提出了基于知识图的短语相似度计算方法和句子相似度计算方法,在这些计算过程中,兼顾了句法结构和语义关系,利用知识图表示方法对不同的句法结构和语义关系赋予不同的权值,从而体现了短语相似度和句子相似度计算的合理性。 接着本文运用组块分析的思想,提出并实现了一个基于语义的汉语句法分析系统。该系统先识别基本预选谓语动词短语,接着反向确定扩充预选谓语动词短语的边界,然后依次识别和分析介词短语、其它类型短语、预选谓语动词短语的其余部分等等,最后参照句模规则实现了句子的分析。在分析短语的过程中,本文实现了句法分析和语义分析的结合,其中句法知识采用框架表示,语义知识采用知识图表示;汉语分析采用扩展的上下文无关文法,每一条句法产生式都对应两个前提判断函数。当句法分析器要用产生式进行规约时,首先激活语法前提判断函数,在其中调用相应的语法分析模块进行具体的语法分析;若通过语法分析,则激活语义前提判断函数,在其中调用相应的语义分析模块进行具体的语义分析。这样只有语法分析和语义分析都成功后,才可以进行规约,否则当前分析不正确,可以终止。最终,分析结果不仅产生了表示句法结构及其详细信息的框架