论文部分内容阅读
正在迅速发展的中文信息处理技术已经进入了句处理的前期,对自然语言进行深层分析是推动中文信息处理技术继续向前发展的一大关键。目前,对语言篇章的研究还处在探索阶段,研究方法也主要是基于统计的方法。本文另辟途径,运用基于规则的模式匹配法,选取跨文化比较的篇章,对该类型篇章的表达模式进行分析,总结出各种结构类型及规则,实现跨文化比较语篇的识别及对相关要素的提取。 主要内容有以下三个方面:首先,本文从信息处理的角度对跨文化比较篇章的计算机识别方法进行了分析。其次,本文对跨文化交际篇章进行了细致的分析。根据大量语料的分析结果,总结出若干个可以用于识别和提取的激活点词汇。最后,根据这些激活点所形成的语句,总结出了几大类数十条常用的结构类型,作为计算机提取的规则模式。 根据总结的规则,设计了一个小型的基于规则匹配模式的识别及提取系统,用于对语篇进行分析,探讨了有待继续研究的问题和下一步应做的工作。 本文的研究有两个方面的意义:一是具体分析了跨文化比较篇章表达的特点,并设计了识别和提取跨文化比较篇章及内部要素的工具;二是由此探索了从信息处理的角度研究跨文化交际篇章的基本问题和方法,后者更为重要。