基于规则和统计相结合的汉语分析系统

来源 :南京大学 | 被引量 : 0次 | 上传用户:jacky899
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
九十年代以前,机器翻译的方法可以分为:直译型、转换型和基于中间语言型。进入九十年代以来,机器翻译领域出现了许多新的翻译方法和翻译模型,其中,主要有基于统计的机译系统和基于实例的机译系统,而这两种机器翻译都需要大规模的语料库支撑。另外由于汉语的复杂性,汉语分析是汉外机器翻译的一大难点。研究一种适合计算机处理的汉语分析方法有助于今后“汉到外”的机器翻译研究。本文在前人工作的基础上,结合汉语的特点,提出一种基于规则和统计相结合的汉语分析方法。论文的主要工作包括:  一、在进行分析时,既使用语法总结出来的规则,又利用语料统计的结果,同时兼顾了实例分析方法的优点。  二、对于汉语分词,采用了基于Maximum Matching(MM)的双向最大匹配法,并辅以基于统计信息的歧义字段切分处理。重点讨论了交集型歧义切分字段与多义组合型歧义切分字段的消歧处理。  三、对于汉语短语的识别与标注采用了规则和统计相结合的方法。  四、根据汉语的副词、助词、时间短语、上下文信息,总结出汉语的体态信息和时间信息,给出了汉语时间抽取和体态分析算法。  五、将规则的基本形式定义为条件动作对,采用多行描述,使得规则易于扩充,易于机器解释执行。同时,对整个规则库按上下文无关文法部分划分为规则块,即将上下文无关文法部分相同的规则放在一个规则块中,然后在规则块内根据规则优先级由高到底进行排序。  六、采用了以词汇语义为基础,把词典设计成词汇信息参数+与该词有关的个性规则的形式。
其他文献
无线路由器是基于国家十五预研项目—车际车内传输系统提出来的,目的是研制在自组、多跳的MPRN网络中与独立节点相适用的无线路由器,从而适用于拓扑结构变化快,信息传递要求
流媒体作为因特网不可或缺的媒体之一,已广泛应用于互联网多媒体新闻发布、在线直播、网络广告、电子商务、视频点播、远程教育、远程医疗、网络电台、实时视频会议等互联网的
该文在第一章中,首先介绍了物流配送领域中涉及到的基本概念和基本常识;然后着重介绍了计算理论、可计算性的问题;最后,结合了这两方面,列举了计算机技术结合其它科学技术在
该论文首先对现有的入侵检测技术、模型进行了系统分析研究;继而综合应用数据挖掘、人工智能、知识表述与获取以及分布式系统理论和技术.主要包括:对现有入侵检测领域的各种
双网隔离交换系统的提出,来源于某些国家敏感部门保护内部机密信息的迫切需求.一方面,这些部门需要充分利用丰富的网络资源接收或获取信息,而另一方面,又要保证内部秘密信息
本文简单介绍了数字水印技术的产生和发展,以及现有的软件产品和国内外研究现状。讨论了三类水印系统的基本框架、主要问题、关键技术及经典算法。在此基础上,作者进行了必要的
以九五、十五预研项目——车内数据传输技术为背景,该文研究了在VxWorks实时操作系统下MIL-STD-1553B数据总线的监视与实现. 在研究过程中首先研究了MIL-STD-1553B数据总线的
地域分析技术是作战指挥辅助决策的关键技术之一.该文详细介绍了基于多维战场环境条件下的地域分析智能空间决策支持系统的设计方法、系统结构、主要算法和实现.系统以军事地
随着卫星通信技术的发展,作为卫星通信链路重要的地球站设备也越来越复杂.因此实现地球站尤其是测控站设备的计算机监控就显得致为重要.该文以北京国际海事卫星测控站三期工
该文首先介绍了分布式数据库课题的开发背景、技术发展现状和展望,并介绍了一些关键技术.然后提出了某军事作战指挥系统分布式数据库系统的体系结构设计,深入研究了基于C/S模