论文部分内容阅读
随着中外技术交流日益增多,中国专利文献越来越需通过向国外专利局申请,来保护中国发明者的合法权益。但是专利文献的人工翻译,工作量大。专利文献的汉英翻译是机器翻译的领域之一。然而,目前机器翻译的效果始终不尽如人意,尤其是在“句子长、信息量大”的专利领域。不管是基于理性主义的理论,还是经验主义的理论;不管是基于规则的方法,还是基于统计、基于实例的方法,各种理论和方法都有各自的优点和不足,没有一种方法能彻底解决机器翻译中的所有的难题。于是,各种方法相融合的“混合式机器翻译策略”越来越受人关注。 本文运用基于模板的方法对专利文献的汉英机器翻译进行研究。概念层次网络(HNC)的句类表达式和机器翻译过渡处理为本文模板的构建提供理论基础;弱化的正则文法,即剔除递归操作的正则文法,为本文模板提供了技术支撑;现有规则系统对专利文献汉英翻译的不足为本文模板的构建提供了必要性。 本文做的工作主要有:对专利语料的固定搭配构建三百多条模板;在HNC句类表达式指导下构建三百多条模板。本文模板已经融合到现有的基于规则的汉英机译系统,提高了专利文献翻译效果,前者正确率达到85%,后者达到76%。 通过对专利文献语料进行的实验表明,这些融合了传统语言学、HNC语义信息和特定领域知识的人工书写的模板综合了规则方法和实例方法的优点,具有极高的价值。