【摘 要】
:
层次短语翻译模型融合了短语模型和句法模型的优点,是当前统计机器翻译的主流模型之一.然而,传统的层次短语抽取方法在抽取过程中,只考虑了对齐一致性和规则长度的限制,没有
【机 构】
:
中国科学院计算技术研究所 智能信息处理重点实验室 北京 100190 中国科学院研究生院 北京 100190
论文部分内容阅读
层次短语翻译模型融合了短语模型和句法模型的优点,是当前统计机器翻译的主流模型之一.然而,传统的层次短语抽取方法在抽取过程中,只考虑了对齐一致性和规则长度的限制,没有考虑到句子中存在的短语搭配和高频骨干词,因此抽取出了大量冗余的泛化规则。对此,本文提出了相应抽取约束策略:1)采用对数似然比来确定短语搭配,并且在抽取过程中,把短语搭配当作一个整体语言单位;2)采用频率来识别句子中的高频骨干词,在抽取过程中不对完全由高频骨干词组成的子短语进行泛化。实验证明,我们提出的方法在保证翻译质量基本不变的情况下,可以大量减少冗余泛化规则的产生。
其他文献
在小学语文教学过程中,教师应该把握自主探究性学习的基本特征,努力走出传统教学模式的束缚,有效地运用自主探究教学策略,努力构建适合小学生语文学习模式,让自主探究活动成为小学
在词一级的混淆网络的构建中,对齐方法和骨架翻译的选择一直是构建的关键。本文先对主流方法GIZA,TER,IHMM,增量TER和IHMM对齐方法进行了比较.接着加入了启发式的方法,提高对
本文参照基于短语的机器翻译系统moses,改进并实现了该系统的算法。剪枝策略将机器翻译系统的代价控制在可接受的范围内,同时,剪枝策略也是影响翻译质量的重要因素
一、浅浅一抿,可慰肝肠偶尔,夜深,辗转难寐,百无聊赖之际,会想到电视,去戏曲频道,也许碰巧还可以看上半曲《盗御马》——将酒宴摆至在聚义厅上,我与同众贤弟叙一叙衷肠。窦尔
时间和数字命名实体的识别与翻译是统计机器翻译中语料预处理任务的一个重要步骤,对后续的模型训练和系统性能有重要的影响.本文在考虑汉英两种语言中时间和数字命
中小学信息技术课程的主要任务之一就是要培养学生对信息技术的兴趣和意识。提到激发学生学习信息技术的兴趣,对于初中生,他们学习信息技术时,刚开始兴趣较浓,但随时间的推移和难
本文描述了厦门大学智能科学与技术系参加第五届全国机器翻译研讨会机器翻译评测的系统。文章分别对参加评测的各翻译系统的概况以及所使用的系统融合技术做了介绍,并详细描
人工书写的翻译模板包舍语言学知识,能够准确捕捉语言对之间的对应关系。尽管这些模板的准确度高,但它们没有概率信息,难以被应用到统计机器翻译系统中,而且匹配时
近代兵学泰斗、著名军事学家蒋百里与著名科学家钱学森是翁婿。蒋百里的三女儿蒋英嫁给了钱学森,可谓郎才女貌,天生一对。
Modern military strategists, the famous milita
俗话说吃不穷,穿不穷,算计不到就受穷。这里的算计我们可以理解成计算、规划。而计算当然就离不开数学。数学与我们日常生活息息相关,市场买菜算一下多少钱,出游前计算一下花费等都需要用到数学中的加减乘除。而对于投资理财,数学更显得重要。下面我们跟大家一起来学习投资理财中的加减乘除。 +法 数学课刚开始就是学习1+1=2这样简单的计算题,而且我们知道,只要加数为正数,那么和一定大于任一个加数。对