基于最大熵短语重排序模型的特征抽取算法改进

来源 :中文信息学报 | 被引量 : 0次 | 上传用户：kkhaizi

【摘要】

：

该文针对统计机器翻译中基于最大熵短语重排序模型特征抽取算法,提出一种改进算法。该算法能够抽取出更多准确的短语重排序信息,特别是逆序短语的特征信息,解决了原算法中最

【作者】

：

孙萌姚建民吕雅娟姜文斌刘群

【机构】

：

中国科学院计算技术研究所智能信息处理重点实验室,苏州大学计算机科学与技术学院

【出处】

：

中文信息学报

【发表日期】

：

2011年2期

【关键词】

：

最大熵特征抽取统计机器翻译重排序模型 maximum entropy feature extraction statistic machine tra

【基金项目】

：

国家自然科学基金资助项目（60873167 60736014）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

该文针对统计机器翻译中基于最大熵短语重排序模型特征抽取算法,提出一种改进算法。该算法能够抽取出更多准确的短语重排序信息,特别是逆序短语的特征信息,解决了原算法中最大熵训练时特征数据不平衡的问题,提高了翻译中短语重排序的准确率。以NIST MT 05作为汉语到英语翻译的测试集,实验结果表明改进后的系统BLEU值比原系统提高0.65%。

其他文献

面向单一双语网页的双语资源挖掘方法

双语资源是机器翻译和跨语言信息检索等领域的重要资源,但是由于语料库真实性、时效性和语种灵活性等问题,使得现有的双语资源的规模很难满足实际应用的需要。该文提出一种面

期刊

WEB挖掘网页分类双语资源频繁序列模式支持向量机Web mining Web pages classification bilingual res

基于语法分析和统计方法的答案排序模型

该文描述了一种构建问答式检索系统中答案排序模型的新方法。该方法结合了基于密度方法的度量特征和外部知识库，并且引入了基于语法分析方法的语法关键路径的新特征，使用支持向

期刊

计算机应用中文信息处理自动问题回答语法关键路径答案排序支持向量机computer application Chinese information

个性化阅读教学策略探究

【摘要】语文课程标准强调，要重视学生的阅读个性和个体体验。因此，在语文阅读教学中，教师要注重学生感受、理解、欣赏、评价能力的培养，从而在阅读中获得思维启迪，享受审美乐趣，形成其独立的阅读个性。　　【关键词】个性阅读教学策略自读感悟一、处理好阅读教学中教师、学生、文本三者之间的关系　　语文阅读教学的过程应是教师、学生、文本之间平等对话的过程，教师要尊重学生的阅读体验。在这一个过程中对话的中心是每一个

期刊

个性阅读教学策略自读感悟

车用聚丙烯材料螺杆脱挥技术的研究

聚丙烯(PP)中的挥发性有机物(VOC)的释放问题已成为车用PP材料亟待解决的关键问题之一,综合利用螺杆脱挥技术是降低车用材料VOC的有效方法。分别研究了螺杆自然脱挥、螺杆真

期刊

聚丙烯挥发性有机物螺杆脱挥汽提剂真空度

基于最大熵短语重排序模型的特征抽取算法改进

其他学术论文