基于最大熵短语重排序模型的特征抽取算法改进

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:kkhaizi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文针对统计机器翻译中基于最大熵短语重排序模型特征抽取算法,提出一种改进算法。该算法能够抽取出更多准确的短语重排序信息,特别是逆序短语的特征信息,解决了原算法中最大熵训练时特征数据不平衡的问题,提高了翻译中短语重排序的准确率。以NIST MT 05作为汉语到英语翻译的测试集,实验结果表明改进后的系统BLEU值比原系统提高0.65%。
其他文献
双语资源是机器翻译和跨语言信息检索等领域的重要资源,但是由于语料库真实性、时效性和语种灵活性等问题,使得现有的双语资源的规模很难满足实际应用的需要。该文提出一种面
该文描述了一种构建问答式检索系统中答案排序模型的新方法。该方法结合了基于密度方法的度量特征和外部知识库,并且引入了基于语法分析方法的语法关键路径的新特征,使用支持向
【摘要】语文课程标准强调,要重视学生的阅读个性和个体体验。因此,在语文阅读教学中,教师要注重学生感受、理解、欣赏、评价能力的培养,从而在阅读中获得思维启迪,享受审美乐趣,形成其独立的阅读个性。  【关键词】个性阅读教学策略自读感悟一、处理好阅读教学中教师、学生、文本三者之间的关系  语文阅读教学的过程应是教师、学生、文本之间平等对话的过程,教师要尊重学生的阅读体验。在这一个过程中对话的中心是每一个
聚丙烯(PP)中的挥发性有机物(VOC)的释放问题已成为车用PP材料亟待解决的关键问题之一,综合利用螺杆脱挥技术是降低车用材料VOC的有效方法。分别研究了螺杆自然脱挥、螺杆真