基于神经网络的机器翻译技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:yaowoyiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器翻译作为替代传统高成本的人工翻译的可行方案,具有很高的应用价值。然而,传统的统计机器翻译模型因其线性不可分、全局信息丢失严重、语义无关、错误传播等问题面临严峻的挑战。近几年,基于深度学习的神经网络模型在很多领域取得了显著的效果,引起了学术界的广泛关注,也为机器翻译突破现有性能瓶颈提供了新的机遇。目前,神经网络模型主要从改善现有统计机器翻译模型中的关键问题以及实现端到端翻译模型替换统计翻译框架两个方面应用于机器翻译领域。本文围绕神经网络模型在机器翻译领域中的应用进行研究,主要研究成果如下:  提出了基于层叠对数线性模型的双语分词算法,利用层叠对数线性模型融合多层次特征,引入中文语法、双语语义、双语音译以及双语对齐等多种信息源,既保证了分词结果符合语法规范以适应神经网络的词向量计算,又最大化地缓解中英文由于语系不同而造成的词粒度混淆问题。  首次提出了基于神经网络困惑度计算的双语句对质量评估算法。区别于传统方法在人工启发式特征设计、非局部上下文信息丢失严重以及语义无关等方面的缺陷,基于神经网络困惑度计算的句对质量评估算法不需要任何上下文无关性假设以及人工启发式特征设计,同时,神经网络模型能够很好地利用词语的语义信息,既减少了语义相似性带来的质量评估干扰,又能够很好地应对中英文之间常见的转义现象。  提出了基于双语约束的递归神经网络模型,从而在层次短语翻译模型中引入句法和语块类别信息。相比在翻译模型中引入句法或语块信息的传统方法,该方法的特点在于不仅能够同时考虑句法和语块信息这两类知识,而且能够以一种宽松的约束方式引入这两类知识,避免了传统方法由于约束过强而导致的数据稀疏和错误传播问题。  首次提出了基于注意力机制神经网络的双语命名实体对齐及翻译模型。相比传统命名实体对齐模型,该方法能够利用全局上下文信息,同时,避免了极大似然估计得到后验概率的方法所导致的概率低估问题,因而能够更加精确地对齐双语命名实体并进行翻译。  搭建基于注意力机制的端到端神经网络翻译系统。利用异步随机梯度下降、层次化分解等算法优化训练效率,利用上述各项研究成果优化了中文分词、大规模双语训练语料及命名实体识别等关键问题,有效提升翻译性能。同时,在多领域的翻译任务中对该系统进行了测试、对比及分析。
其他文献
石膏纤维板是以石膏为主要原料,用纸纤维作增强材,经适量加水、加压、凝结干燥而制成的一种新型墙体材料,具有轻质、高效、防火、防潮、隔音、隔热等优点,近年来在国外已获得
对于一个视频数据从野生动物出现到消失共需要解决三个问题:野生动物在何时出现,出现后在每一帧图像中的位置及其所属的类别。对于这三个问题本文首先利用基于显著性区域检测
眼球运动是人的意图、行为信息重要的来源,作为一种自然、和谐的人机交互技术,正受到人们越来越多的关注。眼电信号是一种最常用的眼球运动记录技术,具有价格便宜、使用方便等优
本文以聚酯酯化率和石油干点为研究实例,基于已有模糊神经网络结构,根据泛化性能,重点研究模糊神经模型的参数优化算法,把改进的粒子群算法(PSO)应用到模糊神经网络中去,进而得到
随着CT、MRI、超声等影像技术逐渐成熟和发展,医学图像三维重建成为医学图像处理系统的主要研究领域之一。特别是软组织的重建显示在此系统中地位尤为重要,软组织的重建不同于
本文系统地阐述了粒子群优化算法(ParticleSwarmOptimization,PSO)及其应用,针对基本粒子群优化算法易陷入局部极值点、搜索精度低等缺点,提出了三群协同粒子群优化算法(TSC-PSO
在全球信息化的今天,如何保证用户身份的安全已成为一个重要课题。现今的各种大小系统中,计算机密码学得到了前所未有的重视并迅速普及和发展起来。在计算机环境中,用户的身份多
学位
本课题主要针对基于粗糙集的故障诊断专家系统进行了研究、改进与开发,并将其应用于DCS故障诊断中。首先,综合分析了当前国内外故障诊断理论和技术的研究现状。其次,根据粗糙集
脑电图(EEG)为研究者提供了一种揭示人类大脑奥秘的途径。最近二十年脑认知科学得到了迅速的发展,尤其是在生物医学领域,EEG作为一种分析依据发挥着越来越重要的作用。但是,由于