基于神经网络的机器翻译技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：yaowoyiao

【摘要】

：

机器翻译作为替代传统高成本的人工翻译的可行方案，具有很高的应用价值。然而，传统的统计机器翻译模型因其线性不可分、全局信息丢失严重、语义无关、错误传播等问题面临严峻的

【作者】

：

陈炜

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2016年期

【关键词】

：

机器翻译神经网络双语分词语料过滤句法约束命名实体

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

机器翻译作为替代传统高成本的人工翻译的可行方案，具有很高的应用价值。然而，传统的统计机器翻译模型因其线性不可分、全局信息丢失严重、语义无关、错误传播等问题面临严峻的挑战。近几年，基于深度学习的神经网络模型在很多领域取得了显著的效果，引起了学术界的广泛关注，也为机器翻译突破现有性能瓶颈提供了新的机遇。目前，神经网络模型主要从改善现有统计机器翻译模型中的关键问题以及实现端到端翻译模型替换统计翻译框架两个方面应用于机器翻译领域。本文围绕神经网络模型在机器翻译领域中的应用进行研究，主要研究成果如下:　　提出了基于层叠对数线性模型的双语分词算法，利用层叠对数线性模型融合多层次特征，引入中文语法、双语语义、双语音译以及双语对齐等多种信息源，既保证了分词结果符合语法规范以适应神经网络的词向量计算，又最大化地缓解中英文由于语系不同而造成的词粒度混淆问题。　　首次提出了基于神经网络困惑度计算的双语句对质量评估算法。区别于传统方法在人工启发式特征设计、非局部上下文信息丢失严重以及语义无关等方面的缺陷，基于神经网络困惑度计算的句对质量评估算法不需要任何上下文无关性假设以及人工启发式特征设计，同时，神经网络模型能够很好地利用词语的语义信息，既减少了语义相似性带来的质量评估干扰，又能够很好地应对中英文之间常见的转义现象。　　提出了基于双语约束的递归神经网络模型，从而在层次短语翻译模型中引入句法和语块类别信息。相比在翻译模型中引入句法或语块信息的传统方法，该方法的特点在于不仅能够同时考虑句法和语块信息这两类知识，而且能够以一种宽松的约束方式引入这两类知识，避免了传统方法由于约束过强而导致的数据稀疏和错误传播问题。　　首次提出了基于注意力机制神经网络的双语命名实体对齐及翻译模型。相比传统命名实体对齐模型，该方法能够利用全局上下文信息，同时，避免了极大似然估计得到后验概率的方法所导致的概率低估问题，因而能够更加精确地对齐双语命名实体并进行翻译。　　搭建基于注意力机制的端到端神经网络翻译系统。利用异步随机梯度下降、层次化分解等算法优化训练效率，利用上述各项研究成果优化了中文分词、大规模双语训练语料及命名实体识别等关键问题，有效提升翻译性能。同时，在多领域的翻译任务中对该系统进行了测试、对比及分析。

其他文献

石膏纤维板生产线厚度控制相关问题研究

石膏纤维板是以石膏为主要原料,用纸纤维作增强材,经适量加水、加压、凝结干燥而制成的一种新型墙体材料,具有轻质、高效、防火、防潮、隔音、隔热等优点,近年来在国外已获得

学位

石膏纤维板PLC神经网络专家系统

自然环境下野生动物目标的检测、跟踪与种类识别技术研究

对于一个视频数据从野生动物出现到消失共需要解决三个问题:野生动物在何时出现，出现后在每一帧图像中的位置及其所属的类别。对于这三个问题本文首先利用基于显著性区域检测

学位

视频图像野生动物目标检测位置跟踪种类识别

基于眼电信号的眼动跟踪技术研究

眼球运动是人的意图、行为信息重要的来源，作为一种自然、和谐的人机交互技术，正受到人们越来越多的关注。眼电信号是一种最常用的眼球运动记录技术，具有价格便宜、使用方便等优

学位

图像处理眼电图目标识别眼电信号眼动跟踪支持向量机

PSO-FNN建模方法研究及其在德士古炉温软测量中的应用

本文以聚酯酯化率和石油干点为研究实例，基于已有模糊神经网络结构，根据泛化性能，重点研究模糊神经模型的参数优化算法，把改进的粒子群算法(PSO)应用到模糊神经网络中去，进而得到

学位

燃气锅炉模糊控制自动检测温度测量软测量神经网络

软组织三维重建及显示研究

随着CT、MRI、超声等影像技术逐渐成熟和发展，医学图像三维重建成为医学图像处理系统的主要研究领域之一。特别是软组织的重建显示在此系统中地位尤为重要，软组织的重建不同于

学位

体绘制纹理影射光线跟踪法分割加速算法医学图像图像重建

粒子群优化算法的研究及其在德士古水煤浆气化炉炉温软测量中的应用

本文系统地阐述了粒子群优化算法(ParticleSwarmOptimization，PSO)及其应用，针对基本粒子群优化算法易陷入局部极值点、搜索精度低等缺点，提出了三群协同粒子群优化算法(TSC-PSO

学位

水煤浆气化炉煤气化温度测量软测量最优先算法粒子群优化PSO

基于在线手写签名的密钥生成方法研究

在全球信息化的今天，如何保证用户身份的安全已成为一个重要课题。现今的各种大小系统中，计算机密码学得到了前所未有的重视并迅速普及和发展起来。在计算机环境中，用户的身份多

学位

用户安全生物密钥手写签名特征提取

基于认知特性的桥形标志对驾驶人影响规律研究

学位

基于粗糙集的故障诊断专家系统

本课题主要针对基于粗糙集的故障诊断专家系统进行了研究、改进与开发，并将其应用于DCS故障诊断中。首先，综合分析了当前国内外故障诊断理论和技术的研究现状。其次，根据粗糙集

学位

故障诊断专家系统粗糙集遗传算法知识获取

基于小波分析的EEG视觉伪信号修正方法研究

脑电图(EEG)为研究者提供了一种揭示人类大脑奥秘的途径。最近二十年脑认知科学得到了迅速的发展，尤其是在生物医学领域，EEG作为一种分析依据发挥着越来越重要的作用。但是，由于

学位

脑电图视觉伪信号平稳小波变换阈值去噪脑电信号生物医学

基于神经网络的机器翻译技术研究

其他学术论文