基于依存关系语言模型的应用研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:seraphim
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
准确地将文字输入计算机是自然语言处理的重要研究课题,对于优化人机交互、信息获取、文本纠错等自然语言处理领域的问题有着重要的意义。本文立足现代汉语的输入问题,讨论和研究了相关的语言模型和结构语法模型,设计实现了基于依存关系的中文语言模型。在单纯的N元文法模型基础上,考虑到语义及句法分析对于中文输入的重要性,本文提出了以下几方面的见解和方法:第一,调整了依存结构语法树的形式,提出了可见词的概念。传统的依存结构语法树只表示了句子中词与词之间的依存关系,忽略了词在句子中出现的顺序,通过规定左子结点和右子结点,定义出可见词,从而实现在输入过程利用结构化信息。第二,规定依存关系的方向,提出了依存概率及计算方法。依存概率的计算充分考虑了依存关系的方向以及句子中词的可见性,可以更为准确地描述出两个词之间发生依存关系的条件和概率,并为输入过程提供参考。第三,提出了相似词及依存概率的平滑办法。通过统计两个词共有的依存关系来估计出词与词之间的相似度,据此平滑模型中的零概率依存关系,减轻数据稀疏性带来的问题。最后,提出应用依存概率模型的归约算法,并将模型与传统的N元模型结合起来应用于拼音输入法的解码过程,将整句和单字的正确率分别提高了15.72%和2.8%,证明本模型有助于提高了中文输入的正确率。
其他文献
水下无人平台在国家海洋技术发展规划中,尤其是军事国防领域占有举足轻重的地位。自主被动探测系统是水下无人平台完成使命和任务的重要保障,因此研究基于水下无人平台的自主
本刊讯9月26日,河南省国土资源厅举办离退休干部“九九重阳”书法绘画摄影展。这次由厅机关党委、老干部处主办的展览共收录作品302幅,经专家认真评选,分别评出书法、绘画、
3GPP长期演进(LTE)系统中,相邻小区可以使用相同的无线资源,带来了严重的小区间干扰。为了有效抑制小区间干扰,3GPP提出在LTE-Advanced系统中引入协作多点传输/接收(CoMP)技
随着因特网的蓬勃发展,网络信息呈现出爆炸式增长,互联网成为一个巨大的信息宝库,如何准确快速地处理网络信息成为目前的研究热点之一。网络信息处理的基础首先是信息采集,即
背景和目的幽门螺杆菌(Helicobacter pylori,Hp)是微需氧的革兰阴性杆菌,呈螺旋状。多数国家和地区Hp感染率高达50%以上,许多感染者都是无症状的,但是有部分感染者可出现急慢性胃炎和消化性溃疡,Hp的持续性感染还与胃腺癌和胃淋巴瘤的发生密切相关。Hp已被世界卫生组织列为Ⅰ类致癌因子。近年流行病学资料还发现,幽门螺杆菌感染还与冠心病、动脉硬化、血小板减少性紫癜、糖尿病、缺铁性贫血、
老编:秋风飒飒,迎来了新的学年.在这里,老编真诚地祝贺大家进入了更高一级的学习阶段,迎接更大的挑战.当然了,成长是需要代价的,那就是要付出很多精力去学习,毕竟你们的任务
摘要:本文主要从家庭小实验对于学生的意义作为出发点,研究和分析家庭小实验开展的策略,从而提升学生的科学素养,促进学生全面发展。  关键词:初中科学教学;家庭小实验;实践;评价  中图分类号:G632.0 文献标识码:A 文章编号:1992-7711(2017)11-0085  随着素质教育的不断推进,重视学生实践创新能力的提升已经是教育教学的共识。家庭小实验作为科学实验教学中的重要一部分,其研究内
多聚焦图像融合是指将聚焦位置不同的几幅源图像通过一定的算法融合成为一幅每一位置都聚焦的新图像。近年来,提出了很多图像融合算法,除了传统的调制、最大值、最小值和加权
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊