深层神经语言模型的改进及其应用

来源 :北京大学 | 被引量 : 0次 | 上传用户:heishenggg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对知识表示的学习一直是自然语言处理的研究目标。深层学习架构为我们提供了一种自动学习分布式特征表示的方法。通过对词的分布式特征表示的学习,基于深层学习架构的深层神经语言模型达到了比原有n-元语言模型更好的效果,进而被广泛的应用到了诸如语音识别、机器翻译、信息抽取、词义消歧等自然语言处理任务中。  本文首先将深层神经语言模型学到的词的分布式特征表示应用到了词义自动归纳任务中,提出了基于分布式特征表示的两种上下文特征表示方法:窗口特征表示法和全句特征表示法,通过这种基于特征表示词典的上下文表示方法,达到了比传统的上下文表示方法更好的词义自动归纳效果。  传统的深层神经语言模型架构都是基于词为单位来学习词的分布式特征表示的,但对于许多自然语言处理任务而言,特征的分布式表示也是很重要的学习内容之一,而传统的深层语言模型不能学习复杂的特征的分布式表示,为了解决特征的特征表示学习问题,本文对传统的神经网络语言模型进行了改进,提出了基于特征的深层神经语言模型架构,旨在学习复杂特征的分布式特征表示。  为了验证本文提出的基于特征的深层神经语言模型能够学习到复杂特征的有效分布式特征表示,本文将深层神经网络架构引入到了中文分词任务中,并将这个深层神经网络分词模型与传统的基于条件随机场(CRF)的分词模型进行了对比,经实验证明,在使用相同的特征集的条件下,深层神经网络分词模型能够比基于CRF的分词模型达到更好的分词效果,使用基于特征的深层神经语言模型预训练得到的分词特征的分布式表示来初始化深层神经网络分词模型的相关参数,可以大幅度的提高深层神经网络分词模型的分词效果,进而证明了本文提出的基于特征的深层神经语言模型能够学到有价值的特征的分布式特征表示。
其他文献
随着科技的不断发展,人们与网络的联系已经变得十分紧密,网络的交流和分享给人们的生活带来了极大的便利。而网络信息的迅猛增长,使得用户在查找资料时不得不从搜索引擎返回
随着数据库与信息技术的深入发展,信息系统面临着许多新的应用和需求,对时态信息处理的需求也越来越迫切,例如电子商务、数据仓库、地理信息系统。通常把具有一种时间属性的数据
无线传感器网络是物联网最重要的关键技术之一。在物联网应用的推动下,迫切的需要应用IP技术(特别是IPv6技术),将无线传感器网络接入互联网,实现传感器节点与远程终端的直接连接和
理性门限签名是将参与签名的个体看做是理性人,根据协议的不同运行情况赋予其不同的效用函数值。在秘密共享的基础上,构造不同的门限结构,将签名私钥分割为不同的子密钥影子,每个
随着教育信息化进程的飞速发展,基于智能卡的各种应用系统呈现飞跃式增长的趋势,智能卡的密钥管理成为各种系统首要考虑的问题,其中密钥的生成、分配和存储是密钥管理中最为核心
各种数字仪器和数码产品的广泛应用,使得图像成为人类活动中的重要信息载体。图像中包含着大量信息,正日益成为人们获取原始信息的重要途径。然而在图像的获取、传输和存贮过程
云计算是一种新的网络化IT服务模式,它组织大规模的计算和存储资源向用户提供便捷、经济、全面的服务,已成为学术界、产业界和政府部分关注的焦点。虚拟化技术是云计算中的关键
无线传感器网络(Wireless Sensor Networks,WSNs)因其巨大的应用前景和商业价值而受到学术界和工业界的广泛关注,在民用和军事上已经有了广泛的应用。居民区抄表(水表、电表
测试用例的有效生成是提高测试自动化程度关键的一步。近年来,人们开始尝试将智能搜索算法引入测试用例自动生成的领域中,取得了不错的成果。目前,主要的研究工作都是通过改
随着对现代微处理器高性能和高能效的需求日益提高,如何在低功耗和低硬件复杂度的约束条件下进一步提高微处理器性能,已经成为微处理器设计领域所面临的重要问题。为应对这一挑