维吾尔语名词词汇语义网构建研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:zxw364963027
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
维吾尔语名词词汇语义网是以名词词汇所构成的同义词概念集合为描述对象,以名词词汇间的潜在语义关联为连接方式,通过其中的组织与联系,以词义与语义关系为经纬建立的一种词汇语义知识库。目前,面向自然语言处理的维吾尔语语义理论研究和相关的知识库的构建是维吾尔文在计算机上得到更广泛的应用的基础,并且维吾尔文在计算机的信息处理研究仅限于词法、浅层句法分析等语法层面的问题描述、分析以及处理的研究,而缺乏对语义的表示。为使计算机具有更好的理解和处理维吾尔文的能力,还远不能满足我们在维吾尔文信息处理中所需要的知识,故必须使计算机具有词法、句法、语义等丰富的语言知识。  本文主要从严格按照信息处理用现代维吾尔语名词语义标注标记规范的词汇语义语料库建设、名词词汇语义自动标注、名词词汇语义关系库构建、名词词汇语义网构建等四个方面开展深入的研究。根据WordNet和中文词汇语义网研究的理论与方法,以及其中的各种语义关系,结合维吾尔文信息处理的现状及语言自身的特点,并充分利用其它相关的词汇语义资源,研究和实现了维吾尔语名词词汇语义网。其旨在以自动与人工交互相结合的方式构造名词词汇语义网,能够将其应用于维吾尔语词汇语义分析、机器翻译、信息检索等应用系统,为计算机理解维吾尔文提供基础性的语义信息。本文具体研究内容包括以下几个方面:  (1)探讨与分析解决维吾尔语词汇语义知识资源缺乏的瓶颈问题,以现代维吾尔语名词词汇作为数据对象,提出用于构建维吾尔语名词词汇语义网的语义基础资源方案。在此基础上,首先,构建基于语义功能的名词性词缀语料库和基于语义信息的维吾尔语名词词汇资源库。其次,旨在从大量生文本中获取维吾尔语名词词汇资源,以名词语义标注提供原始词汇资源为目标,提出预先定义的规则和统计方法相结合的维吾尔语名词识别模型,并将其进一步集成到维吾尔语名词词汇语义标注系统。最终,将维吾尔语名词词汇语义基础资源知识库和名词自动识别模型作为数据和技术支撑,根据维吾尔语名词语义分类新体系,对维吾尔语名词词汇进行语义标注,设计和实现维吾尔语名词语义标注系统,为后续的语义关系库构造任务给出带有语义标记的名词词汇资源。  (2)重点研究维吾尔语名词词汇语义关系库构建方法。以维吾尔语在信息处理中用词类标注标记规范框架为基础,提出维吾尔语名词语义层次概念结构。通过使其与WordNet的名词独立起始概念结构进行映射,设计并实现维吾尔语名词语义层次概念树结构,将树结构的节点和带语义标记的词汇进行合并而构造维吾尔语名词词汇间的语义关系,包括同义词关系、反义词关系、上下位关系、部分整体关系等。  为了进一步扩大语义关系库,在现有的名词词汇语义关系的基础上,提出了一种基于词向量的同义词和语义相关词自动挖掘方法。其中针对词向量训练中所需要的语料资源匮乏问题,进行维吾尔语网页识别及资源获取研究,基于改进的N-Gram和常用词方法建立了词向量中维吾尔文语料自动获取模型。基于词向量模型的词语相似度计算和同义词扩展的实验结果表明,该方法能够有效地自动获取语义相关联的名词。  (3)在词汇语义网中,针对名词语义关系以可视化的方式提供查询应用的需求,开展了构建维吾尔语名词语义网的研究。以名词语义关系型数据库中所囊括的语义关系作为数据对象,采用基于图的可视化技术将其转换成图数据,设计和实现维吾尔语名词词汇语义网查询系统,通过应用实例对语义查询结果进行了分析。该系统可以将语义关系的层次结构形象地在二维平面上表示出来,以此建立高度互联的名词语义网络。
其他文献
传统的计算机图形学在生成真实感图像上遇到了很大的障碍,这里主要有两个方面的原因,首先是因为物体的表面模型很难准确获取,其次是由于绘制过程计算比较复杂.基于图像的建模
以深度神经网络为代表的新一代人工智能技术,已经为图像处理和语音识别等领域带来了颠覆性的变革。作为人工智能领域最为火热的研究方向之一,机器翻译迎来了前所未有的发展契机
本论文针对UTStarcom的电信网管系统(NMS)和用户管理系统(SAM)在系统升级和扩容中遇到的一些接口问题,进行了分析和探讨,最终采用了CORBA这种面向对象的分布技术作为网管系统(N
随着互联网的普及,越来越多的人加入社交网络展示自己的生活。社交网络的即时性使得信息和谣言可以在网络上很快传播,在线社交网络的病毒式营销成为广告的新趋势。由此启发,许多
利用中间件技术,可以实现应用程序的跨平台使用。这种技术缩短了应用软件在各个平台间移植的周期,节省了人力,财力,一个代表性的例子是Sun公司的中间件产品JAVA虚拟机(JVM)。科泰
随着计算机技术、网络技术、数据通讯技术、自动化技术的发展,工业自动化正朝着企业综合自动化的方向发展.而企业综合自动化的核心问题是需要通过信息流的集成,实现企业决策
CRM和数据挖掘是目前计算机技术领域两个非常热门的话题。CRM是企业信息化的重要内容,它在电子商务中所起到的日益重要的作用,使其受到企业越来越多的重视。数据挖掘是知识发现
学位
学位
本文针对电信储值卡支付业务中对数据安全性要求高,数据处理的实时性要求高的问题,进行了分析,最后采用了交易中间件技术作为解决这一问题的方案。 随着计算机软硬件技术迅速
随着计算机技术的发展,企业在信息化的过程中,难以保持一个统一的技术平台,因此,企业信息资源常常由不同的操作系统、不同的编程语言、不同的技术模型、不同的数据库系统组成。将