面向信息处理的藏语名词同义词知识库构建研究

来源 :西北民族大学 | 被引量 : 0次 | 上传用户:leloch
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
藏文自然语言处理始终都无法离开现实语言的支撑,让计算机懂得并理解藏语也离不开不同颗粒度层面上构建的知识库、规则库和藏语语义信息库等的支持。因此,我们从建立不同层级语言单位都适用的藏语信息库的理念出发,借鉴目前汉语信息处理研究的权威理论及其成果,从层级语言单位最底层的词和为数不多的最基本的短语开始,描述现代藏文词语的字符信息、音节数量、词性分类和标注、构词结构、单合、搭配信息和语义表示等信息来建立《藏语名词同义词知识库》。要使计算机理解自然语言,“必须要从语义学的角度要解决三个平面上的问题,其中第一个要解决的就是词汇意义”。词汇意义是驾驭整个语义系统的基础,因此研制一部面向信息处理的现代藏语语义词典不仅是一项具有奠基性的知识工程,而且也是一项相当重要的基础理论类研究。本文于第一章中引入绪论,主要探讨了同义词的国内外研究现状同时概述藏文信息处理的发展历程。分别于第二章与第三章中讨论了实词、名词以及名词同义词的含义界定、分类等问题。第四章为本文的重点,主要对知识库中字段设立的相关问题进行研究,分别对名词的分类与兼类问题、藏语名词同义词的词汇来源、构词方法统计、词长与字符数统计、词频与搭配统计、同义词的语义知识研究、义项的排列权重以及同义词词表的测试语料等共8项专题进行说明。知识库构建的主要落脚点理应在于其应用上,本文在第五章中对面向藏文搜索引擎的名词同义词知识库构建进行应用研究。文章最后一章节为结尾部分,主要讨论研究工作中的难点与对未来工作的展望。
其他文献
提出了区间直觉偏好信息的有序加权集成算子和混合集成算子;定义了区间直觉判断矩阵及其得分矩阵和精确矩阵等新概念,详细研究了它们的性质;探讨了区间直觉判断矩阵、直觉判
从文化学视角,运用人类学、民族学、社会学原理及相关理论,对中华民族传统体育的发展历程和传承现状进行剖析,分析了中华民族传统体育在文化变迁的时代背景下其传承特点、趋
期刊
功能对等是美国翻译理论学家尤金·奈达最重要的翻译理论之一,该理论形成于20世纪60年代并于20世纪80年代引入中国。功能对等翻译理论与以往的翻译理论不同之处在于其不再单
为确保大坝安全运行,需对其进行稳定性监测。详细介绍了利用GPS测量技术进行基准网复测、监测网测量,并整理分析了一、二期监测结果,显示大坝未完全进入稳定期,需继续进行变
基于城市间列车最短时间距离数据,使用最短时间距离模型、可达性系数和经济潜力等度量交通网络通达性的指标,分析了高速铁路建设对可达性的影响。结果显示,高速铁路快速崛起,
在冬季,为保证在出现极端天气条件下日光温室能够正常生产,一般都采取了人工加温的方式。目前常用的加温方式有热水加温系统、热风炉加温系统、电加热系统、电热泵等,采用的主要
背景帕金森病(Parkinson disease,PD)是一种常见的中枢神经系统变性疾病,临床上往往不仅存在运动障碍症状,还会伴有认知功能损害,其中执行功能和社会功能作为一切认知心理过
本文以初级阶段的外国留学生为研究对象,通过问卷调查,研究他们汉语学习过程中的焦虑情况、歧义容忍度情况,以及这两个变量与他们的听力成绩之间的关系,探究歧义容忍度是否通
目的:建立大承气颗粒剂中辛弗林含量的高效液相色谱(HPLC)测定方法.方法:采用E.Merck LiChrospher 100RP-18柱,流动相为甲醇-水(含0.18%磷酸,0.22%十二烷基硫酸钠)(55∶45),