【摘 要】
:
在维吾尔语信息处理中句子的相似度计算是一项基础性较强的工作,相似度计算已成为自然语言处理领域的研究重点问题。例如:基于实例的机器翻译系统、自动文摘系统、信息检索系
论文部分内容阅读
在维吾尔语信息处理中句子的相似度计算是一项基础性较强的工作,相似度计算已成为自然语言处理领域的研究重点问题。例如:基于实例的机器翻译系统、自动文摘系统、信息检索系统以及问答系统等。到目前为止维吾尔语句子相似度还没有形成一定的规模。本文在研究维吾尔语句子相似度的过程中,主要针对小学维吾尔语文教材中的简单句,根据由词语和短语构成句子的特点,依次对词语、句子等层次进行了相似度计算研究,其中重点分析了句子相似度计算。在此基础之上,本文提出了词语相似度计算、N-gram句子相似度计算、基于句子结构分析的句子相似度计算及改进的句子相似度计算等多元化的句子相似度计算方法,并通过实验分析,证明了该方法的有效性。本文完成的主要工作包括如下几个方面:1)研究了维吾尔语词语相似度及计算方法。词语相似度计算是句子相似度计算的基础,所以,本文对词语相似度计算做了详细研究。针对当前的词语相似度计算方法进行了阐述,并进行了改进,为下文句子相似度的计算做铺垫。2)在上述工作的前提下,本文对句子相似度计算进行了研究,并且对其进行了改进,提出了基于N-gram的句子相似度计算、基于句子结构的相似度计算及改进的句子相似度计算等三种方法,力求最终的句子相似度计算结果更为准确。3)设计并实现了小学维吾尔语文教材中简单句的相似度计算系统,并用该系统验证了本文提出的句子相似度计算方法的可行性及有效性。
其他文献
医院住院楼工程与一般的建筑工程有着区别,不仅在质量方面的要求较高,而且在保温节能方面的要求也高。所以在现代医院住院楼工程工程中,为了更好地促进工程质量的提升,施工企业必
辽金时期是我国历史上第二次民族大融合的准备时期,这一时期,契丹、女真、鲜卑等少数民族与汉族共同生活在中华大地上,相互交流融合。各民族之间的交流融合,使这一时期的文学异彩
空调制冷系统是办公建筑中的组成部分,在建筑节能方面,空调制冷体系的节能能为建筑节能提供很大的优势。在空调制冷系统在运行中一般会出现效果不能满足所有用户的需求,效率使用
PPG工业公司2014年中国奖学金项目的颁奖活动在国内十所高校圆满落幕.这也是该项目自2003年正式启动以来,PPG连续第十一年走进校园.今年的奖学金总额达到了三十三万人民币.rn
沈阳山盟医院皮肤科主任:多数传统口服药、外抹药含激素,越治越重还易伤肝肾。本院传承中医世家第四代传人王广信老先生百年秘方,独创“绿色药浴净肤疗法”,患者治疗时只需将患病部位浸泡于纯中药成分的药液中,让皮肤自己吃药,清除血液和皮肤中的各种皮肤顽癣病毒,治愈皮肤顽疾。主治:牛皮癣、湿疹、皮炎等顽固皮肤病。20余年间在辽沈地区治愈的数万名患者为您验证:一般7天减轻痒疼等症状;20天癣面变薄变淡;30天还
本文共分五部分,以定中式复合新名词为研究材料,讨论有关现代汉语定中式复合词的构词模式与构造过程的问题。论文采用了由认知到语法、再到认知的解释方式,并运用了定量分析
中国广告自1979年恢复以来,经历了恢复、探索、高速发展、平稳增长的阶段。在各个阶段都有关注的热点、焦点问题,对这些问题的关注,有着各种各样的原因,并且,这些焦点问题在广告的
硝酸盐转运蛋白(NRT)是植物吸收和利用硝态氮的一种关键蛋白。运用RACE技术从茶树中扩增出NRT基因的cDNA,并利用实时荧光定量PCR检测了CsNRT基因在不同茶树器官与品种之间的
近些年来,随着我国经济的不断提升,人民生活水平的不断提高,我国的城市化进程也进一步的加深了。城市化使高层建筑走入了我们的生活。然而,越来越多的高楼大厦导致能源消耗的急剧
在当代市民文学创作领域,陆文夫、范小青、朱文颖为代表的老中青三代作家坚守着苏州文学的重要阵地。在80年代时事风云变幻之际,范小青凭借其独特视野、个体体验和对苏州市民生