【摘 要】
:
句子相似度计算在中文自然语言处理领域有着广泛的应用背景.要准确的刻画一个句子所表达的意思,必须深入到语义一级并结合语法结构信息,本文提出了一种基于改进编辑距离和依
【机 构】
:
大连理工大学计算机科学与工程系,大连,116024
论文部分内容阅读
句子相似度计算在中文自然语言处理领域有着广泛的应用背景.要准确的刻画一个句子所表达的意思,必须深入到语义一级并结合语法结构信息,本文提出了一种基于改进编辑距离和依存结构的句子相似度计算方法.依存算法考虑到词语之间的相互作用关系和句子内部的结构,而编辑距离由于<同义词词林>的应用可以兼顾同义词之间的替换,因此该方法与其他方法相比,描述句子的信息更加全面,实验结果表明该方法是有效的.
其他文献
本文论述了土壤微生物学者在工作中涉及到微生物及其分类,面对种类繁多的微生物和它们在分类上的变动频仍.在信息时代到来之前,要迅速了解微生物的名称及其分类的变化,常常是
生物有机类肥料具有活化土壤养分,增加植物营养元素,提高无机化肥利用率,缓释肥料中易流失成分,保肥保水,防止土壤板结,调节土壤酸碱度,减少环境污染,提高农产品品质等优点.
欧拉-欧拉模型和欧拉-拉格朗日模型已被广泛用于描述密相流化床内复杂的气固流动特征,在过去的半个世纪以来许多研究者在此领域也做了大量的工作.尽管多相流CFD模拟方法为密
物料不经过喷嘴的对撞式气流粉碎机由于其产品粉体粒度细,分布均匀,喷嘴不会磨损,对物料的污染少等优点而在工业上大量应用,粉碎机内部的对撞超声速射流流场结构对粉碎过程有
从冷模实验入手,以提高汽提器汽提效率为目标,开发了催化裂化新型结构汽提器.该技术着眼于在加大气固接触面积、提高气固接触效率的同时,在汽提器内用间隔距离较大的挡板实现
虽然蒙古文编码国际标准(ISO10646)发布几年了,但是显现字符码位不统一.各种蒙古文系统之间互相不兼容.使用不同系统输入的蒙古文文档不能共享,成了制约蒙古文信息化发展的一
支持向量机是当前经常被使用的分类模型.本文使用支持向量机处理中文分词任务,并且在支持向量机的初步结果上,根据其分词特性改计实现了个性化后处理规则.实验结果表明,支持
2008年岁末,尽管持续降息、促进房地产行业发展的若干利好政策接连出台,但北京房地产企业推出新项目的步伐依然在放缓。本月,商品住宅新获准上市量减少,别墅更是锐减;商业和
我涉足国民党会计、经济官场,计有三个时期,现分别叙述于下:(一)1931年冬,我暂停执行会计师业务,去南京国民政府担任主计处的筹备委员,主任委员为陈其采。1932年春,我被国民
概率句法分析器(PCFG Parser)是基于概率规则集的上下文无关文法的句法分析器.规则集主要是针对词类和短语类.然而事实上,词性相同而词汇不同,其所常用的句法规则也通常不同.