【摘 要】
:
为了研究在线百科全书维基百科在语义相关词抽取、语义相关度计算等方面的应用,从中文维基百科下载并整理了5万余篇解释页面文档,抽取了反映语义关系的站内超级链接网络,通过
论文部分内容阅读
为了研究在线百科全书维基百科在语义相关词抽取、语义相关度计算等方面的应用,从中文维基百科下载并整理了5万余篇解释页面文档,抽取了反映语义关系的站内超级链接网络,通过挖掘文档间相互引用的链接关系抽取了近40万对语义相关词,并研究了语义相关词之间的主题聚类特性,选择两两相关的多个词得到相关词集合并计算了平均语义相关度. 相关度计算综合利用了链接在文档中的位置、频率等信息,通过对比经典算法在同一测试集上的计算结果对算法进行了分析评估,证明了维基百科语义相关词抽取方法的有效性.
其他文献
目的 探讨护理干预对风湿性心脏病患者焦虑心理的影响.方法 将80例风湿性心脏病患者随机分为干预组和对照组,各40例,对照组采用常规护理,干预组在此基础上给予专项护理干预,
目的:调查乳腺癌患者家属生活质量及其影响因素。方法采用问卷调查方法对86名乳腺癌患者家属进行横断面调查,了解患者家属的一般资料,并采用癌症患者照顾者生活质量调查表(CQOL)评
目的:探讨造口志愿者在结肠灌洗临床推广中的应用效果。方法造口志愿者协助造口治疗师,通过在造口联谊会上现身讲解、造口门诊宣教等方式宣传结肠造口灌洗知识,与造口治疗师一起
《史记》作为西汉时期一部重要典籍,反映了这一时期语言发展的真实面貌,是我们研究汉语史的重要资料。本文以《史记》为研究对象,对其连接副词的使用情况进行考察和分析,试图
根据投入产出表中对增加值系数的描述,提出了四种增加值弹性指标来判定关键部门,弹性指标考虑部门规模,更具有可比性,且用最终使用变动影响的GDP及劳动者报酬、税收、营业盈
N-Arylation of a wide variety of amines with phenylboronic acid catalyzed by copper acetate under 20%aqueous solution of n-Bu_4NOH was accomplished in good to e
Nowadays,more and more users share real-time news and information in micro-blogging communities such as Twitter,Tumblr or Plurk.In these sites,information is sh
A rapid and practical method for direct detection of lisinopril in anion exchange chromatography (AEC) has been developed with integrated pulsed amperometric de
其它基于文本关联网络的自动文摘方法.本文方法计算出的词语权重,可以进一步应用到关键词抽取、文本分类和聚类及信息检索中.
不同于传统互联网,作为涵盖了数据感知、处理和传输的复杂任务型网络,无线传感器网络面向应用的特点给服务质量(QoS)研究带来了许多新的挑战,需要针对QoS体系结构以及QoS指标