一个有效的Web文献检索导航工具的研究与实现

来源 :东北大学 | 被引量 : 0次 | 上传用户:xuanwuba
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Internet搜索已经成为Web上最重要的应用之一,人们经常需要到Google、Baidu等搜索引擎去查找想要的信息,对于科研人员更是如此。为了开展研究,他们需要到网上查找相关的文献信息。但是由于Web上的很多文献没有被很好的组织和描述,因此当前的文献搜索引擎很多情况下不能满足科研人员的需求。 为解决上述问题,本文构建了一个高效的Web文献检索导航工具——BestBiblio,并应用聚焦爬虫、文本挖掘等技术实现了相关功能。BestBiblio具有以下功能:(1)为获取所需文档,它自动从DBLP网站下载文献;(2)为了完整准确的描述文档,它采用一种基于挖掘最长序列频繁词组的技术提取文献的关键字;(3)为了将文献与其对应的关键字关联,并且揭示关键字之间的关系,它构建一个辅助的结构一TIGraph;(4)基于TIGraph,它提供了实用的导航来帮助用户进行检索,使得用户可以更加快速的使用模糊查询词或精确查询词得到相关文献。 与相关工作比较证明,BestBiblio可以更加准确的提取关键字。为了满足不同学术水平用户的检索需求,它为用户提供了更加灵活的检索导航,包括:“从模糊查询词得到精确查询词”,“从模糊或精确查询词得到文献”,“从文献中得到关键字”。
其他文献
面对越来越多的数据,如何利用这些海量数据,并从中提取出对企业的生产经营活动有用的信息,数据仓库技术应运而生。相对于钢铁企业生产统计来说,包括炼钢工序、热轧工序、轨梁工序
高维数据索引机制是医学图象库基于内容检索的重要课题。作者在“国家数字化医学影像设备工程技术研究中心”的资助下,从事此方面的研究工作,取得了以下进展: 对数据分布的精
图像识别在军事国防以及民用领域的作用日益显著。近些年,从遥感和航拍图像中实现目标的自动识别取得了长足的发展,但目前仍没有一种可以普遍适用的方法。这其中的困难不仅体现
传统工业控制通常以工控机为硬件平台来构建监控系统,这种模式的监控系统存在成本高、体积大、安装及后期维护复杂等缺点。随着微处理器运算、处理能力日益强大,同时随着嵌入式
信息技术的快速发展为网络教学提供了广阔的前景。网络教学作为一种新的教学方法,改变了传统教学方式,提高了教学效果及学生参与教学活动的积极性。与传统的教学模式相比,网络教
在自然语言理解领域,词义消歧(Word Sense Disambiguation-WSD)是基础研究课题,也是重点和难点之一。作者在统计的框架下,多方面地考察词义消歧问题,得到了一些较好的结论,并在此
文件同步分为三个阶段。一是更新检测阶段,检测和发现文件的变化。二是同步决策阶段,决定如何进行文件同步,获得文件同步的具体步骤。三是同步实施阶段,进行具体的数据传输,完成文
面向奥运新闻机器翻译的中文分词研究与实现随着信息时代的到来,“信息爆炸”成为信息处理领域的瓶颈问题,不同语种之间大量的信息交流更加大了问题的严重性。不同语言之间的翻
通信网络的信道是一个开放性信道,它在赋予用户通信自由的同时也给通信网络带来一些不安全性因素。伴随着VoIP的广泛使用,它在给用户带来廉价、方便、功能丰富的语音通信功能的
随着P2P计算模式的兴起和Internet端系统计算能力的迅速增强,原先被忽视的终端用户设备成为一种宝贵的资源。如何充分利用这些终端用户设备,在动态的P2P网络环境中对海量数据进