基于桌面的特定领域meta-search系统的研究

来源 :河海大学 | 被引量 : 2次 | 上传用户:baobaolan1007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
搜索引擎已成为网上使用率最高的工具之一。它的主要衡量指标有两个:覆盖率和精度。然而,调查显示,单独一个搜索引擎对网上信息的覆盖率最高不超过40%。除此之外,搜索引擎还存在检索精度较低、信息质量差异大、检索方式不一、对用户个性化服务欠缺等诸多问题。Meta-search系统(又称元搜索引擎)的出现部分弥补了单个搜索引擎的不足。它是通过调用其它搜索引擎来实现搜索的一种工具,是搜索引擎发展到一定程度的产物。Meta-search系统一方面通过调用多个搜索引擎来提高信息的覆盖面,另一方面通过一定的措施来过滤查询结果,将用户真正关心的信息呈现出来。本论文对检索覆盖率和精度两方面进行考虑,并分别做了论述。其中主要工作包括: (1)系统回顾了网上信息检索的演进历程,简要分析了搜索引擎的原理、技术及所存在的问题。提出一个DDSMS(Desktop Domain Specific Meta-Search,基于桌面的特定领域meta-search)系统的基本框架结构供讨论。 (2)分析了当前网上个性化信息服务发展状况及基本实现方式,针对元搜索引擎搜索结果缺乏个性化的问题提出了一种简单、可行的改进方法。该方法通过对用户检索全过程进行监视,提取用户信息作为个性化服务的依据。 (3)分析了元搜索引擎对查询代理返回的结果进行处理的基本状况及方法,提出了采用结果聚类与其它处理方式相结合的方法;并在对几种有代表性的文档聚类算法进行比较后论述了STC算法在处理元搜索引擎搜索结果在线聚类问题时的优势。
其他文献
该系统以《数据结构》为背景领域,研究了网络环境下ICAI中学生认知模型的构建与实现.包括对课程知识的认知分类、题库的认知改造以及适合学生推理模型的框架知识表示法和领域
学位
该文首先阐述了课题的背景及电子政务的发展状况,对电子政和斩发展情况做了比较全面的综述.该文着重研究了基于数据字典技术的电子政务系统的体系结构,通过对电子政务体系结
该文首先论述了相关技术背景,对XML技术做了一个简要综述,讨论了C/S结构以及三层应用系统的特点及优缺点.然后该文结合作者的开发经验,跟踪研究了最新流行技术以及存在的相关
聚类分析与离群点检测是数据挖掘中的关键问题,该文针对大规模交易数据库,研究聚类与离群点检测算法.主要研究工作包括:1)提出了一个高效的符号属性聚类算法:Squeezer算法.该
密码学作为信息安全的关键技术,是目前研究领域的一个热点,也是计算机网络安全的基础.该文重点介绍了安全协议的一些特征,并针对基于对称密钥密码技术和公开密钥密码技术,介
该文对如何捕捉多个同步的视频流、如何进行全景视频图像的拼接,以及如何在3D场景中应用柱面全景视频等3个问题进行了深入、细致的讨论.对于第1个问题,我们讨论了一种在局域
学位
该文以知网系统作为语义分类的体系,首先尝试了基于隐马尔可夫模型的消歧方法,但由于在一阶隐马尔可夫模型中可以考察到的上下文相对较小,然而有些时候距离歧义词较远的词语
学位