基于服务的元搜索引擎研究

来源 :南华大学 | 被引量 : 2次 | 上传用户:luchsky123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet技术的飞速发展,人们越来越多地依赖网络这个巨大的知识平台。作为用户利用网络信息的重要接口,搜索引擎的发展自Web诞生之日起就一直没有停息。同时,计算机的日益普及和人们运用电脑阅读要求的提高使得数字图书馆及相关技术得以兴起和成长。从搜索引擎获取知识已经是人们获取知识的一种常见途径。另外,也常用作各种信息系统的信息来源组件。但是搜索引擎的查全率一直不理想,元搜索引擎的出现较好的解决了这个问题。因此,元搜索引擎也成了各种信息系统的基础的信息来源组件。 在本文中,我们对作为信息源组件的元搜索引擎的特征进行了分析,完成了基于服务的元搜索引擎系统设计和原型开发,并着重对搜索引擎查询能力进行了建模研究。 在系统设计中,采用了基于服务和消息中间件的实现方式,把成员搜索引擎代理以独立的模块实现,极大地降低了耦合度,使其内部模块可随意装卸,而对外部而言,提供的是WEB SERVICE服务接口,不需要对内部结构有深入了解,直接进行调用即可。同时,我们采用了动态挂接多个领域知识库的方法以满足对多个不同领域进行检索的需求。 我们在对元搜索引擎的成员搜索引擎查询参数集的综合考察的基础上,对查询代理方法及查询转换方法作了深入研究,建立了对成员搜索引擎的查询表达能力的评价模型,并给出了评价方法。最后我们在所建模型的基础上进行了实验,确定了一个相对最佳的元搜索引擎查询参数集,在降低转换复杂度的同时,确保精度不会有太大的降低。
其他文献
随着Internet的飞速发展,人们越来越多地感受到它带来的好处,但是Internet所面临的安全状况日益复杂。目前,网络蠕虫已经成为了互联网的首要安全威胁之一,蠕虫的爆发经济损失
最近二十年来,图像和视频压缩取得了很大的进步。就压缩效率来说,最新的JPEG2000和MPEG-4 H.264/AVC大大的超过了它们的前几代标准。然而众所周知,任何判断标准都没有视觉质
最大独立集(Maximum Independent Set,MIS)问题是图论中的经典组合优化问题,是NP完备的。分布式环境(如:传感器网络)中的MIS算法的优化对分布式系统的效率和稳定性都有重要意
随着网络的迅速发展,在浩如大海的网络信息中,找到需要的信息,越来越费时费力。如何快速有效地找到有用信息成为当务之急,搜索引擎孕育而生,成为当今网络中最重要的服务之一。搜索
迁移工作流系统是近年来工作流管理研究的热点。由于迁移工作流模型的建立和完善贯穿在整个工作流系统从设计到运行结束的全过程,具有动态过程定义和复杂的框架结构,致使其至今
作为目前高性能计算的主流技术,集群系统在各种高性能计算应用领域得到了广泛的应用。而且,随着不同种类网格概念的出现,异构集群系统已经成为网格关键技术的最主要研究测试平台
Internet特有的时效性使得网络新闻正迅速进入人们的日常生活,与传统新闻相比,网络新闻具有多种优势,读者可以在网络上第一时间看到世界各地的新闻,容量大信息丰富,表现形式多样,新
提取和选择最优的特征参数来表示语音信号对任何语音系统的设计都是一项非常重要的工作,它对语音识别系统的好坏起着关键的作用。在语音识别中,特征参数的提取一般是基于信号的
在项目度量领域,软件成本估算模型COCOMO是一个非常具有影响力的模型,它具有原始COCOMO模型和COCOMOⅡ模型两个版本。其中原始COCOMO包含基本、中级和详细模型,COCOMOⅡ包含应用
软件自动化测试已经广泛应用于通用软件测试领域,并已经有了诸多成型的理论、实施规范和商用化的工具。而在嵌入式领域,由于嵌入式系统缺乏通用的软硬件平台,系统的功能和应用环