论文部分内容阅读
随着Internet技术的飞速发展,人们越来越多地依赖网络这个巨大的知识平台。作为用户利用网络信息的重要接口,搜索引擎的发展自Web诞生之日起就一直没有停息。同时,计算机的日益普及和人们运用电脑阅读要求的提高使得数字图书馆及相关技术得以兴起和成长。从搜索引擎获取知识已经是人们获取知识的一种常见途径。另外,也常用作各种信息系统的信息来源组件。但是搜索引擎的查全率一直不理想,元搜索引擎的出现较好的解决了这个问题。因此,元搜索引擎也成了各种信息系统的基础的信息来源组件。 在本文中,我们对作为信息源组件的元搜索引擎的特征进行了分析,完成了基于服务的元搜索引擎系统设计和原型开发,并着重对搜索引擎查询能力进行了建模研究。 在系统设计中,采用了基于服务和消息中间件的实现方式,把成员搜索引擎代理以独立的模块实现,极大地降低了耦合度,使其内部模块可随意装卸,而对外部而言,提供的是WEB SERVICE服务接口,不需要对内部结构有深入了解,直接进行调用即可。同时,我们采用了动态挂接多个领域知识库的方法以满足对多个不同领域进行检索的需求。 我们在对元搜索引擎的成员搜索引擎查询参数集的综合考察的基础上,对查询代理方法及查询转换方法作了深入研究,建立了对成员搜索引擎的查询表达能力的评价模型,并给出了评价方法。最后我们在所建模型的基础上进行了实验,确定了一个相对最佳的元搜索引擎查询参数集,在降低转换复杂度的同时,确保精度不会有太大的降低。