Web大规模信息查询与服务聚合关键技术研究

来源 :中国人民大学 | 被引量 : 0次 | 上传用户:jiangcongzhi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络的对等技术(Peer-to-Peer)和网格(Grid)研究的深入,有力地推动Intenet上信息服务的发展。信息服务包括:分布式部署、信息的发现、存储服务、查询服务、服务组合、内容发布与订阅。计算机用户通过搜索引擎Google、百度,可以从网上获取他们需要的信息。应用的需求为信息技术的发展带来了机遇。但是,随着Web服务提供者和使用者数量的增多,Web服务在网上分布之广,服务项目之繁杂,服务质量参差不齐,服务可信度难以确定;要合理使用大量分散在不同节点(peer)上的服务协同工作,提高服务的可测量性、可用性、可靠性和QoS服务质量保证。这给大规模信息查询与动态聚合服务提出了挑战。鉴于理论与应用的迫切需求,使人们将研究的关键技术聚焦在:Web服务的资源发现与定位(Discovering)、面向服务的结构化信息查询(Querying)、服务的动态聚合(Providing Services),尤其是相关的原理、方法与改进算法。本文的主要贡献如下:  1.采用基于概率学习的信息资源搜索定位,提高信息资源发现的成功率。  资源定位机制是Peer-to-Peer系统的关键技术,它的主要功能是查询并返回请求资源的定位信息。本文提出了一种基于概率学习的路由搜索技术,应用机器学习的方法提高资源定位机制的效率。学习算法是用历史查询和结果反馈信息预测成功peer信息源发现的概率,随着查询返回结果数目和用户反馈信息的增加,学习器的训练和学习效率不断提高。提出改进的概率学习搜索(Advanced-Adaptive Probabilist ic Search简称Advanced-APS)算法,和对节点索引表的构建及维护算法,研究了基于索引表中索引信息的路由选择算法。实验表明采用基于概率学习的信息资源搜索定位,提高信息资源发现的成功率。  2.基于关键字的面向服务的“图模式”查询提高了信息查询的效率。  对网格环境下Hidden Web数据库的研究与开发逐渐成为人们关注的焦点问题。要回答用户的查询,数据集成系统需要解决网格上的需求语义分析和关键字查询、建立数据查询模型。将数据库抽象为无向图,节点对应数据库中的元组,边对应“主-外码”的关系。查询的结果是与元组连接的答案树,它与查询的关键字相匹配。论文中,提出了一个新的查询算法,将改进的动态规划算法用于查询模型,保证Top-1答案树最优,Top-K答案树近似最优。最后试验测试和评估了算法性能。  3.选择答案树RANKING评分模型的Top-K查询结果提高查询的有效性。  本文提出答案树评分模型,采用一种基于邻近程度的答案树评分函数,分值越低表示邻近程度越高,即,结果越优。答案树的分值由树中的“节点”分值和“边”分值两部分组成。不同类型的边和节点所反映的紧密程度不同,同时考虑用户兴趣偏好,设定不同类型的边和节点的基本分值。当用户提交查询时,利用启发式算法选择最有希望Top-k结果,提高系统的查询效率。实验验证选择答案树RANKING评分模型的Top-K查询结果提高查询的有效性。  4.优化QoS服务质量保障的动态聚合服务的选择算法为用户提供复杂的增值服务提供了新方法。  服务组合可以聚合独立的、可重用的服务组件,提供更丰富的应用服务。为了支持快速的、动态的服务组合框架的形成,服务的提供者必须考虑服务质量(QoS)、需求定位、服务选择和动态变化,为用户提供满意的服务功能。在论文中,提出了基于网格的动态服务组合模型与算法。首先,检查需求语义形成服务的功能候选图;然后,应用服务选择算法形成优化组合模型;最终形成理想的服务组合,并用实验进行模拟验证。
其他文献
计算机已经进入多核时代,从Intel,AMD,Sparc到PowerPC,CPU的设计者们不再追求单核的高频率而是向多核发展,现在的双核乃至四核CPU已经成为了主流。多核的出现将迫使改变原有的程序
概念格理论作为一种知识表示和数据分析的形式化工具,在理论研究和实际应用中都具有重要的意义,形式概念分析已经在众多的领域获得了成功的应用。但是在基于关系数据库的信息管
随着越来越多的数据开始采用XML进行描述、存储、交换和展现,面向XML文档的信息检索能力变得日益重要。由于XML文档的半结构化特征,对于XML文档的信息检索技术不仅要满足内容需
报表是展现数据的一种工具,是企业应用系统的重要组成部分,在企业应用系统的开发过程中,往往由于市场环境的多变导致报表应用需求的多变,对报表的开发、维护成本一直很高,给企业应
J2EE(Java2 Platform Enterprise Edition)是一个基于Java2平台独立的、可移植的、多用户的、安全的企业级平台标准,它克服了传统Client/Server模式的弊病,迎合了Browser/Serve
随着感知和通信技术的发展,无线传感器网络在军事和民用特别是环境监测领域已经得到了广泛的应用。轮廓查询在涉及多目标决策的无线传感器网络应用中起着非常重要的作用。尽管
多核处理器已经成为处理器体系结构的主流发展方向。多核处理器中,高速缓存(Cache)结构通过将共享存储空间中的数据缓存在本地,加速了数据获取的过程,同时也带来了多核间数据一
查找效率问题是构建P2P网络的一个根本性问题,利用分布式哈希表,结构化的对等(Peer-to-Peer,简称P2P)网络具备了较少的路由跳数,然而此路由跳数只是P2P覆盖网络中的路由跳数,并没
随着Web的迅速发展和普及,可以获取信息的种类和结构日益丰富,从传统关系数据库到分布于Web上的大量半结构化信息,以及日益增多的HiddenWeb数据信息。如何实现基于Web的分布式信
随着人机交互技术的发展,各种新的交互手段不断涌现,使人机交互朝着更加自然、高效和更加智能化的方向前进。基于视频的交互(VBI,VisionBasedInteraction)或基于摄像头的交互(CB
学位