论文部分内容阅读
网络的对等技术(Peer-to-Peer)和网格(Grid)研究的深入,有力地推动Intenet上信息服务的发展。信息服务包括:分布式部署、信息的发现、存储服务、查询服务、服务组合、内容发布与订阅。计算机用户通过搜索引擎Google、百度,可以从网上获取他们需要的信息。应用的需求为信息技术的发展带来了机遇。但是,随着Web服务提供者和使用者数量的增多,Web服务在网上分布之广,服务项目之繁杂,服务质量参差不齐,服务可信度难以确定;要合理使用大量分散在不同节点(peer)上的服务协同工作,提高服务的可测量性、可用性、可靠性和QoS服务质量保证。这给大规模信息查询与动态聚合服务提出了挑战。鉴于理论与应用的迫切需求,使人们将研究的关键技术聚焦在:Web服务的资源发现与定位(Discovering)、面向服务的结构化信息查询(Querying)、服务的动态聚合(Providing Services),尤其是相关的原理、方法与改进算法。本文的主要贡献如下: 1.采用基于概率学习的信息资源搜索定位,提高信息资源发现的成功率。 资源定位机制是Peer-to-Peer系统的关键技术,它的主要功能是查询并返回请求资源的定位信息。本文提出了一种基于概率学习的路由搜索技术,应用机器学习的方法提高资源定位机制的效率。学习算法是用历史查询和结果反馈信息预测成功peer信息源发现的概率,随着查询返回结果数目和用户反馈信息的增加,学习器的训练和学习效率不断提高。提出改进的概率学习搜索(Advanced-Adaptive Probabilist ic Search简称Advanced-APS)算法,和对节点索引表的构建及维护算法,研究了基于索引表中索引信息的路由选择算法。实验表明采用基于概率学习的信息资源搜索定位,提高信息资源发现的成功率。 2.基于关键字的面向服务的“图模式”查询提高了信息查询的效率。 对网格环境下Hidden Web数据库的研究与开发逐渐成为人们关注的焦点问题。要回答用户的查询,数据集成系统需要解决网格上的需求语义分析和关键字查询、建立数据查询模型。将数据库抽象为无向图,节点对应数据库中的元组,边对应“主-外码”的关系。查询的结果是与元组连接的答案树,它与查询的关键字相匹配。论文中,提出了一个新的查询算法,将改进的动态规划算法用于查询模型,保证Top-1答案树最优,Top-K答案树近似最优。最后试验测试和评估了算法性能。 3.选择答案树RANKING评分模型的Top-K查询结果提高查询的有效性。 本文提出答案树评分模型,采用一种基于邻近程度的答案树评分函数,分值越低表示邻近程度越高,即,结果越优。答案树的分值由树中的“节点”分值和“边”分值两部分组成。不同类型的边和节点所反映的紧密程度不同,同时考虑用户兴趣偏好,设定不同类型的边和节点的基本分值。当用户提交查询时,利用启发式算法选择最有希望Top-k结果,提高系统的查询效率。实验验证选择答案树RANKING评分模型的Top-K查询结果提高查询的有效性。 4.优化QoS服务质量保障的动态聚合服务的选择算法为用户提供复杂的增值服务提供了新方法。 服务组合可以聚合独立的、可重用的服务组件,提供更丰富的应用服务。为了支持快速的、动态的服务组合框架的形成,服务的提供者必须考虑服务质量(QoS)、需求定位、服务选择和动态变化,为用户提供满意的服务功能。在论文中,提出了基于网格的动态服务组合模型与算法。首先,检查需求语义形成服务的功能候选图;然后,应用服务选择算法形成优化组合模型;最终形成理想的服务组合,并用实验进行模拟验证。