论文部分内容阅读
随着网络技术的发展,越来越多的用户希望能够访问和处理来自分布于不同的数据源的信息,实现数据在多个系统与不同数据源之间的集成与共享。在现有的分布式异构的环境中,将信息技术的应用从传统的事务处理推向Internet环境下的数据集成、共享与互操作的任务越来越紧迫。本文对分布式异构数据互操作进行了深入的分析和探讨,围绕其中的公共互操作模型的构造,根据获得局部数据源信息的特点如何进行有效的查询优化等关键技术进行了研究。论文首先详细介绍了联邦数据库系统FBDS和Mediator/Wrapper系统两种的数据互操作模型。论文将两种传统的数据互操作方式的主要特点与广域分布式环境相结合设计了一个分布式异构数据互操作HIM模型。该模型兼顾了两者的优点,比单独使用一种集成方案更适合广域分布式环境。论文在给出了分布式异构信息互操作系统中查询处理的基本概念和结构之后,根据获得的局部源信息的特点将全局查询优化分为基于静态源信息和基于动态源信息的查询优化。并对分布式异构数据源互操作全局查询优化进行改进。首先将带冗余条件表达式的查询图、边界点和查询块等概念引入Kruskal算法。分割带冗余条件表达式查询图、查询块优化、重构查询图等步骤构成改进后算法MQB-K。然后在MQB-K算法的基础之上,结合场地间运算代价在不同情况下需要用不同的权函数表示这一特点,将优化算法进一步改进为基于静态源信息的多权值优化算法。最后将局部源信息动态产生的特点融入改进算法,将基于静态源信息的多权值优化算法与基于动态源信息的查询优化相结合设计了一个混合优化算法DS-HO算法。实验表明MOB-K算法性能优于Kruskal算法;混合优化DS-HO算法的平均执行时间最短,性能最优,基于动念源信息的查询优化次之,基于静态源信息的多权值优化算法性能略差一点。