关系数据库语义集成关键技术研究

来源 :中国科学院软件研究所 | 被引量 : 0次 | 上传用户:liangpask
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自上世纪70年代关系数据库诞生以来,数据集成就一直是数据库领域的研究热点和难点问题。传统的数据集成研究依赖于元数据级别的模式映射和模式转换技术,较好地解决了结构级别的异构。但是,随着电子商务等web应用的出现,数据集成参与方的规模越来越大,而关系数据库模式缺乏对语义信息的显式表达能力,用户依赖于约定俗成规定数据语义的方式不再成为可能。这就造成了几个方面的问题:如何提高集成过程的自动化程度,如何保证数据集成满足用户定义的准确性要求,如何检测和消解集成过程中的语义冲突,如何提供满足用户意图的查询结果?因此,迫切需要能够克服这些困难的新方法。   随着对语义web技术的深入研究和本体在数据集成领域的逐步应用,利用或基于本体解决语义互操作问题已成为可能。本文以本体为主要工具,在传统的模式匹配和模式冲突消解技术的基础上,深入研究语义级别的自动化模式匹配技术、检测和消解关系数据库集成中的语义冲突、提高数据库查询的质量。本文对关键数据模型进行定义,描述了复杂过程的规则和算法,设计了系统体系结构,并在数据集成中间件OnceDI的基础上进行了实现,研究内容可满足网络分布式环境下关系数据库语义互操作的需求,在集成准确性、自动化程度和响应质量上均得到了较好的结果。   在模式匹配方面,利用WordNet本体与决策树学习相结合的方法进行属性名称匹配,这种方法基于词汇语义,区别于已有的基于模式的、基于实例的和基于结构的方法。在此基础上,根据自主构建的数据类型本体,计算数据类型的语义距离,进一步得出集成了数据类型的属性相似度。利用领域本体,还可以计算一对多的语义匹配关系。迭代的三个过程逐步提高了模式匹配的质量。   在冲突检测和消解方面,首先给出了一种语义冲突的分类框架,基于该框架建立了冲突分类本体SCO。然后使用OWL本体描述语言建立关系数据库模式的语义扩展模型ESM,并给出了一种基于规则的关系数据库到ESM的自动转换方法。SCO和ESM两部分构成了语义冲突的表示模型,在此基础上,给出了语义冲突检测和消解的算法。系统实现证明,它可以有效消解大部分实际应用中的语义冲突,并且保持领域通用性和集成模型无关性。   在数据库语义查询方面,已有的研究主要解决多数据库模式级别的语义异构问题,满足用户全局查询的目的。考虑数据库实例的语义,并用来提高数据库查询质量的研究尚不多见。我们定义了与数据库相关的本体,主要描述数据库实例的语义及关系,基于该本体与数据库元素的映射关系,根据语义关系的等价性,定义了查询转换的规则,应用该规则可以获取更多或者更少的查询结果,但是却更能反映用户的查询意图。本文给出了查询转换规则的正确性证明方法,并讨论了查询转换的实现。基于转换规则的方法不要求用户熟悉本体语义,不需要对DBMS进行修改和扩充,具有对所有关系数据库类型的通用性,较好地满足了提高数据库查询质量的要求。   最后,本文介绍了如何在数据集成中间件OnceDI中实现语义集成的功能。作者扩展了客户端工具集,用于编辑处理各种本体;在控制中心服务器中,扩充了元数据管理功能,可以在此基础上自动生成等价的关系数据源本体,扩展了ETLJob管理模块,用于完成基于各种语法和语义匹配算法的自动化模式匹配:在集成服务器中,实现了转换函数库,用于属性冲突的消解处理。本文介绍了OnceDI的各个重要组成部分,阐释了语义集成功能的实现细节,给出了关键数据模型的数据结构,描述了复杂过程的执行流程。
其他文献
本文的研究工作是围绕综合型语言知识库建设展开的,包括两部分:综合型语言知识库系统原型的开发与中文缩略语知识库建设。 北京大学计算语言学研究所(ICL/PKU)十多年来积累
随着互联网上相同或相类似功能的Web服务数量的日益增多,用户对Web服务服务质量QoS的要求也不断提高。在实际应用中,服务提供方、服务使用者、服务质量等诸多因素的不确定性
随着高性能计算技术的迅猛发展,机群系统在航空航天、石油勘探、气象预测等领域的应用越来越广泛。在2007年11月全球高性能计算机Top500排名中,机群系统结构占总数的81.20%,并且
随着定位技术的不断提升和定位设备的大量普及,获取人与物体的位置信息变得愈加便捷。与此同时,随着物联网(Internet of things)技术的不断成熟,通过海量的传感器定时发送相关数
近年来,随着计算机网络与通信技术的快速发展,P2P网络模式以其可扩展性、高度容错性等突出优点变得越来越流行。在仅有的几年时间里,P2P应用已发展成为了占用Internet流量的
计算机的使用越来越普及,但信息安全缺陷所引发的问题却越来越显著。因此,在生产生活中对信息安全产品、科研、教育和培训的需求越来越旺盛。随着信息安全相关的产品开发、研究
无线传感器网络的应用前景十分广阔,能够广泛应用于军事、环境监测、医疗健康、交通管理以及商业应用等领域。虽然传感器节点有着各种各样不同的应用,但这些应用对传感器节点有
机群I/O设备共享是机群管理的一个重要部分。目前占市场主流的基于纯软件系统实现机群I/O设备共享的方式在系统的跨平台特性,可扩展性,对服务器资源的占用等方面存在不足。随着
在Web和企业信息化等领域,XML已经被接受为一种标准的信息交换格式。XML的自描述,与平台无关的特性使得它被用作不同系统间通信的数据格式,如用于Web Services中SOAP消息的载体
星载计算机(On-Board Computer,OBC)是卫星中完成控制和计算任务的现代数字计算机系统,它是卫星综合电子系统的控制和管理中心,在民用和军用领域都发挥着重要作用。星载计算机对