XML标签语义匹配的研究及应用

来源 :江苏大学 | 被引量 : 0次 | 上传用户:woxia012
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当今以数据为中心的时代,越来越多的应用需要访问各种异构数据源,特别是对于企业应用来说,这既是企业内部发展的需要,也是企业适应外部环境的需要。XML因其具有自描述性、可扩展性以及开放性等优点已经成为了信息表示和数据交换的主要标准,利用XML文档来存储结构化数据的趋势日渐强烈。因此,如何集成基于XML表示的异构数据源,实现有效的信息查询,成了一个亟待解决的问题。 论文针对目前缺乏对独立XML文档数据集成的研究现状,提出了首先寻求XML文档标签之间的语义匹配,然后根据产生的匹配结果,构建用户自定义的中间模式,为异构数据的集成应用提供统一接口的设计思想。论文在综合分析已有模式匹配方法的基础上,首先研究了XML标签的语义匹配算法,然后在长江电气集团电子商务系统中嵌入了数据集成子系统,结合1:1匹配算法产生的标签对,与用户进行动态交互以构建中间模式,利用对中间模式的操作进行数据的可视化查询,实现了数据访问的“透明性”和数据源的“即插即用”性。 论文的主要贡献点是: 1.自主研究并实现了独立XML文档的标签1:1匹配算法,采用22维特征向量来描述每个标签,并用向量距离来量化标签之间的语义关联度,基于最小向量距离选取文档中匹配的标签对。并利用机器学习模块来提高算法的匹配精度,又以长江电气集团两个营销分公司的客户信息作为实验数据,验证了1:1匹配算法的有效性,实验证明:使用机器学习模块后的匹配精度比未使用时提高了8%。 2.基于关系模式复杂匹配方法COMAP的思想,提出了一种自底向上的XML标签的复杂匹配方法。对于叶子标签,针对其数据中所含信息类型的不同,设计不同的搜索器并行查找每个标签可能的复杂映射,并在由此产生的候选映射集上定义了最优匹配指标,以此为标准选取标签的最优复杂匹配。
其他文献
基于运动想象的BCI-FES康复训练系统是一种新的运动功能康复训练方式,能有效地帮助患者建立脑运动想象和外部肢体之间的功能控制连接。本文首先详细介绍了基于运动想象BCI-FES
在整个软件生命周期内,大多数软件系统都需要不断的修改以适应需求的变化,这种无序的修改导致了软件的内部结构的逐步复杂化,并且难以修改和复用.重构是一种有纪律的、经过训
现代企业竞争越来越激烈,生产企业和商业企业都进入一个微利时代,更多企业意识到物流已成为“第三方利润源泉”,同时企业应将主要精力放到核心业务上以谋求更大的竞争力。适应社
随着Internet的诞生,我们步入了信息时代。人们在享受其带来的便利的同时,也时刻面临着网络攻击的危险,网络安全受到日益严重的威胁。究其原因在于现有的安全技术如防火墙、
数据挖掘是从大量数据中抽取出潜在的、不为人知的有用信息、模式和趋势,并用于指导实践。目前该技术已经广泛地应用于电信、银行、保险、零售、服务和政府部门等具有大量数
  随着电子商务的发展,企业信息系统比以往任何时候更加依赖分布式计算架构。专用防火墙、Web服务、认证服务和负载平衡成了传统应用程序和数据库服务的前端,这时企业需要一
本文讨论的“基于DSP的智能化仪表—LVDT传感器监测仪研究与设计”研究了使用新一代数字信号处理器开发智能化数据采集处理系统面临的问题。  本文采用TI公司TMS320LF2
智能规划是人工智能一个重要的领域。近年来,有关智能规划的研究在问题的描述和问题求解两方面得到了新的突破,使得智能规划已成为现在一个热门的人工智能研究领域。随着智能
高维索引技术是研究通过建立索引结构来提高高维数据库上检索效率的一门科学。图像数据库作为高维数据库的重要组成部分,其检索离不开高维索引技术的支持,近年来备受研究人员
当前科学技术正进入多学科相互交叉、相互渗透、相互影响的时代,生命科学与工程科学的交叉、渗透和相互促进是其中一个典型例子,也是近代科学技术发展的一个显著特点。进化算