基于语义距离的概念语义相似度研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:kfsoft2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义Web作为目前Web的一个延伸,目标是使Web上的数据具有机器可识别的语义,便于人机之间的交互与合作。然而其实现面临着语义互联、规范组织和智能聚合等理论和技术障碍。为了探索解决问题之道,本文设计了一个语义原生XML数据库系统(简称SNAX系统),对其中的一些关键理论和技术进行了详细的设计并对语义相似度计算器进行了实现。SNAX系统的层次关系满足Berners-Lee对语义Web的定义,能够用于构建此系统的许多理论、技术和方法对构建语义Web有同样的作用。首先,论文对Tim Berners-Lee提出的语义Web体系结构进行了简介,在总结了语义Web实现所面临的理论和技术障碍的基础上,提出了本文的研究方向,设计一个微型的语义Web系统——SNAX,其主要组成部分有:Web数据采集器、数据存取管理器、本体映射集成器以及多功能查询器。其次,从Web信息采集和本体集成两方面论述了语义相似度计算在SNAX系统中的重要地位和作用。论文基于“建议上层共享知识本体(SUMO)”提出了语义相似度的计算方法,该方法通过对SUMO层次树中处于不同位置的边设定不同的权值,按照最短路径距离的计算方法得到两个概念的语义距离,然后进行间接转换,得到了两种不同的语义相似度计算方法。最后,对本文提出的算法进行评估。我们在SUMO中随机选择了五十对概念,通过文中实现的相似度计算平台得到了两种计算方法下的实验结果,同时我们获取了人类主观判断的结果,通过比较分析它们的吻合程度,确定了能得到最佳结果的参数值,从而验证了方法的有效性。
其他文献
医学图像配准是为了实现一幅医学图像与另一幅医学图像上对应点、面或像素值通过几何变换达到空间上的一致,从而将多种模态的图像信息融合成一幅新的图像,提供给医生更加丰富
随着经济和社会的发展,人们对汽车的安全性、舒适性、燃油经济性等方面提出了更高的要求,来自汽车功能和开发成本、上市周期各方面的压力,汽车电子软件的开发面临着越来越大的挑
实时数据库是实时系统与数据库技术有机结合的新型数据库,它具有时间约束性。在时间关键型的应用中传统数据库技术已不能满足需求,实时数据库技术成为研究热点。随着电网规模
GPS(Global Positioning System)车载导航技术是GPS技术随着嵌入式技术、汽车工业的迅速发展而逐步兴起的,广泛用于交通监控,车辆导航等方面。在我国,市场上各种基于GPS导航的产
学位
在机器学习领域中,当要分类的数据集类别分布差别较大时,就称为不平衡数据分类。它是目前在机器学习和数据挖掘领域里一个研究热点。不平衡分类问题在现实生活中经常出现,而传统
近年来,观点摘要技术为世界各地的消费者带来了极大的便利。从大量的在线商品评论中,观点摘要技术自动为给定商品的大众观点生成摘要。然而,当前的观点摘要系统为每个商品所提供
面向时间序列建模及预测应用,针对RBF神经网络训练中结构设计问题和权值修正问题,本文分别提出改进的单目标RBF神经网络设计方法和改进的多目标RBF神经网络设计方法。论文所
随着现代科学技术的的高速发展,可穿戴计算机已经成为了现代计算机的一个重要的发展方向。可穿戴计算机具有微型化、可穿戴性、可移动性等特点,在工业、军事、医疗监护等领域
随着社会数字化程度的的提高以及网络技术的迅猛发展,各种多媒体产品,如音频、图像、视频等层出不穷,极大的满足了人们的娱乐、沟通的需求。但是,由于网络的开放性、数字产品
现实中的许多应用,如社交网络、P2P信贷、生物信息、社交投资等许多数据库系统都是构成异构信息网络。因此,针对异构信息网络的数据挖掘任务是当前热门的且充满挑战的研究新方