基于图模型的模糊RDF数据匹配研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:yingchaoya
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网应用的快速发展和语义Web技术研究的深入,越来越多的语义应用系统采用了 RDF(Resource Description Framework)作为数据表示和交换的媒介。作为实现语义Web上知识表示和推理的数据基础,RDF数据模型通用性很强,能够以有向标签图的形式来描述和组织语义Web上的一切资源。如今,RDF数据模型在当前的Web数据管理场景中扮演着越来越重要的角色,它事实上已经成为了语义Web时代实现数据信息智能处理的基石。正是在这样的应用背景下,基于RDF的数据管理应用引起了学术界和工业界的关注,有关RDF数据模型的扩展及相关查询的理论和技术也相应地成为了数据库领域中的研究热点。现实世界应用中存在着大量的不精确和不确定信息,在数据建模和处理中融入模糊信息以满足现实需求成为了当前研究热点。很多语义Web应用需要处理大量的模糊信息,而经典的RDF模型不能直接用于模糊信息的表示和处理,因此产生了有关模糊RDF数据管理的需求。然而,从现有的有关模糊RDF的研究现状来看,该领域研究成果还非常少,特别对模糊RDF图数据模型的建模及匹配查询等问题的研究仍处于起步阶段,许多重要的理论问题和技术难点当前仍是研究空白。为此,本文的研究工作将从模糊RDF图数据库的角度出发,围绕模糊RDF图数据模型、子图模式匹配、子图近似查询和图数据匹配等问题展开。具体研究内容包括以下几个方面:(1)针对现有的模糊RDF数据模型仅能表示元组级模糊信息的问题,提出了一种能够支持元素级模糊信息的模糊RDF图数据模型。并且给出了模型的形式化定义。在该模型的基础上,讨论了在模糊RDF图数据库中类似关系数据库关系代数的代数操作,提出了一个通用的模糊RDF图代数框架,该代数框架可以有效的支持模糊RDF信息查询。同时还提出了模糊代数等价的形式化定义。并进一步的研究了在实际处理过程中如何利用模糊代数表示SPARQL查询问题,可以利用模糊RDF图代数将SPARQL查询转化成为一个直观的模糊RDF图代数表达式。模糊RDF图数据模型和模糊代数操作为模糊数据的语义Web发布,以及实现基于语义Web的智能信息处理奠定了基础。(2)针对模糊RDF图数据的查询问题,提出了基于子图模式匹配的模糊RDF数据查询方法。首先,基于整体匹配策略,将在传统的RDF数据模型上定义的子图模式扩展到模糊RDF子图模式,即在顶点上指定了模糊条件,表示用户的查询意图;边上用正则表达式标记,表示属性路径的结构。然后研究了基于扩展的图同态的模糊RDF子图模式匹配算法,用于有效地评估模糊RDF图上的子图模式匹配。该方法基于回溯搜索法,通过以深度优先的方式遍历解析树来生成每个可能的映射。所实现的基于正则表达式的属性路径查询方式,既保持了属性路径表达方式的简洁性,又实现了识别用户的查询意图,返回带有用户偏好的查询结果。(3)针对精确的子图模式查询算法可能会面临代价过高的问题,提出一种基于路径的模糊RDF子图近似匹配方法。在预处理阶段,建立了数据图的路径索引,保存了数据图路径及其隶属度的相关信息;匹配阶段通过该引索,提出了一种近似的模糊RDF子图匹配算法。首先,算法将查询图分解为一组可能重叠的路径,然后在数据图中查找到这些路径的匹配路径,从中选择最匹配查询路径的路径作为候选路径子集。接着候选路径通过连接操作,从而构建出查询的答案图。此外,通过在匹配过程中聚合每个候选路径的相对可能性来计算匹配结果图的绝对可能性。最后,综合实验验证了该方法的有效性。(4)针对在融合和互连环境中两个模糊RDF图数据对齐(比对)的问题,提出了一种基于相似度的模糊RDF图数据匹配方法。该方法不但利用节点和边的标签信息,还综合考虑了 RDF图的结构特征。首先,依据图元素(顶点和边)的标签内容,分别计算了 RDF图顶点和边标签的语法和语义相似度。然后,基于相似性传播的思想,将顶点的邻接关系作为结构特征信息,结合顶点和边的模糊隶属度,迭代计算了结构相似度。接下来,将各个相似度聚合在一起,获得总体相似性。最后,根据预定阈值,可以获得最佳比对。实验结果表明,该方法可以有效地测量模糊RDF图在各种场景下的相似性。
其他文献
石墨烯是碳材料家族中的新兴成员,因其具有优异且独特的光学、热学、电学、化学和机械性质而受到科学家们的广泛关注。它固有的π-电子体系、良好的生物兼容性、巨大的比表面积等物理性质和化学性质使其具有作为固相吸附材料的潜质并应用于样品预处理当中。石墨烯的基本单元是sp2杂化的共轭结构形成的蜂窝状碳原子平面,对具有芳环结构的分子如蛋白质和核酸等表现出强烈的亲和性。但是,石墨烯可以吸附大多数的蛋白质,应用于生
信息物理系统(Cyber-Physical System,简称CPS)是综合计算、网络和物理环境的多维复杂系统,通过3C(Computation、Communication、Control)技术的有机融合与深度协作,实现大型工业系统的实时感知、动态控制和信息服务[1]。CPS实现计算、通信与物理系统的一体化设计使系统更加可靠、高效以及实时协作,具有广泛的应用前景。信息物理系统融合了嵌入式、物联网与
烧结工序排放的废气占钢铁工业废气量的40%以上,是钢铁工业最严重的污染源。由于烧结烟气含尘浓度高,污染物成分复杂,且烟气量和气体污染物含量波动大,使得末端治理净化烟气的方法不仅技术难度大,且投资和运行成本高。烟气循环烧结是一种经济可行的减排技术,原理是将一部分烧结烟气直接循环利用,不但可减少单位烧结矿排放的废气量,同时可充分利用烟气余热和CO潜热,且部分污染物在循环过程中得到降解,可取得良好的节能
随着纳米技术的发展,微纳光子结构的研究在近三十年里取得了空前的进步,成为当今光子学研究的热点领域,其主要研究目的是通过对材料的结构设计来实现对光传输、吸收和发射等方面的调控。在微纳光子结构中,由微纳颗粒构成的结构占据其中重要的位置。微纳颗粒在外场激发下可以表现出强烈的米氏散射,通过结构设计来调节颗粒的多极子共振以及多极子间的耦合,可以实现很多有趣的物理现象,例如多层结构中的等离子体隐身与激光,颗粒
镍是重要的战略物资。经过多年的开发利用我国高品位硫化镍矿已经稀缺。红土镍矿和低品位硫化镍矿的开发利用日益受到重视。本论文针对我国四川红土镍矿和新疆低品位铜镍氧硫矿进行了综合利用的工艺和理论研究。在对四川红土镍矿和新疆低品位铜镍氧硫矿矿物的化学组成、矿相进行检测分析,并对相关化学反应做了热力学分析,判断化学反的可能性。在此基础上设计红土镍矿和铜镍氧硫矿的硫酸焙烧-水浸的火法-湿法联合工艺流程。利用单
"亢则害,承乃制"即亢害承制论,若邪气过盛则为亢,物为亢邪所损则为害。动脉粥样硬化为病之因有二:一为体质,二为宿邪。现代医学将可能导致动脉粥样硬化的物质但未形成真正病灶时称之为"盛";"盛"的日积月累导致"害"的结果时,"盛"转变为"亢"。低密度脂蛋白的升高即为"盛",此时由于饮食、情志、体质等因素导致血液中出现痰湿之邪。而动脉粥样硬化的关键病变为巨噬细胞转化为泡沫细胞,并分泌更多的炎症因子以诱发
结构光三维测量方法具有非接触、精度高、成本低、测距大等特点,已经被广泛应用于逆向工程、机械制造、物体识别、医学诊断和文物保护等领域。由于结构光测量过程中存在投影仪的非线性影响、投影仪的离焦量影响、相位展开误差以及标定误差等影响因素,因此如何提高测量的精度和速度是目前结构光三维测量的重要研究方向。本文在国内外相关研究成果的基础上,对结构光三维测量关键方法进行了深入研究,针对现有方法的不足,提出了多种
本文研究了自相似集和自仿集的拓扑结构和拓扑性质,主要包括有重叠的自相似集的拓扑分类和Lipschitz分类,含参数自相似集族和自仿集族的连通性。全文内容分为以下七个章节:第一章介绍了本文的研究背景和研究现状,并叙述了本文的主要结论。第二章介绍了本文需要用到的概念和结论,主要涉及迭代函数系统、自相似集、自仿集、符号空间、Gromov双曲图理论以及矩阵重排条件。第三章研究了一类有重叠结构的平面自相似集
钢结构被广泛的应用在工业与民用建筑、桥梁工程中,但是,由于不断受到环境腐蚀、超载运营等因素的影响,钢结构会出现老化、承载力降低等现象,进而可能出现不能满足使用要求的情况。因此,研究如何对钢结构进行加固,已成为一项土木领域中的重要研究内容。碳纤维增强复合材料(Carbon Fiber Reinforced Polymer,CFRP)因具有质量轻、强度高、耐腐蚀等优点被应用于钢结构加固中。本文在国内外
装配式钢-混凝土组合梁具有提高施工质量,加快施工进度,减少施工过程中对周围环境影响的优势,但目前的研究和应用主要集中于采用栓钉抗剪连接件的现浇钢-混凝土组合梁,对于采用刚性抗剪连接件的组合梁以及装配式钢-混凝土组合梁的研究相对较少,且缺乏系统性。因此本文对装配式钢-混凝土组合梁力学性能进行了抗剪连接件的推出试验以及装配式钢-混凝土组合梁的梁式试验研究,通过ABAQUS有限元软件进行了模型计算和理论