基于内容的发布/订阅系统事件匹配算法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:a1263951733
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet技术的快速发展,网络计算已进入大规模分布式计算时代。这种分布式计算系统具有松耦合、动态性、分散控制等特点,其中一类最具典型代表的就是发布/订阅系统。发布/订阅系统能够使得信息交互的双方在时间、空间和控制流三个方面都完全被解耦,从而成为了新一代分布式计算技术的基础平台。  在现有的发布/订阅系统中,仍有两个关键问题需要解决,一是数据匹配的时效性问题,即在“大数据”分发的情况下,面对海量的信息资源,客户端节点却难以准确、及时地获取所需的信息;二是语义表达能力问题,如何对异构事件进行统一表示,以使系统能快速、正确理解各类事件的语义信息,从而提高系统中事件匹配的准确度。面向以上两个问题,本文从基于内容的角度出发,对发布/订阅系统中的事件匹配算法展开了研究。  首先,针对数据匹配的时效性问题,本文结合实际应用中,同一个订阅条件中不同谓词属性值的值域范围是不一样的这一特点,提出了基于谓词优先级的匹配算法(简称PPEM)。该算法根据不同谓词属性值的值域范围所映射的过滤事件的能力调整谓词的匹配顺序,再结合合理的数据结构,有效地提高了发布/订阅系统中事件分发的匹配效率。  接着,为了更进一步探究谓词的匹配顺序对事件匹配过程的影响程度,以及如何获取最优谓词匹配顺序的生成规则。本文首先通过构建匹配过程最优化模型,利用概率统计知识,严格证明了谓词匹配顺序是影响匹配性能的关键性因素,并推导出了获取最优谓词匹配顺序的生成规则;在此基础上,通过进一步优化数据结构,提出了新的词法匹配算法——基于匹配过程最优化模型的匹配梯算法(简称Match-Ladder)。通过实验对比分析得出:在订阅条件数量超过6000(含6000),事件数量为10000的情况下,PPEM算法和Match-Ladder算法的匹配时间比目前最有效的匹配桶算法分别减少了49.07%和53.64%。  最后,为了解决语义表达能力问题,本文利用本体语言Web Ontology Language(简称OWL)构建了发布/订阅系统事件语义匹配概念模型;选用资源描述框架(ResourceDescription Framework,RDF)作为事件模型的基础,使得事件可以被程序无歧义的理解和处理,并能在传输过程中不丢失语义信息;选用语句模式作为订阅条件表示的基础,降低了订阅条件存储和维护的成本。经过以上步骤,构建了适合语义匹配的数据模型。  基于该数据模型,本文设计了一种高效的基于语句模式的匹配算法。它的基本思想是以语句模式为基本单位进行匹配,不同订阅条件中的相同语句模式只需匹配一次,并利用计数法的思想:对订阅条件中匹配成功的语句模式进行计数,最终通过比较每个订阅条件成功匹配的语句模式个数与拥有的语句模式个数是否相等,以确定最终的匹配结果,从而避免了对图结构的遍历与回溯处理,降低订阅条件维护成本的同时也进一步缩短了语义匹配的时间。
其他文献
土地覆盖不仅是进行国土资源调查、规划和动态监测的基础,还是研究其环境效应、生态安全和全球变化影响的有效手段,具有重大的研究意义。遥感影像中包含丰富的表征地物物理化的
随着我国经济的蓬勃发展,各种工程和研究项目日益增多,科学的管理方法已经成为项目质量的重要环节。计划评审技术(Program Evaluation and Review Technique,PERT)作为计划管理
计划调度评审技术(Program Evaluation and Review Technique,PERT)是系统工程中对潜在任务进行分析的一种方法,是一种科学的组织管理技术,其建立的目的是为了简化大而复杂项目
当前,以沉浸性、交互性和构想性为基本特征的虚拟现实技术是一个热点研究领域,其应用越来越广泛。和其他计算机系统不同的是,虚拟现实系统利用计算机模拟产生一个三维空间虚拟世
“数字城市”是指在城市规划建设与运营管理以及城市生产与生活中,利用数字化信息处理技术和多媒体技术,将城市的各种数字信息及各种信息资源加以整合并充分利用。城市规划者和
网格计算的出现为空间信息服务领域提供了新的技术解决方案,地理信息服务网格是利用先进的网格计算技术和计算机网络互联技术将松散分布于网络环境下的多源异构空间信息节点进
随着2011年6月24日,美国总统奥巴马提出了“材料基因组计划”,在至今的将近4年时间里,国际国内的材料科学家都逐步认识到了“材料基因组计划”的重要性,相关的科研单位也在不断加
组播能够高效地为组通信应用提供点到多点和多点到多点的传输能力。因此,自从被提出,组播就一直是学界和业界所关注的热点领域之一。历经二十余年,已经提出了大量的网络技术用于
P2P网络在复杂多样、动态多变的环境中,进行信息、数据、服务之间的交互,由于资源的有限性,P2P网络节点之间存在大量的竞争,由于在非完全信息的情况下,P2P网络节点间的交互存在着
随着计算机及网络技术的飞速发展,当今社会正快速向着信息化方向前进,交流与沟通也就无时无处不在。近十年来,国内外一些即时通讯软件也在不断的完善之中。即时通讯(Instant Mes