基于磁盘图的最短路径查询算法研究

来源 :中国人民大学 | 被引量 : 0次 | 上传用户:hunan341
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
最短路径问题是图论中的经典问题,它不仅广泛应用于早期的简单网络,而且在涉及到复杂网络的各个领域中也得到了多方面的应用,例如:在一个给定负载量的交通网络中选择从出发地到目的地耗时最短的路径;在矢量化地图中寻找两地之间的最短路径;在网络中依据网络负载选择最佳路由等等。在复杂网络中,搜索符合最短、最快等条件的路径对于挖掘网络中的关键信息有着重大意义,而且随着近年来互联网的不断发展扩大,以及信息网络规模的飞速膨胀,网络中的最短路径问题又一次成为了研究的焦点问题,而且对算法的可扩展性有了越来越高的要求。  给定一个有向无环带权图,在图中任选两点作为起点和终点,最短路径查询将给出这两点之间的一条最短路径。最短路径查询算法中的经典之一是Dijkstra算法,但是该算法采用的是宽度优先的方式,只能解决单源最短路径问题,因此当查询针对任意点之间时,需要进行多次重复计算。同时该算法是典型的内存算法,可扩展性较差,当前的很多研究都对其进行了改进。  本文首先基于深度优先搜索的方式将区间编码技术引入带边权的有向无环图中,提出了图的TRS结构。通过区间编码,将图中一个连通分支中的边划分为树边和非树边,而非树边又根据其起点和终点所在的分枝是否相同分为S边(Separating Edge)和R边(Remaining Edge)。这样,所有结点的区间编码,结合S边和R边,就构成了这个连通分支的TRS结构。同时,本文还对区间编码进行了改进,使其不仅能够完整保留图的拓扑结构,还能将边权值映射到点权值从而保留权值信息。  接着,本文基于TRS结构提出了解决最短路径查询的TRS算法。当查询到来时,算法首先根据起点和终点的带权区间编码进行初步计算得到最短路径的上界,然后再结合S边和R边进一步降低上界,直到求得这两点之间的最短路径。通过实验对比,本文很好的证明了TRS算法能够很好的保证查询的时间代价不随图的规模成多项式复杂度上涨。  由于TRS结构自然的对图进行划分的特性,本文结合层次图框架,将TRS算法扩展到了磁盘图领域。对于一个TRS结构,如果同属于它的两个边界点之间存在最短路径,则将这两点加入到框架图中,并用一条权值等于其最短路径代价的边连接这两点。对每个TRS结构都进行这种计算,就可以得到该TRS结构上的框架图。再把框架图作为新的图进行处理,直至框架图中不存在边界点。当查询到来时,首先在最底层TRS群中找到起点和终点所属的TRS,然后将与它们相关联的边界点找出,然后将这些边界点映射到更高一层的TRS群中,作为新的查询点,重复这种搜索,直至最高层;然后再将每一层中的查询结果返回给下一层,直至最底层。为了验证该扩展算法的正确性和有效性,本文还在采集来的wikipedia数据集上进行了实验。  本文最后还提出了几个对算法的改进思路,由于在预处理过程中,需要计算出所有同属于一个TRS结构的边界点之间的最短路径,所以可以考虑通过缩小TRS结构的规模来减少它所包含的边界点的数目,进而降低预处理的时间代价。
其他文献
物联网是世界信息产业发展的第三次浪潮,是各国政府和联盟组织关注的重点和亟待发展的科技前沿。无线传感器网络是构造物联网的子网络之一,为物联网提供了信息感知和无线通信等
ERP是当前国际上先进的企业管理模式。它可以对企业所拥有的财、物、人、信息、时间和空间等管理因素进行综合平衡和优化,面向全球化市场,协调企业的各个管理部门,围绕市场开展
为了提高互联网的服务质量,需要对一些占据大量带宽和流量的即时通讯应用进行流量识别,以便于网络管理。更为重要的是,即时通讯应用用户众多,信息量大,传播迅速。为了净化互联网环
1997年Phillips在q-整数的基础上引入了Bernstein多项式的一种推广,即q-Bernstein多项式算子。该算子引起了很多人从不同的角度研究。当q取1时,q-Bernstein多项式就是经典的Ber
Docker是容器虚拟化的主流技术和典型代表,它将应用及其依赖和运行环境打包为标准的、自包含的镜像(Docker Image)发布,通过创建容器实例(Docker Container)实现应用的快速交付
随着多核时代的到来,共享内存的多线程编程开始普及。多个线程在并发访问共享内存时会存在内存一致性问题。Java语言通过直接在语言层定义内存模型来解决该问题。Java内存模型
利用数据挖掘技术可以从海量数据中获取有价值的知识模式。广泛存在的软件源码作为一种特殊的数据形式,在其上应用数据挖掘技术进行源码形式的信息挖掘,已经成为一个新颖而重要
随着科学技术的发展和管理能力的提升,软件和服务都处在一个快速发展的黄金时期,但是这些变化带来了新的功能、方便和复杂性。随着系统复杂性的增长,用于开发系统的过程也随
无线传感器网络日益成为信息感知的重要手段之一,有着丰富的应用支撑和广阔的发展前景。为了对网络中的数据进行有效和高效的管理,一般将无线传感器网络建模为一个分布式数据库
现实世界中,很多实际问题都更适合于用“图”进行建模。在图挖掘领域,对象相似度作为一个重要课题,被广泛应用在链接预测、欺诈检测、协同过滤、近邻查询等众多实际问题中。在传