基于大规模混合流量数据的连通分量计算技术

来源 :中国电子科技集团公司电子科学研究院 | 被引量 : 0次 | 上传用户:qncy1235i
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文针对大规模混合流量数据连通分量计算时面临的效率瓶颈问题开展研究,重点解决三方面的问题,一是以google的pregel算法为代表分布式图计算算法无法处理IPV4、IPV6混合流量数据;二是在某些领域数据采集时只能采集到部分流量数据,从而造成畸形连接拓扑,在两个体量相差很大的图之间仅通过有限数量的边连接,在万级和千万级两个集合间进行连通分量计算时需要几天以上的处理时间,无法满足时效性要求;三是存在大量的增量连通性计算需求,即需要把每天抓取的流量数据与历史数据融合更新连接关系,在这方面当前缺乏有效的算法支撑。为此开展基于大规模混合流量数据的连通分量计算技术的研究,重点解决以上三方面的问题,并围绕此技术展开了如下主要工作:第一、提出并实现了面向残缺混合流量的连通分量计算优化算法,解决IPV4、IPV6混合流量处理问题以及畸形流量的计算效率问题,通过给IP重编码的思路,使得算法能够兼容IPV4、IPV6混合流量,同时针对“在两个体量相差很大的图之间仅通过有限数量的边连接”的畸形拓扑,提出了度越大的节点赋予越小的ID的思想,减少了消息传递次数,使得连通分量计算效率显著提升。第二、提出并实现了面向离线计算的增量连通分量计算优化算法,充分利用IP地址和连通分量的映射关系,将已经进行过连通分量计算的IP地址用其所属的连通分量ID替代,解决了现有连通分量计算技术面对新增流量数据时选择对全量数据进行重新计算,运算效率低下的问题。在此基础上设计实现了基于大规模混合流量数据的连通分量计算系统,并设计实验对本文研究成果进行验证,实验表明,面向残缺混合流量的连通分量计算优化算法在处理残缺混合流量方面,算法效率提升达到了 23倍多;当新加入的流量数据和原始流量数据的数据量较为接近时,在面向离线计算的增量连通分量计算方面算法效率提升70%左右。
其他文献
铅铋共晶合金(LBE)有着低熔点、高沸点、高热导率等优点,常被作为铅冷快堆和加速器次临界驱动系统的冷却剂。在冷却系统中,流动状态的LBE不仅对结构材料产生氧化腐蚀和溶解腐蚀
群智感知是一种由集成大量传感器的移动设备构成的感知网络,它将广大用户作为各种真实数据的获取来源。作为基本的传感单元,通过移动互联网,用户的各种移动设备进行不同分工的协作,来完成任务的分配和感知数据的收集。然而,当参与用户使用他们的实际位置报告感知数据时,他们的位置隐私信息就会无意间被泄露。为了解决这一问题,本文引入了ε-差分隐私,为参与者的位置隐私提供了理论保障。首先,本文分别介绍了群智感知网络和
根据2000年教育部印发《高职高专教育英语课程教学基本要求(试行)》,高职高专英语教学最终目标是培养学生的英语跨文化交际能力。本文就以下问题展开研究:1.目前内地西藏高职学生英语跨文化交际能力(跨文化交际意识、跨文化交际技能、跨文化交际知识、跨文化交际态度)总体情况如何?2.哪些因素影响内地西藏高职学生英语跨文化交际能力?3.如何提高内地西藏高职学生英语跨文化交际能力?本文以Byram(1997)
进入21世纪后,美印两国核能领域的合作拉开帷幕。在布什政府时期,美国解除了对印度的制裁和核封锁。其制裁封锁原因最早可以追溯到1968年印度拒绝签署《不扩散核武器条约》并进行核试验。在之后的几十年时间里,印度的核能领域的发展在俄罗斯等国的帮助下有了一定的基础。印度作为一个发展中国家,有着十亿多的人口,对能源的需求以及核能领域的应用有着巨大的市场潜力。相比中国,印度核能发展较大程度依赖于俄罗斯等国家,
长期以来在涉及营销学领域问题的研究时,学界及实务界均把关注点放在品牌忠诚问题上。其中传统研究倾向于从品牌与消费者之间的关系这个角度来进行探究,指出品牌忠诚受到品牌满意与品牌信任等因素影响极大。然而在激烈的市场竞争环境下,若出现营销策略执行不到位问题,自然很难提升品牌满意度及信任度,导致顾客对企业品牌忠诚度也会出现下降。品牌社区理念的提出,为提升品牌忠诚提供新思路支持。令人遗憾的是,已有研究成果较少
中国经济高速发展以来,水资源越显重要,工业以及城市生活用水的大幅度增加占据了农业用水比例,严重制约了农业及农村发展,尤其是我国西北、华北等地区。因此,专家学者们想到
随钻核磁共振测井测得的孔隙度几乎不受地层骨架的影响,并且可以实时提供地层信息,在地层评价中发挥着不可替代的作用。但是随钻核磁共振测井仪器处在复杂运动之中,回波信号
丙烯是低碳烯烃中非常重要的基础化工原料,国内外需求缺口也逐年增大。目前,随着页岩气储量的大量探明与开采,丙烷催化脱氢制丙烯作为一种高效经济的生产丙烯工艺路径越来越
随着船舶的大型化发展以及减振降噪要求的提升,大侧斜桨、复合材料桨等新型高效螺旋桨广泛应用,导致桨的弹性效应越来越明显,且螺旋桨与流体之间的非线性耦合作用更加复杂。螺旋桨弹性效应除了影响水动力特性和结构性能外,也会强化桨和轴系之间的耦合振动特性,并对纵向激励力传递特性产生影响。本文依托于国家自然科学基金重点项目,以西江干线某多用途货船的推进轴系及其螺旋桨为研究对象,建立弹性桨-轴模型,考虑螺旋桨的弹
喀斯特人地矛盾突出,土壤贫瘠,石漠化严重,喀斯特区环境问题一直是学术领域关注的热点之一,退化喀斯特植被恢复与重建是目前喀斯特生态研究的核心问题之一。本文采用群落调查法、实验法和AHP法、模糊数学综合评价等研究方法对喀斯特区分布最广的白云岩和石灰岩石质生境进行调查分析,筛选出草灌阶段10种具较好适应性和观赏性的物种,进行正交模拟试验研究。结果如下:(1)本文基于实验模拟研究,推理得到喀斯特石质生境特