面向复杂网络的社区发现算法研究

来源 :中国科学技术大学 | 被引量 : 17次 | 上传用户：hermes262

【摘要】

：

复杂网络，其实就是复杂系统的一种抽象，复杂系统中的个体可以看成是网络中的节点，而系统中个体之间按照某种规则而自然形成或人为构造的一种关系就是节点之间的边。在现实世界中

【作者】

：

姜秀芳

【机构】

：

中国科学技术大学

【出处】

：

中国科学技术大学

【发表日期】

：

2011年01期

【关键词】

：

计算机网络社区划分层次聚类凝聚算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

复杂网络，其实就是复杂系统的一种抽象，复杂系统中的个体可以看成是网络中的节点，而系统中个体之间按照某种规则而自然形成或人为构造的一种关系就是节点之间的边。在现实世界中，复杂网络真的是处处可见。换言之，许多领域的系统都可以看作是复杂网络：从科技系统，如WWW和全球交通网络；到生物系统，如新陈代谢网络和生态网络；再到社会系统，如科学家合作网络和在线社区网络等等。而发现网络中的社区结构即社区发现技术是理解复杂网络过程中至关重要的一步，它不仅帮助我们了解该网络的结构，而且帮助我们分析该网络的特性。社区发现技术同时也广泛应用在生物学、物理学、计算机图形学和社会学等领域中。其不仅仅在理论研究方面具有很高的学术价值，在实际生活中也有着十分重大的实用价值。另外，社区还可以为用户提供一些可靠、及时并且有价值的信息。　　本文首先介绍了现有的社区发现技术的一些理论知识，然后回顾了一些早期的经典社区发现算法如Kernighan-Lin算法、谱分析思想以及层次聚类方法中的GN分裂算法和Newman快速凝聚算法，同时还跟踪了一些近两三年提出的新算法如Zhenqing Ye等在2008年提出的适应性聚类算法、Andrea Lancichinetti等在2009提出的基于适应度函数的社区结构发现算法以及Rumi Ghosh等在2010年提出的使用全局影响力度量标准的社区发现算法。对于这些算法，我们分析了它们的优势，也指出了其不足，并且还分析了算法的复杂度以及适用范围等。在理解现有算法的基础上，我们在本文中提出了两个新的发现网络社区的有效方法：⑴基于社区紧密度的快速发现算法FHACC；⑵随机游走策略RMS。其中，FHACC算法的提出，是为了解决现有算法的“大计算量，高复杂度而导致的难以应用在大型社会网络中”的问题。FHACC算法不仅能够有效地发现社区，而且时间复杂度也很低(接近线性)。而RMS算法的提出，有以下几方面原因：①传统的社区结构发现算法，只能得到网络在某个单一层次下的社区结构，而不能完整地给出网络在多个层次下的社区划分状况；②使用这些算法来划分具有重叠社区结构的网络时，往往也会显得力不从心，并且所获得社区的质量也不是很高；③这些算法都没有对重叠社区中具有多重身份的节点进行定量地分析，这将隐藏一些重要的信息，并且经常导致划分不正确。我们引入的RMS算法不仅可以发现网络中的重叠社区，而且也能发现网络在不同层次下的社区结构。并且我们还引入了社区倾向性(Community Tendency，简称CT)的概念，使我们可以定量地描述重叠社区，进而发现网络中的一些隐藏的重要信息，并且得到合理的划分。简言之，RMS可以帮助我们从多个角度来分析和理解网络，从而得到该网络中关于社区结构方面的详细信息。我们的仿真实验结果也验证了这两个算法发现社区的有效性和高效性。

其他文献

基于Shared nothing机制的分布式数据访问层研究

随着网络技术的发展，各种服务产生的信息量越来越庞大，数据仓库应用及数据分析需求也日益增长，这对数据库性能提出了更高的要求。为了提高数据库服务性能，人们提出了分布式数据库

学位

计算机网络分布式数据访问层数据仓库海量数据分析Shared-Nothing架构MySQL数据库

车标识别方法研究

车标识别是指通过计算机视觉、图像处理与模式识别等方法从车辆图像中提取车标信息,从而获得机动车辆品牌信息的一种实用技术。车标识别技术是智能交通系统中的一个重要研究

学位

车标识别主成分分析独立成分分析支持向量机模糊支持向量机

图像显著区域的标注算法研究

由于互联网的飞速发展以及移动终端设备的持续增加,图像的数据量急剧上升。庞大的图像数据必然会对图像处理技术提出更高的要求。如何从庞大的图像库中快速有效地找到想要的

学位

图像标注视觉注意显著区域词相关性

基于图像分割和区域语义相关性的图像标注算法研究

随着计算机技术、网络技术和智能通讯技术的飞速发展,大量的图像数据在网络上广泛传播,并且呈现爆炸式增长,如何有效地管理和利用这些图像资源已经成为当前面临的一项难题。

学位

图像分割图像标注高斯混合模型语义相关性

基于Xen的系统监测技术研究

本文在总结了传统计算机系统的性能测试理论和测试的基础上,设计并实现了Xen的CPU虚拟化系统性能测试的新方法,通过测试Xen系统传输文件时网络I/O、吞吐量、页翻转次数、CPU

学位

虚拟机虚拟机管理器性能监测xen

基于Web的网络教学系统研究与设计

在线学习管理系统，是一个利用因特网作为平台传送教学内容，实施网上教学，进行网上交流和学习的信息系统。构建在线学习系统平台，可以克服传统课堂教育的局限性，形成一种主动的、协

学位

网络教学系统网上答疑在线学习Web技术安全机制

运动目标检测算法及其应用研究

现代社会正变得日益复杂,人们所面临的安全形势也越来越严峻。在这种情况下,智能视频监控技术得到了广泛的应用。作为智能视频监控技术中的关键底层技术,运动目标检测算法也

学位

单高斯模型运动目标检测拖尾鬼影阴影消除

基于面向构件的线损“四分”管理模型的研究与实现

线损“四分”管理模型是当前供电企业比较成熟的一个业务模型，能够准确从电力部门的各个方面反映出线损率这个国家考核电力企业供电质量的综合经济技术指标，具有重要的理论意义

学位

电力系统公共信息模型面向构件线损四分管理模型J2EE技术

CAD/FEA无缝集成平台CAFIP的设计与研发

在产品数字化设计与仿真过程中,CAD(Computer Aided Design)活动与FEA(Finite Element Analysis)活动需要紧密关联和互动,因此有效的CAD/FEA集成对于改善产品设计过程,降低设计成本,提高设计质量与效率至关重要。然而,现有基于CAD数据交换的简单CAD/FEA集成方式还远远不能满足实际需要。本文针对产品数字化集成设计与仿真的需要,对CAD/FEA无缝

学位

CAD/FEA集成仿真驱动设计FEMCADFEA

基于云计算的网数据容灾关键技术的研究

近年来，随着计算机技术的快速发展，人们对计算机的依赖程度也越来越大，人们对重要数据可靠性的要求越来越高。如果存储在电脑上的重要数据丢失了，所造成的损失往往无法估量，所以对

学位

云计算网络数据容灾技术备份作业数据恢复

面向复杂网络的社区发现算法研究

其他学术论文