论文部分内容阅读
近年来,复杂网络在学术界得到了广泛关注,而研究复杂网络的社区结构更是成为了重中之重。现实生活中复杂网络往往带有明显的社区特点:社区之内的点连接紧密,社区之间的点连接稀疏。而如何对已有的复杂网络进行社区检测则成为了目前研究人员的关注热点。社区检测的目的就是发现隐藏在网络中的社区结构,其对理解网络的功能,探索隐藏在网络中的信息,追踪网络的行为有重要意义。很多有效的算法已被提出用于社区检测,然而大多数研究都是针对一般的网络,只关注网络的拓扑结构。真实的网络通常具有更丰富的信息,比如带属性社交网络,除了用户之间的好友关系,每个用户都有诸如年龄、性别、大学毕业院校、爱好等属性信息。此外,自我网络中的社区具有重叠现象。本论文一方面设计了一个基于多智能体的快速社区检测算法,另一方面对属性网络和自我网络社区检测进行了深入研究,主要工作总结如下: 基于多智能体进化算法的社区检测:进化算法是依据全局选取产生后代,然而在实际自然选择的过程中,个体间的互动常常发生在一定的局部环境中。因而,多智能体进化算法应用而生,它的特点是种群规模小,收敛速度快,算法的稳定性更高。本文把多智能体进化算法应用于社区检测,提出了一种基于多智能体进化的复杂网络社区检测算法(MAGA-Net),用于优化网络的模块度。一个智能体,代表网络的一种划分,是一个候选解。设计了基于合并与分割的邻域竞争、混合领域交叉、自适应变异和自学习算子。在真实网络和人工基准网络进行了大量实验,结果表明MAGA-Net算法能有效处理具有5000节点的网络。与已有两个算法的系统比较显示了其快速、准确和稳定性。 基于结构和属性相似度的属性网络社区检测多目标进化算法:属性网络用户除了拥有丰富的边连接关系之外,还拥有丰富的属性信息,比如:年龄,爱好,高中毕业学校,职业,政治立场等。边连接关系是一种强关系,有边相连的两个用户,我们有足够的确信度说明他们属于一个圈子。而属性是一种弱关系,属于同一个圈子的用户往往在某些属性上趋于一致。结构和属性信息对于社区检测来说都是有用信息,如何平衡结构与属性充满挑战。我们将多目标进化应用于属性网络社区发现,提出了基于结构和属性相似度的属性网络社区检测算法(MOEA-SA)。设计了评价属性相似度的指标 S A,应用了混合编码,提出了一个基于多个体的变异算子和基于领域的修正算子。在单属性Facebook社交网络、多属性Facebook自我网络和多属性文献索引网上进行了大量实验。评价指标密度 T和熵 E用于评价所得划分的好坏。与已有算法的对比显示了MOEA-SA的优越性能。我们进一步利用“膝点”决策给决策者提供最好的折中解。 多属性自我网络中的社区检测:近年来随着Facebook、Twitter、微信和Google+等社交网络的飞速发展,迫切需求针对社交网络的社区发现方法。然而,社交网络节点数以亿计,很难有效的对其进行社区划分。自我网络表示社交网络中一个节点所有好友(不包括本身)所组成的网络,其规模小,很实用,带属性,还有一个特别重要的特点就是社区之间的重叠广泛存在。因此,我们提出了一个基于多目标进化的多属性重叠自我网络社区检测算法(OMOEA/D-SA),应用了基于排列的编码方式,设计了基于局部结构和属性紧密度的解码方式。在多属性 Facebook自我网络上进行了实验,结果表明 OMOEA/D-SA能有效检测出有实际意义的重叠社区划分,可用于自动好友分类。