论文部分内容阅读
随着博客、微博、论坛、社交网站等的迅速普及,社会网络越来越成为人们生活中不可或缺的一部分,社会网络分析已经成为一个越来越重要的研究课题。现实世界中社会网络广泛存在,这些网络中通常存在有些节点间的联系较紧密而另一些节点间的联系较稀疏的普遍现象,那些联系紧密的节点之间就形成了一种被称为社区的子结构。 实际生活中的社会网络大多数都是多关系社会网络,而传统的社会网络分析方法基本上都是基于这样的假设:一个网络中只有一个关系,显然这种假设是片面的。随着社会网络分析研究的深入,我们发现单一的关系对网络的真实结构并不能进行很好的刻画,因为在真实世界网络中的对象间总是存在着复杂多样的关系,而且这些关系在不同的情形中扮演着不同的角色起着不同的作用,每一种关系构成了一个网络。在多关系社会网络中,各关系之间相互渗透和影响,具有一定的内在联系。从单关系社会网络到多关系社会网络的发展,是社会网络分析领域的一个重大进步和突破。 多关系社会网络中的社区发现研究具有很强的现实意义。传统的社区发现算法要么只考虑成员之间的邻接关系,即无论发生了几次联系都记为“1”,要么只考虑联系的频繁度,都忽略了联系的重要度这个重要因素。基于此,本文受效用挖掘理论的启发,对社区结构进行了新的定义,提出了一种基于效用的多关系社区发现算法,该方法既考虑了社区成员联系的频繁度又考虑了联系的重要度,使得挖掘出来的社区更具有实际意义。 本文主要对多关系社会网络做了以下几个方面的研究: 首先,将效用挖掘的思想引入到社区挖掘中,定义了社区效用函数,并将效用函数值作为社区成员之间的相似度,它兼顾了社区成员之间联系的频繁度和重要度,使得社区划分的结果更符合实际更具有指导意义。 其次,对多关系社会网络及其社区挖掘的相关理论进行了深入研究,分析了多关系社会网络的特点,对比研究了几种常用的社区挖掘算法。 此外,研究了几种常用的计算相似度的方法以及社区评价方法,并在此基础上提出了基于效用的社区发现算法,并将算法扩展到了多关系社会网络中。 最后,分别在模拟和真实数据集上进行了大量实验,并与传统的社区挖掘方法进行了对比,表明算法具有良好的时间性能和误差控制,验证了本文所提算法的合理性和有效性。