论文部分内容阅读
过去十年的时间里,在迅猛发展的新一代web技术的推动下,互联网服务形式发生着质的改变。以用户参与为核心的web应用如雨后春笋般的涌现出来,其中最为典型的就是在线社交网络。在线社交网络以其丰富的服务形式吸引了数以亿计的用户。这些丰富的用户资源,不仅贡献了海量的用户行为数据,为观察和研究人类行为提供了新的机会,同时还为现代政治经济活动开辟了新的拓展渠道,成为政府、商业界、学术界关注的焦点。 本文在研究社交网络用户特征和影响力评价的过程中,选择了国内典型的社交网站腾讯微博作为数据的来源。分析了腾讯微博用户的总体特征,基于用户特征讨论了用户影响力的评价方法,考察了不同用户群体在信息传播活动中的差异。 首先,为了使研究工作建立在真实用户数据的基础上,本文首先从互联网大规模数据获取技术入手,利用网络爬虫的思想,实现了一个针对腾讯微博用户的数据采集爬虫,并最终获得超过1万5千条用户数据。在获取真实微博用户数据的基础上,对个体用户的基本特征进行统计分析。之后依据共同熟人的思想,对用户关系数据进行二次提取,剔除边缘用户,构建出一个结构更紧密的小规模网络。分析显示,腾讯微博用户总体活跃度偏低,入度出度均符合无尺度特性,但用户听众数量差异大于收听数。另外提取出的网络密度更高,小世界特征更为明显。 其次,讨论了社交网络用户影响力的内涵,从传统社会网络中心性分析和网页链式分析两个角度,结合社交网络用户特征,评价了用户在网络内的影响力,利用前文中构建的用户关系网络进行实证研究,给出了最大度、接近度、中介度以及基于人气指数权重分配法改进的Pagerank算法的影响力评价结果。并对结果进行了相似度分析,对比了不同算法间的差异。分析认为,最大度只评价用户直接影响力,算法效率最高,而其余三种算法均考虑了影响力的多级传播。另外,不同算法识别的高影响力用户之间存在一定差异,但总体上来看最大度与中介度的结果最为接近,接近度与中介度差距较大。也就是说,听众越多的用户在信息传播的过程中作为传播中介的能力越强,但与其他用户距离近的用户却不具有明显的中介作用。 最后,考虑到微博的社会媒体特性以及在现代信息推广中的价值,本文从信息传播的角度考察了高影响力用户在信息传播过程中发挥的作用。构建微博独立级联传播模型,将不同影响力评价模型识别的高影响力用户作为起始影响节点,测试了对网络中其他用户的影响能力。同时观察了受众对象对传播能力的影响,提出了基于传播指数的差异式影响策略。传播实验结果显示,最大度在传播模型中表现最佳,表明微博中拥有高受众规模的用户比具有优质人脉的用户更具有传播价值。另外,高影响力用户的受众对象对传播范围有明显影响,差异式影响策略能够有效提升初始用户群的整体影响效果。 作为一个新型的社会媒体平台,社交网络不仅在潜移默化中改变着人们的生活方式,同时也已经融入了政治经济活动的方方面面。研究社交网络的目的就在于发现社交网络发展中存在的问题,挖掘潜在的价值,推动社交网站不断完善,同时为人类社会生活提供更大便捷。