线上社交网络信息传播的研究与实现

被引量 : 0次 | 上传用户:phirst
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交网络平台的迅速发展,人们在社交网络上的活动越来越多,以国内新浪微博为例,在2013年微博用户数已达到6亿。因此越来越多的研究者将在线社交网络作为研究对象。在在线社交网络中,用户可以讨论自己的想法,发表自己的意见,表达自己的兴趣等,所有这些行为产生了大量的社交数据。其中,如何对信息在整个网络上的传播进行模拟成为一个热点研究话题。转发行为是组成信息传播的原子行为。因此,本文先从影响转发行为的因素出发得出转发概率,然后提出了基于转发行为的信息传播模型,最后在真实的数据集中对信息传播进行了模拟。实验表明,提出的模型能够克服传统模型中固定转发概率带来的同质性,能够更好地模拟真实信息传播过程。具体工作如下:微博数据的抓取。本文搭建了基于Hadoop的分布式微博数据抓取平台。在八台机器上,对微博的用户数据、关系数据和文本内容数据进行了抓取。转发行为的分析。通过对微博数据分析来选择合适的特征和相应的模型。利用相应的特征和模型,得到用户之间的转发概率,本文对每个用户采用了逻辑回归模型来进行数据拟合,首先对数据进行预处理,提取出相应的特征,将处理后的数据输入逻辑回归模型进行训练,最后根据模型得出每个用户的转发概率。信息传播模型的模拟。首先,在微博数据中抽取出网络结构。由于用户之间的转发组成了信息的传播,根据转发行为的分析,本文提出了pSIS?与pIC?传播模型。最后,在提取的网络中进行了传播模拟的实验。通过实验,本文发现了一些新的现象:在传播模型中,拥有固定转发概率的信息传播虽然在传播范围上跟真实社交网络中相同,但其传播速度明显低于真实网络中的信息传播。另外,初始信息发布人的选择对于信息传播也是非常重要的,经过研究表明某种程度上这种选择可以使我们做出有效的策略来控制谣言的传播与舆情监控。
其他文献
用水模式是动态模型建立的必要步骤,是节点水量时间分配的关键。随着经济的发展,用户水量数据远传逐渐增多,这为用水模式的获取提供了极大的便利条件。通过对Z市典型用户的调
赛珍珠的《大地》在改变中国及中国人在西方人心目中的形象起着非常重要的作用。在此之前,美国东方主义思想泛滥,中国的文化被神秘化和离奇化。《大地》中对中国社会客观的描
"安倍经济学"作为日本试图摆脱经济低迷的经济政策广受各方关注。随着2013年6月最后一支箭——"经济增长战略"的颁布,"安倍经济学"三支利箭均已射出。截至目前,其所引发的短
国际商事仲裁临时措施的发布问题是一个讨论已久的问题,至今没有达成一个统一的国际公约。目前的最新成果是2006年UNCITRAL通过的《国际商事仲裁示范法》,其用了整整一章来规
<正> 人类要想了解自己十分困难,要想了解本民族文化也不容易。然而,又必须了解。如果不了解自己,就看不清自己所处的社会位置;如果不了解本民族的文化,就无法促进本民族文化
目的:分析临床医院住院药房应用PDCA管理退药率降低情况。方法:医院于2016年开始在住院药房实施PDCA管理,以2015年1月~2015年12月期间医院住院药房退药数据为对照组,以2016年
<正>中国广告协会的统计数据显示,2015年1至5月,全国报纸广告平均降幅达32%,其中房产行业降幅达44.5%。一方面,客户普遍压缩报纸的广告投放;另一方面,偶尔"给面子"投个硬广告
【目的】研究L-肉碱强化卤虫对草鱼开口苗生长性能的影响,为草鱼开口苗培育技术的完善提供参考。【方法】用0(对照),1,100,1000mg/L的L-肉碱强化卤虫无节幼体(Artemia sp.)12
井下综采工作面是一个由采煤机、带式输送机、刮板输送机、转载机、破碎机、瓦斯与监控系统、供电系统等部分组成的复杂体系。能否实现安全、稳定的供电,对综采工作面的正常
<正>这幅画完成于1889年5月,在1892年被凡高的朋友以300法郎的价格卖出。在1988年,这幅画被拍出了5300万美元的天价。鸢尾花是画家本人很喜欢的一种花,这幅画是他画的多幅鸢