微博生态环境中的账号角色识别与分析

来源 :北京大学 | 被引量 : 0次 | 上传用户:qg20090908
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,以用户产生内容和社交关系为主要模式的社交化媒体服务取得了迅速发展,以微博为代表的各类社交化媒体服务逐渐成为人们日常生活中不可或缺的一部分。微博不仅成为分享心情、表达观点、与好友互动沟通的新平台,也成为人们快速获取信息的新方式。由于微博具有社交网络属性和媒体属性的双重性,造就了微博生态环境的复杂多样。一方面,微博中出现了一大批仅具有媒体属性,向传统媒体一样专门向用户发布信息的“自媒体账号”,这些账号成为微博生态环境中优秀的内容生产者和传播者。另一方面,由于微博中受关注程度和影响力等指标的重大价值,在微博中同样出现了一大批僵尸粉丝,各种僵尸粉丝买家通过购买关注,企图获取影响力的实际提升。  本文鉴于微博环境的复杂性,分别从微博生态环镜中的自媒体账号和僵尸粉丝账号两个角度入手,研究了它们的识别与分析。本文首先提出了自媒体账号的识别这一研究问题,定义了自媒体账号并说明了自媒体账号与微博认证账号的不同,阐述了研究自媒体账号的意义,并从用户的基本信息、用户发布微博的行为和用户发布的微博内容三个方面对自媒体账号进行识别,实验效果显著。之后研究了僵尸粉丝在微博中的不同等级及其区别,在此基础上提出了更有效识别僵尸粉丝账号的特征并通过实验分析了识别效果。基于上述两部分工作,本文从自媒体账号的僵尸粉丝率以及僵尸买家与自媒体账号之间的关系两个不同角度分析了自媒体账号与僵尸粉丝之间的关系,实验分析结果表明购买僵尸粉丝无法获得实质上的影响力提升。最终,本文设计并实现了一个识别用户僵尸粉丝的应用服务。
其他文献
该文讨论和分析了基于网络和基于终端两种QoS解决策略.基于网络的策略的主要是依靠网络中的路由器和交换机等中间节点提供QoS支持.IETF在这方面提出了一些模型,如综合服务、
该论文课题首先结合社会的需求,对智能化建筑小区做了总体的研究,提出智能化建筑小区系统由大楼自动化、通信自动化和办公化这三部分组成的模型,并对各组成部分的构成、实施
该文首先对多媒体网络技术对教学的影响进行了分析,说明了开发纯软件控制的"多媒体网络教学系统"的必要性.分析了网络通信协议的构成、多媒体数据的特点及多媒体数据压缩方法
该文先从信息安全系统的完整性和当前数据库系统的具体安全威胁两个方面讨论了数据库入侵检测系统的必要性,从数据库系统可以提供的审计数据的角度分析了数据库入侵检测的可
该论文以MPEG-2(ISO/IEC 13818)运动图像及其伴音通用编码标准模型为主线,在深入了解分析MPEG-2标准定义的两种码流:节目流(PS)和传输流(TS)不同应用的基础上,结合研究生期间
本文的应用背景是一个扩充的ERP系统,称为EAC(企业应用协同),它包括ERP、电子商务、客户关系管理、国际贸易、办公自动化和BI(业务智能)等几个部分。 ERP是现代企业中最重要
该文概要介绍了人工智能及分布式专家系统的发展状况,分析了分布式系统的三个关键技术:系统模型、互斥选举算法,以及动态负载平衡,并结合网络计算与分布式计算特点,研究适合
Kademlia是2002年由Petar等人提出的通过分布式哈希表(Distributedhashtable,DHT)构建的DHT网络,凭借简洁高效的搜索机制,在当前互联网上得到了大规模部署和应用。以eMule和BitT
中国企业信息化总体上还仍然处于初级发展阶段,大多数企业在企业信息化建设中面临着许多困难,由于专业知识的贫乏,面对快速发展的技术、频繁推陈出新的产品、飞速升级的软件
该文提出的求解数值多目标优化问题的新的演化算法不仅具有搜索的遍历性与收敛的单调性等特点,所求出来的解集也具有良好的分布性,是一种鲁棒的求解多目标优化问题的通用算法