社交网络用户分类与社区挖掘算法研究

来源 :华南师范大学 | 被引量 : 0次 | 上传用户:xia226
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交网络(Social Network)是一类可以帮助用户建立好友关系网络,并且可以在好友间分享爱好、兴趣、活动和状态等信息的网络应用服务。近年来,随着互联网等信息技术的发展,微博、微信等社交网络应用也获得了快速的发展,依靠社交网络强大的信息发布、传播以及分享等功能,社交网络吸引了一大批用户,并对人们的日常生活、工作等方面产生了巨大的影响,因此,在今天研究社交网络既符合时代需求,又是将数据挖掘相关理论与实际问题相结合的实践。  社交网络中用户的分析与挖掘存在巨大的挑战。首先,社交网络用户群体数量庞大,有些网络应用用户节点数达到千万甚至是亿万级别;其次,社交网络用户关系具有多样性,不同主题的网络中用户关系的强度、内容不一致。充分利用社交网络中用户的数据对进行分类和聚类对研究大规模复杂社交网络具有重要作用。  本文以社交网络中的用户为研究主体,针对现有社交网络用户分类算法不能有效利用用户属性和链接信息提高分类性能的问题,设计了一种基于马尔科夫模型的用户分类算法,算法的分类过程包括两个阶段:一、通过学习用户属性信息获得用户的初始化类别标签矩阵;二、利用马尔科夫随机游走模型对标签进行迭代推理获得最终的标签分布情况。在用户聚类方面,现有的网络社区挖掘方法由于单一利用用户属性信息或用户关系数据挖掘社区,无法有效发现用户链接紧密且属性高度相关的社区,本文设计了一种能够集成节点属性和链接数据的社区挖掘算法,该算法基于非负矩阵分解模型并通过矩阵联合近似分解方法统一分解社交网络中用户链接矩阵和属性矩阵,最终获得用户与社区归属关系矩阵以及属性与社区关联矩阵,能够保证挖掘社区不仅链接结构紧密而且属性高度相关。
其他文献
Internet的迅猛发展,造就了人类历史上最大规模的分布式海量信息资源库。搜索引擎应运而生,为人们利用网络资源提供了有效的工具,但其自身的不足之处也显露无遗。用户常常无法准
随着数据和数据库的规模急骤增长,如何把数据变换成有用的知识是科学家亟需解决的问题,数据挖掘技术正是在这样的背景下应运而生的。数据挖掘被定义为从大量的数据中提取隐含的
随着科学计算可视化技术和地质信息计算机模拟技术的发展,将可视化技术应用于地质勘探和数据处理中,为地质工作者在3D空间中观察、分析地质现象以及空间分布提供了新的方法和手
短短几年,P2P应用己发展成为工nternet“带宽杀手”,越来越多的人开始使用P2P系统,越来越多的P2P应用被建立。组成P2P系统的节点并不固定,系统必须应对节点频繁的加入和离开,防止
阵列感应测井仪是近几年推出的一种新型感应测井仪器,阵列感应测井具有测井信息多,资料处理复杂等特点。为了更好地利用这类测井资料,本文综合利用测井新技术及面向对象的软件工
本文先从电信企业网网络安全管理策略要求的角度出发,引出实施网络安全域划分所面临的问题:隔离问题。然后一方面紧紧抓住VPN技术逻辑隔离这以技术特点,对MPLS VPN和VPDN (Virt
本文所介绍的基于单幅图像恢复物体三维形貌方法根据单幅图像中场景的灰度变化就可实现0180的三维形貌恢复,其核心思想就是根据单幅图像中物体留下的3D线索—阴影来恢复物体的
如今信息爆炸的互联网时代,尤其是移动应用的不停使用,产生了大量的信息,更有海量的用户群体,如此,因特网所涵盖的信息远远大于任何传统媒体所涵盖的信息,海量用户更是从各种角度、
网格技术是为了满足当前日益复杂的高性能科学计算和分布式资源管理需求而产生的一项崭新技术,由于其具有跨平台访问、服务共享、动态存取和极好的扩展性这些特点,使得其在应
硬件演化技术的用途广泛,特别适用于电子设备需要长期工作、使用环境恶劣、技术人员无法提供及时维修的情况,如自动控制,特别是航空、航天等领域。随着硬件系统(如芯片系统)的复