论文部分内容阅读
基于位置的社交网络(location-based social network,LBSN)提供了用户的在线网络关系和签到(check-in)的空间时间等多重信息,连接了虚拟网络和现实生活,不仅丰富了人们的网络生活,也为数据挖掘和移动互联网等领域提供了新的研究方向。LBSN的好友关系预测作为其中的一方面,通常考察网络结构和空间位置维度的信息,预测特征分析较单一。此外,LBSN具有网络结构稀疏、预测空间大等特点,也对系统预测性能提出了挑战。本文针对以上问题,在传统的基于用户相似性的链接预测方法基础上,提出新的LBSN链接预测系统框架,Brightkite和Gowalla网络数据仿真结果表明该系统具有良好的预测效果。本文的主要工作和贡献包括:1.采用典型的基于位置的社交网络Brightkite和Gowalla数据集,挖掘LBSN网络结构和用户签到行为特征。分析表明用户签到次数、地点数以及签到地点的访问人数、访问量均呈长尾分布,同时发现部分相对孤立的用户和地点,需要对数据进一步处理。2.去除地点关系网络(the Co-location Network)中的孤立点,解决“僵尸”用户问题,避免采用朋友-地点关系(the Co-located Friends Network)网络造成保留的用户过少。3.采用Louvain算法对网络进行社区划分,在减小预测空间和计算时间的同时提高链接预测平均准确率。4.从网络结构和用户签到行为多方面挖掘用户相似性,提出两类基于签到时间和签到频率的新的LBSN链接预测测度,统计分析各指标与用户间建立链接的平均概率相关关系。5.建立基于相似性的LBSN链接预测系统框架,进行非监督和监督式链接预测仿真,分析各指标预测性能。实验结果表明,相比传统的基于网络结构和签到地点预测特征,系统加入基于签到时间和签到频率的预测特征后,整体预测效果明显改善,预测准确率和F1值最高分别提升15.5%和7.4%。