论文部分内容阅读
网络技术的飞速发展带来了数据的爆炸式增长,推荐系统作为大数据时代人们过滤垃圾信息、提取有效信息、提升长尾信息曝光度的重要手段,受到了研究者的关注。而社交媒体在互联网发展中的地位不可忽视,相应地,社会化推荐研究日益升温。 社交网络的发展趋势是内容多媒体化、操作简便化。代表性的网络有图片分享网站Flickr、社交策展网络Pinterest、花瓣网等。如何充分利用这些新型的社交网络中的数据形成有效推荐,这将是社会化推荐研究面临的新的挑战。 论文针对新型社交网络,开展社会化推荐算法研究。具体工作如下: 1、研究三个新型社交网络平台Flickr、Pinterest和花瓣网的发展、网页接口特征和数据特性,针对其接口特征设计了相应的数据采集程序,使用深度网络爬虫和聚焦爬虫技术相结合的手段采集社交网络数据,为推荐算法实验做数据准备; 2、提出了物品重要度加权的概率矩阵分解推荐算法。通过分析Flickr社交网络中的数据,考虑到全体用户的点赞行为和群组用户的评分具有不同的特点,类比社会化推荐中用户影响力的概念,利用用户对物品的点赞行为和时序序列,设计了静态、动态两种方法进行物品重要度建模。然后利用物品重要度模型对概率矩阵分解推荐算法进行改进,通过提升重要物品对模型迭代的代表性和影响力,提升推荐预测评分的准确度; 3、提出了基于转发链相似度的加权Slope One推荐算法。通过分析新型社交策展网络中收藏条目转发链的特点,从信息流向角度采用莱文斯坦距离计算转发链相似度,以此为依据,提出一种改进的Slope One推荐算法,用于对网络用户推荐关注用户。用花瓣网的数据测试表明,提出的算法有效可行。