论文部分内容阅读
随着以互联网为代表的网络信息技术的迅速发展,人类社会已经迈入了复杂网络时代,而链接预测则是将复杂网络和信息科学联系起来的重要桥梁之一,并且可以作为准确分析社会网络结构的有力辅助工具。在实际应用中,对一些个体之间未来或潜在的关系作出预测,有着非常重要的意义。如在社会网络中,链接预测可以对用户进行在线社交推荐、发现人际之间潜在的联系。在生物系统领域的研究过程中,链接预测可以用于揭示蛋白质相互作用网络和新陈代谢网络节点之间存在的相互作用关系等等。链接预测的研究不但具有广泛的实际应用价值,也具有重要的理论研究意义。例如,它可以帮助人们从理论上认识复杂网络系统的演化机制,并提供一个简单统一且较为公平的比较平台,从而推动复杂网络演化模型的理论研究。然而当前复杂网络链接预测研究主要集中在算法性能的提升上,而忽略了网络中节点的属性特征或者网络本身存在的时序特征等。并且,现实中网络存在的高维性、稀疏性、冗余性等问题对链接预测算法也造成了负面的影响。因此,本文在深入研究国内外各种链接预测技术的基础上,讨论分析了目前国内外有关链接预测的研究现状,分别针对普通网络、带有属性的网络和带时序信息的高维稀疏性网络进行了研究。取得的研究成果如下:(1)提出了一种基于蚁群优化的链接预测算法在普通网络和节点带有属性的网络中,我们从群体智能的角度,提出了一种基于蚁群优化的链接预测方法。根据网络的拓扑信息设置节点之间的信息素与启发式信息,蚂蚁根据其概率公式进行路径的选择,使用边的重要性作为适应度值的指标来衡量蚂蚁所形成的每一条路径,在蚂蚁的正反馈机制下,越相似的节点对之间蚂蚁游走就越频繁,链接它们边上的信息素就越大。因此,我们将迭代更新后节点间的信息素作为链接预测节点之间的相似度评分。实验结果显示,基于蚁群优化的链接预测算法和传统的链接预测算法相比,在模型上更加直观,并且具有高效、鲁棒性等优点。(2)提出了一种对网络中指定顶点进行链接预测的算法在网络的链接预测中,为了针对某一个指定的节点进行链接预测,我们将节点的链接查询局限于以此节点为中心的某一个子图中,使得在此子图中所有节点与该节点之间的相似性皆大于一个阈值。而在子图以外的节点与该节点之间的相似性皆小于这个阈值,可视为这些节点之间可能不存在链接。我们把每一个节点抽取的子图称为其对应的信息核,我们根据随机游走的策略从理论上推导出阈值的计算公式,并且在实验中证明此方法不仅能够降低预测算法的时间复杂度和数据存储的空间复杂度,而且能够有效地提高预测的性能。(3)提出了一种基于非负矩阵分解的链接预测算法在实际网络中,信息矩阵存在着高维、稀疏性、冗余等问题,我们将非负矩阵分解应用于网络的链接预测中,将原始矩阵分解成两个非负的基矩阵和权重矩阵,通过高维向量空间向低维向量空间的投影,重构不同类型矩阵之间的相关性。我们还针对单分网络和二分网络分别提出了直接预测和基于K近邻的资源分配策略,在对目标用户进行预测的过程中,资源只在其K个近邻之间进行传递,该算法在保持低时间复杂度的同时,不仅减少了数据的存储空间,而且能够有效地提高预测的性能。(4)提出了一种基于时序信息的个性化推荐算法在含有时序信息的网络中,我们首先分析了考虑时序信息和不考虑时序信息对推荐算法性能造成的影响,并且通过滑动窗口对网络信息核提取后发现:只需少量的历史信息,推荐算法就可以取得较高的性能,而且不同用户对信息核的需求也不同。因此,我们提出了一种基于时序信息的个性化推荐算法,对不同用户根据其流行度设计出用于信息核提取的滑动窗口控制方法。对于不活跃的用户,扩大其滑动窗口的范围;对于活跃的用户,缩小其滑动窗口的范围。在推荐的过程中,我们将滑动窗口内不同用户的时序序列进行比对,得出用户之间的相似性,最后根据用户之间的相似性得出用户对商品的评分。实验结果表明,我们提出的算法不仅能够大幅地过滤掉目标用户的冗余信息,而且能够对含有时序信息的网络进行有效的个性化推荐。