复杂网络的链接预测及其在推荐中的应用

来源 :南京航空航天大学 | 被引量 : 3次 | 上传用户:gm5w56002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着以互联网为代表的网络信息技术的迅速发展,人类社会已经迈入了复杂网络时代,而链接预测则是将复杂网络和信息科学联系起来的重要桥梁之一,并且可以作为准确分析社会网络结构的有力辅助工具。在实际应用中,对一些个体之间未来或潜在的关系作出预测,有着非常重要的意义。如在社会网络中,链接预测可以对用户进行在线社交推荐、发现人际之间潜在的联系。在生物系统领域的研究过程中,链接预测可以用于揭示蛋白质相互作用网络和新陈代谢网络节点之间存在的相互作用关系等等。链接预测的研究不但具有广泛的实际应用价值,也具有重要的理论研究意义。例如,它可以帮助人们从理论上认识复杂网络系统的演化机制,并提供一个简单统一且较为公平的比较平台,从而推动复杂网络演化模型的理论研究。然而当前复杂网络链接预测研究主要集中在算法性能的提升上,而忽略了网络中节点的属性特征或者网络本身存在的时序特征等。并且,现实中网络存在的高维性、稀疏性、冗余性等问题对链接预测算法也造成了负面的影响。因此,本文在深入研究国内外各种链接预测技术的基础上,讨论分析了目前国内外有关链接预测的研究现状,分别针对普通网络、带有属性的网络和带时序信息的高维稀疏性网络进行了研究。取得的研究成果如下:(1)提出了一种基于蚁群优化的链接预测算法在普通网络和节点带有属性的网络中,我们从群体智能的角度,提出了一种基于蚁群优化的链接预测方法。根据网络的拓扑信息设置节点之间的信息素与启发式信息,蚂蚁根据其概率公式进行路径的选择,使用边的重要性作为适应度值的指标来衡量蚂蚁所形成的每一条路径,在蚂蚁的正反馈机制下,越相似的节点对之间蚂蚁游走就越频繁,链接它们边上的信息素就越大。因此,我们将迭代更新后节点间的信息素作为链接预测节点之间的相似度评分。实验结果显示,基于蚁群优化的链接预测算法和传统的链接预测算法相比,在模型上更加直观,并且具有高效、鲁棒性等优点。(2)提出了一种对网络中指定顶点进行链接预测的算法在网络的链接预测中,为了针对某一个指定的节点进行链接预测,我们将节点的链接查询局限于以此节点为中心的某一个子图中,使得在此子图中所有节点与该节点之间的相似性皆大于一个阈值。而在子图以外的节点与该节点之间的相似性皆小于这个阈值,可视为这些节点之间可能不存在链接。我们把每一个节点抽取的子图称为其对应的信息核,我们根据随机游走的策略从理论上推导出阈值的计算公式,并且在实验中证明此方法不仅能够降低预测算法的时间复杂度和数据存储的空间复杂度,而且能够有效地提高预测的性能。(3)提出了一种基于非负矩阵分解的链接预测算法在实际网络中,信息矩阵存在着高维、稀疏性、冗余等问题,我们将非负矩阵分解应用于网络的链接预测中,将原始矩阵分解成两个非负的基矩阵和权重矩阵,通过高维向量空间向低维向量空间的投影,重构不同类型矩阵之间的相关性。我们还针对单分网络和二分网络分别提出了直接预测和基于K近邻的资源分配策略,在对目标用户进行预测的过程中,资源只在其K个近邻之间进行传递,该算法在保持低时间复杂度的同时,不仅减少了数据的存储空间,而且能够有效地提高预测的性能。(4)提出了一种基于时序信息的个性化推荐算法在含有时序信息的网络中,我们首先分析了考虑时序信息和不考虑时序信息对推荐算法性能造成的影响,并且通过滑动窗口对网络信息核提取后发现:只需少量的历史信息,推荐算法就可以取得较高的性能,而且不同用户对信息核的需求也不同。因此,我们提出了一种基于时序信息的个性化推荐算法,对不同用户根据其流行度设计出用于信息核提取的滑动窗口控制方法。对于不活跃的用户,扩大其滑动窗口的范围;对于活跃的用户,缩小其滑动窗口的范围。在推荐的过程中,我们将滑动窗口内不同用户的时序序列进行比对,得出用户之间的相似性,最后根据用户之间的相似性得出用户对商品的评分。实验结果表明,我们提出的算法不仅能够大幅地过滤掉目标用户的冗余信息,而且能够对含有时序信息的网络进行有效的个性化推荐。
其他文献
本文研究了交联淀粉和乙酰化淀粉的制备工艺。结果表明,交联反应的工艺条件为:淀粉浓度38~46%,反应温度为35~60℃,反应时间为 2~7 h,pH值为10.5~12.0,NaCl用量为 2—6 g/100g淀粉,
克罗恩病(Crohn disease,CD)属于炎性肠病(inflammatory bowel diseases,IBD),临床表现为消化道节段性的炎性损伤,严重影响患者的生存质量。该病在欧美国家较常见,近年来由于
探地雷达是近年来发展起来的一种物探新技术新方法。介绍了其基本原理及在岩溶地质勘探、地下管线探测、高速公路检测中应用的实例分析,重点阐述了雷达图像的推断解释,同时表
大气压大面积介质阻挡弥散放电等离子体由于其不需要在真空下运行,而且可实现在线连续工作,所以在纳米粉末合成、材料表面改性、生物医学、环境工程等领域都展示出了重要的应
背景由于当今社会正朝着老龄化社会不断演变,因此关注老龄化相关疾病的研究显得格外重要。心血管循环系统是维持人体正常生命活动的重要组成部分,然而心脏的再生能力十分有限
从历史渊源来看,今天的广府人其实是汉唐以后不断南迁的汉民族与早期居住在珠三角一带的越民族逐渐融合的产物。从明初开始,受朝廷户籍制度等的影响,同时为了保护家族的利益,
目的研究不同严重程度的糖尿病肾病患者血清胆红素水平之间有无差异,探讨它与糖尿病肾病的关系。希望血清胆红素能作为一项有效的检测糖尿病肾病的指标,广泛应用于临床,预测
近年来在对大肠肿瘤的研究中发现 ,H2 受体拮抗剂西咪替丁可以直接或间接地抑制大肠癌的生长 ,提高患者术后的生存率 ;其机制主要是通过拮抗肿瘤某些营养因子 ,增强患者的免
非标准的数据会给系统开发和运维带来困难,保险企业信息系统需要一个标准化的数据平台作为支撑。数据标准化显得尤为得要,需要制订一个标准去标准数据。标准的制订分为4个阶段:
吞咽障碍是脑卒中患者常见的症状之一,吞咽障碍可导致患者营养不良、误吸并诱发肺部感染,影响患者预后。本文就近年来脑卒中后吞咽障碍的中医治疗包括中药、针灸、针药结合治