论文部分内容阅读
现实世界中很多系统都可以用复杂网络来表示,其中节点代表实体,连边代表实体间的联系。链路预测作为复杂网络领域的基础且重要的问题之一,目前仍然是一个开放性的问题,而且其相关问题也不断涌现。近年来,随着机器学习特别是深度学习在欧式结构的数据上取得突破,使用深度模型处理非欧结构的网络数据在学术界方兴未艾。本文就链路预测及其相关问题做了较为深入地研究,分别从如下三个方面入手,提出了一系列基于机器学习的改进方法:(1)基于层次注意力机制的链路预测算法:传统的基于相似性指标的链路预测算法在网络连边稀疏的情况下,难以提取有效的结构信息。受注意力机制的启发,本文提出一个基于层次注意力机制的端到端链路预测算法。该模型包括节点以及连边等两种层次的注意力机制,能自适应地学习到有效的局部拓扑信息。在多个实际网络中实验验证,尤其是在路由器、电力等稀疏网络里,本文提出的算法相比相似性指标以及图嵌入算法,具有明显提升。同时通过限制训练集大小,证明了本文方法的鲁棒性。(2)基于多元网络特征融合的链路权重预测算法:不同于预测连边是否存在,在加权网络里,由于信息缺失等原因,需要预测连边的权重。本文提出一个基于多元网络特征融合的链路权重预测算法。具体地,通过网络变换将原始网络转化为连边网络,然后用连边网络的节点中心性定义原始网络的连边中心性,最后融合原始网络的节点相似性特征以及连边网络的节点重要性特征,预测原始网络的连边权重。通过多个实际网络的实验验证,本文提出的方法较对比算法具有更好的预测效果。进一步的,本文也验证了连边网络对于权重预测的互补作用。(3)基于进化计算的链路隐匿算法:出于隐私安全的角度出发,本文提出链路预测的反问题,即链路隐匿。本文将链路预测视为攻击方获取隐私连边的手段,防守方需要采取一些保护措施避免隐私连边泄露。具体地,本文提出两种基于进化计算的链路扰动机制。为了加速适应度函数的计算,本文也提出一种增量更新的方法。多个实际网络中的实验验证表明,本文的算法相比于对比算法具有最好的防御效果。同时通过不同的链路预测算法验证,本文的方法具有良好的迁移性。