论文部分内容阅读
随着人们生活方式与沟通方式的改变,社会网络在信息技术的基础上涵盖了大量个人和企业等相关信息,由于各个领域对社会网络中数据的科学研究和数据挖掘等方面的分析与应用,会导致大量用户隐私的泄露,其中由于加权网络的权重和最短路径引起的用户大量的隐私泄露,正逐步演变为隐私保护研究的重点和难点。攻击者会利用边的权重序列对节点进行识别,同时,现有对最短路径隐私保护方法对网络结构有很大的改动,并且无法确保社会网络数据发布的有效性。基于所提出的问题,本文对加权社会网络中的边权重序列和最短路径属性攻击,提出了更加有效的防御算法。本文研究的主要内容如下:1.现有加权社会网络的权重隐私保护主要是利用高斯乘法和直方图匿名的方法构建网络,缺少由于边的权重序列引发的隐私泄露问题的研究,并且对数据的有效性考虑不足。在此基础上,本文将利用向量集结合组内直径距离和节点的相对距离实现权重序列的隐私保护。该算法在一定程度上可保证数据有效性,同时可以抵御来自权重序列方面的隐私攻击。2.在k-匿名的基础上通过添加边或删除边构建成k个最短路径完成隐私保护,这种方法对社会网络的结构会产生很大的影响,且对于每个节点对间的最短路径隐私级别来说只能是k。基于此,本文将网络中所有的边分成三种类别:未访问的边(7)NE(8),部分访问的边(7)PE(8)和必访问的边(7)ME(8),利用权重比例策略对边进行调整。若没有k条路径实现至少k条最短路径的要求,则算法直接返回当前结果,利用隐私级别公式计算其隐私值。该算法比已有算法更加灵活,数据有效性高,并且隐私级别是可量化的。综上所述,对于权重序列攻击所提出的向量集结合组内直径距离和节点的相对距离的算法,可以提高社会网络发布数据的隐私性和有效性。对于隐私级别达不到k所提出的权重比例结合衡量隐私级别公式的算法,可以提高发布数据的隐私性。