动态社会网络数据发布个性化隐私保护方法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:toveyhzh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
“社会网络”是指社会个体成员之间因为互动而形成的相对稳定的关系体系,关注的是人们之间的互动和联系。近年来,新浪微博、Facebook、QQ空间等综合社会应用得到用户的青睐,成为人们沟通交流、获取信息和展示自我的重要途径之一。除了这些典型的社会网络,与我们日常的工作和学习密不可分的邮件收发网络、论文合作网络、电话接听网络等也属于社会网络,同样有着个体之间的交互。用户在社会网络中的活动产生了庞大的数据,这些数据通常被称为社会网络数据。近年来,随着社会网络的发展,数据泄露事件频发;同时,大数据挖掘的广泛应用,造成社会网络公开发布的数据和泄露的数据进一步暴露隐私,用户隐私面临威胁。  目前,社会网络中用户个性化隐私保护主要针对单实例发布的静态网络,即数据发布后不再进行任何改变,不能适应具有高度动态性的社会网络的更新迭代过程。比如,攻击者可以根据2次单实例匿名的社会网络分析出社会网络图中结点的度信息变化,结合其背景知识进行分析,获取用户隐私。其次,用户的个性化隐私保护方案较少,难以满足数以亿计的社会网络用户的隐私保护需求,用户偏好设置上只考虑了用户隐私保护程度这一单一的偏好,忽略了用户发布的社会网络数据可用性。因此,开展动态社会网络隐私保护方法研究,满足用户的个性化隐私保护需求,同时确保数据的可用性变得非常重要。  本文开展动态社会网络数据发布个性化隐私保护研究,定义了数据保护个性化模型,支持隐私保护强度与数据可用性2种隐私偏好,提出基于匿名规则的图数据隐私保护方法与基于隐私偏好的二次匿名位置属性隐私保护方法。使用新浪微博数据和SNAP公开的某研究机构邮件收发数据进行验证,对数据安全性和可用性相关指标进行了评估,实验结果表明本文方法兼顾了用户隐私保护和数据的可用性的个性化需求。论文的主要贡献包括以下几个方面:  1.提出了一种动态社会网络数据发布隐私保护个性化模型  隐私保护个性化模型从用户的角度出发,定义了隐私偏好,描述用户个性化隐私保护需求,兼顾隐私保护和数据可用性的平衡。用户隐私保护级别计算,包括一致性判断、互斥性判断和隐私偏好融合。根据隐私保护级别进行隐私保护参数计算,如时间窗口、匿名阈值、匿名距离等,支持不同隐私保护方法的个性化参数计算,支持社会网络好友分组信息映射。为动态社会网络数据发布中的个性化隐私保护方法奠定基础。  2.提出了一种基于匿名规则的动态社会网络图数据隐私保护方法  针对社会网络数据发布的动态性与不安全性,为避免使用不同时刻的社会网络数据进行关联攻击,兼顾结点属性多样性,提出了一种图数据隐私保护方法。根据匿名规则进行结点聚类,求解当前时刻的匿名图,保证同一个匿名集中结点属性多样性最大的前提下,数据发布后的结点属性与边的泄露的概率均小于1/k。之后生成相邻时刻数据关系图的差集,结合当前时刻的匿名图,删除前序时刻不存在的结点与边,对已发布数据进行逆向更新,保证不同时刻下的匿名图具有相似的图结构,抵御关联攻击。  3.提出了一种基于隐私偏好的二次匿名位置属性隐私保护方法  针对社会网络中签到功能的位置隐私泄露问题,利用社会网络已有的好友分组信息设置隐私偏好,生成具有不同隐私保护强度的分组可见的匿名签到位置,代替用户真实位置。首先,利用用户对不同好友分组设置的隐私偏好,计算隐私偏好等级,确定该级别k值,结合用户历史位置信息求解k-1个匿名点,使k匿名集中的点具有最大概率相似性;在此基础上使用差分隐私技术进行二次匿名,分别计算好友分组匿名签到位置,使不同分组的好友看到不同签到位置,既保护了位置隐私又确保签到位置可用。
其他文献
企业信息系统在运行的过程中会产主大量的数据和信息,如何分析和处理这些数据以获得对企业有用的决策信息越来越成为系统开发人员关心的问题.数据仓库所要研究和解决的问题就
随着互联网的快速发展,用户对Web服务需求的不断增长,出现了大量不同种类、功能各异的Web应用。Web应用较传统应用具有其特殊性,并且其基于互联网和面向用户大众化的特性,决定了
该文首先回顾了语料库建设及语料库语言学的历史,介绍了国内外语料库建设的现状,着重介绍了国家语料库建设的基本情况,因为该文的工作就是在参与国家语料库建设课题的研究中
该文以教育部面向21世纪现代远程教育工程——数字化博物馆项目为应用背景研究实现基于头盔显示器在(HMD)的沉浸式虚拟现实系统在数字博物馆中的应用.该文研究完成的主要工作
该文首先从WEB技术着手,系统地概述了基于TTS的Web浏览器系统中涉及到的常用Web技术,包括:HTTP协议、HTML语言等.然后对当前的中文信息处理技术进行了分析,介绍了当前的多种
该文针对过程设备设计中经常遇到的问题,以AutoCAD的二次开发技术为手段,运用DCL、PDB、AutoLISP编程、菜单定制等二次开发工具,提出了过程设备计算机辅助设计中一些问题的解
目标跟踪是计算机视觉领域十分重要的研究课题。它在视频监控、自动驾驶和人机交互等领域有着广泛的应用,具有很高的研究意义和应用价值。虽然过去几十年来目标跟踪领域的研究
数据采集系统是工业CT的重要组成部分。如何能够保证数据采集系统工作的稳定、可靠、一致性,对于研制和改进其质量,提高ICT整体性能有着重要意义。重庆大学ICT研究中心经过多年
图形用户界面(Graphics User Interface),简称GUI,即使用图形的方式,借助菜单、按钮等标准界面控件和鼠标操作,帮助用户方便地向计算机系统发出指令,启动操作,并将系统运行的结果同
智能网由智能网平台和业务交换点SSP两部分组成.智能网平台通常由小型计算机及运行在其上的数据库组成.我们可以通过将小型计算机配置为双机系统实现智能网平台设备的可靠性.