k-匿名隐私保护模型中不确定性数据建模及存储问题的研究

来源 :东华大学 | 被引量 : 0次 | 上传用户:qfcyzf2573
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着隐私保护意识的提高,人们越来越重视发布数据的隐私泄露问题。为了使隐私信息尽可能少地被泄露,研究人员提出各种隐私保护手段,不确定性的k-匿名隐私保护模型已经成为数据发布者可信的隐私保护模型。然而,受隐私保护要求的制约,即使最优化的k-匿名算法,也不能产生完全精确的数据,正因为这种不精确性导致了数据可用性的降低,数据接受者当作垃圾数据而拒之门外。为了使数据接受者能够更好地处理和管理k-匿名隐私保护模型中的数据而提高其可用性,在文中从另外一个角度来研究k-匿名数据,即把k-匿名隐私保护模型中的数据看成是一种不确定性数据,用不确定性的方式来处理它。建模是不确定性数据管理的基础,k-匿名隐私保护模型中不确定性数据有其特殊性:它是人为泛化后的不确定性数据,泛化后的每个实例还原成泛化前元组的概率是相等的。由于其特殊性,以往针对非人为造成不确定性的数据建模方法已经不能简单用于描述k-匿名隐私保护模型中的不确定性数据。为了描述k-匿名隐私保护模型中不确定性数据,文中提出几种新的建模方法:kattr模型使用attribute-ors方法来描述k-匿名数据中准标识符属性值的不确定性;ktuple模型把k-匿名表中不确定的属性值转化成一个关系表形式的值,对关系表使用tuple-ors方法来描述;kupperlower模型把k-匿名表中泛化属性分开成两个字段:上限字段和下限字段,使用两个字段的具体值来表示泛化值不确定性值;ktree模型根据k-匿名表是对普通表通过泛化树泛化而形成这一特性逆向把泛化值拆分成树型结构,用树来表示k-匿名数据的不确定性。将由这几种模型及它们之间的组合构成了一个描述k-匿名隐私保护模型中不确定性数据的模型空间,根据实际情况从中选择最适合的描述模型,然后讨论了模型空间中各模型的完备性和封闭性性质,形式化地证明了模型的完备性和封闭性问题。在文章的最后探讨了模型的存储问题。经典的关系型数据库模型无法考虑数据的不确定性,要想把模型中不确定性数据存储在关系数据库中,需要在存储之前对数据进行合理地处理。从数据的匿名化过程可以知道k-匿名数据表中每个字段的值都是根据相互独立的泛化树通过泛化而成,因此k-匿名数据属性之间是相互独立的,从而可以对不确定性数据进行垂直分割,再使用列存储的方式把数据存储于关系数据库中。本文先把不同模型的格式统一转化成一种关系型模型,然后在关系表基础上进行垂直分割,使用列存储方式存储每个不确定性属性的具体实例值。最终用多个关系表把不确定性的k-匿名隐私保护模型中的数据存储在关系型数据库中。
其他文献
本学位论文对周期函数的正常积分带重结点的Gauss型求积公式和含Hilbert核奇异积分的单结点Gauss型求积公式作了一些基础性研究.全文分为三部分:  第一部分讨论了关于权函
作为分析和预防网络蠕虫传播的理论基础,网络蠕虫的传播模型系统随着网络系统的千变万化也变得越来越复杂。现在已经存在的网络蠕虫传播模型还存在不足,主要是对其过程中一些客
伴随着互联网时代快速发展的节奏,基于web开发的应用程序也越来越成熟,技术也越来越复杂。由于web应用丰富的功能特性,以及便于通过互联网对信息进行比较、处理、传播的能力,
多Agent之间按照约定的协议进行通信和协调,使得整个系统成为一个性能优越的整体,可以解决单个Agent难以解决的问题。然而由于各个Agent所处平台和拥有知识的不同,以及通信消
微博媒体拥有大量的微博用户,用户间相互交流、发布、分享、传播信息,生成大量的UGC(User Generating Content)信息。用户为了找到感兴趣的微博信息需要花费大量的时间。因此,如何
室外定位技术由于有着GPS的帮助,已经非常成熟和准确了。但是在室内中,由于环境问题使得GPS并不是任何时候都可以使用。而且室内定位追踪是立体的,所以传统的GPS坐标并不能很
实时系统是计算机科学的一个重要领域,这类系统目前广泛的应用于生产生活中。随着多核/多处理器系统在实时应用中的日益普及,多处理器实时系统的研究成为当前的热点。可调度
作为目前信息检索领域十分有效的检索模型,基于语言模型的检索方法开辟了一个很有潜力同时也十分具有挑战的方向。与传统检索模型相比,以语言模型为基础的检索方法不仅具有良
随着近年来web2.0时代的到来和飞速发展,博客作为一项重要的互联网服务也一度出现了爆炸式增长,随着信息量的增大也带来了查找困难的问题。为解决这一问题,主要针对博客圈的检
联合补充及配送是解决供应链中产品在供应商、仓库和零售商之间调配问题的一种重要方式。随着生产力迅速的发展,人们对商品的需求也随之提高,市场环境中诸多因素都会影响到产品的运输调度。例如,当产品的需求率不确定时,会导致供应商在补充产品时的订购成本发生变化、给零售商配送时所产生的等待成本也变得不确定;当供应商在考虑联合补充中个人的补充成本以及均摊费用时,会以自身利益为前提,这时就需要通过博弈的方式来得到一