论文部分内容阅读
大数据是当前业界的研究热点。随着云时代的到来,大数据开始爆发性发展,吸引了越来越多的关注。大数据正影响着人们的日常生活方式、工作习惯和思考模式,已经创造了巨大的价值。大数据将给整个社会带来从生活到思维上革命性的变化。与此同时,蕴含着的海量数据和潜在的价值的大数据面临着诸多安全风险,包括用户的隐私泄露,虚假数据,以及数据完整性破坏等,这已经开始制约大数据的发展,并给大数据发展带来相应的挑战。然而,现阶段业界对于大数据安全的问题研究主要分为数据加密存储,用户身份认证和访问控制等传统安全策略这几个方面,且大部分借鉴传统平台的安全解决方案;同时,现阶段隐私保护也成为业界的关注点。因此,本文主要关注两个问题,包括如何保障非法用户不能使用数据平台数据,保证数据平台数据安全,另外一个方面是如何保障合法用户不能滥用数据、好奇获取数据,保护数据隐私。本文通过以上两方面,保护数据平台在不侵犯隐私的前提下,提供稳定可靠的合法数据服务。本文针对以上的问题,提出大数据存储系统的动态安全策略和静态安全策略结合方案,动态策略就是大数据隐私保护模型,静态策略就是数据访问模型。本文的主要工作为:(1)本文提出了大数据隐私保护模型。主要包括两个方面,一方面是用户查询隐私保护,用户的查询内容不能被泄露;第二方面是数据中心数据隐私,合法用户可能向数据中心发送查询,挖掘数据中心额外信息,造成数据泄露,隐私泄露。本文对于数据外包情况下的数据隐私保护,采用基于密玥的隐私保护模型。通过此模型,数据外包时对隐私数据进行加密处理,而加上密钥管理后,用户无法获取隐私数据,这样使用少量加密方案,保证了数据隐私安全,且不影响数据平台的性能。本文对于用户查询隐私,采用基于可信第三方的匿名处理和查询拆分形式进行保护。通过此模型,数据平台对于隐私内容的查询无法与具体用户进行关联映射,这样保证了用户的查询隐私。(2)本文提出针对非结构化大数据平台的数据访问模型。主要包括两个方面,一方面是大数据平台的用户管理模型。第二方面是大数据平台的访问控制模型。本文在大数据平台采用票据的形式,通过票据管理实现用户认证。另外,本文结合传统访问控制模型,实现权限管理模型以及访问控制策略,禁止用户越权访问数据平台,从而保证数据平台数据不会意外泄露,提高其安全存储性。(3)本文实现了针对以上两个安全增强的模型的原型系统。本文选择Hadoop-Hive大数据平台,在此基础上添加隐私保护模型和数据访问模型的具体实现方案,本文详细描述了整个原型系统的架构设计、模块设计和逻辑设计,然后选择实验环境搭建部署原型系统进行实验分析验证,确保了以上两个安全增强的模型的安全性与可行性,从而保证了大数据的安全。