论文部分内容阅读
随着云计算技术的发展,越来越多的个人、企业和组织被云服务的优势所吸引。但是,数据安全问题一直是阻碍他们采用云服务的重要因素。当前主流的云服务模式是数据拥有者将自己的数据外包给云服务提供商管理,以此来降低自身的数据管理和基础设施建设费用。然而,这种模式使得数据拥有者失去对数据的管理权,从而无法确保数据的安全。鉴于此,许多数据拥有者都先对数据进行加密操作,然后再上传到云服务器,从而避免了云服务提供商直接查看和使用用户的数据。由于密文数据不再具备一些明文数据的特性,使得一些针对数据的基本操作难以实现,比如检索,进而使得利用数据变得十分困难。 为了解决以上问题,本文提出了一种高效的密文检索方法。在该方法中,数据拥有者基于文档之间的相关度对文档进行聚类,使得同一个聚类中的任意一篇文档和聚类中心的相关度大于预设的最小相关度。在各个聚类稳定后,对每一个聚类包含的文档个数进行检测,如果某个聚类的规模超出预设的最大值,则对该聚类进行分裂,产生多个子聚类。递归执行以上两步,直至所有的聚类都满足要求。基于上述索引结构,在检索时随着文档集中文档数量呈指数性增长,查询时间呈线性增长。同时,为了确定以上索引方案是安全的,本文对上述索引结构进行了安全性证明。 当前的网络环境既复杂又庞大,对于一个入侵者来说,在互联网上找出一个漏洞并入侵是一件很容易的事。另外,由于软、硬件的失效也可能会引起错误的查询结果。因此,本文提出了一种基于Merkle哈希树的完整性验证方案来验证查询结果。最后,本文通过IEEE Xplore数据库构建了一个包含51000篇文档和22000个关键词的文档集,并在该文档集上做了许多实验。实验结果证明了上述方案的有效性和高效性。