论文部分内容阅读
随着网络通信技术的高速发展,人类产生的数据量正在呈指数级增长。对大数据集的分析查询,通常只用到一个或几个逻辑表的少数几列,而且每次要读取的数据量很大。在这样的实际应用背景下,列存储数据库系统应运而生。大量的研究表明:相对于行存储系统,在具有较多查询分析操作的应用中,读优化的列存储系统具有显著性能优势。同时,列存储系统在使用过程中,数据安全性也是人们密切关注的一个重要问题。如何维护列存储系统的数据安全以及保持列存储系统的性能优势,已经成为列存储研究领域中的一个重要分支。论文针对列存储系统的数据加密方法、建立安全索引方案、确保系统k-安全的数据分配与重构方法、优化系统网络性能的模型等几个关键问题进行了研究。论文的主要研究内容如下:首先,研究了基于列存储系统单元格粒度上的加密方案。为了抵御替换攻击,避免统计信息泄露,在分析列存储系统结构特点的基础上,提出在单元格粒度上,采用单元格数据与单元格位置相结合的方法对系统数据进行加密。其中,单元格位置信息采用列存储系统数据表的表ID,列ID和行ID三个元素构成的三元组来表示,并采用具体实例证明了新加密方案能够抵御替换攻击。在单元格粒度加密方案基础上,研究基于密文建立数据安全索引方法。将单元格数据与单元格所在行的位置信息结合在一起加密成密文,然后在密文上建立安全索引。通过对基于密文建立的安全索引与基于明文建立的B+树索引进行对比分析,新的安全索引不会泄露任何与明文有关数据信息,且保持原有索引结构,不影响数据查询。其次,根据列存储系统结构特点,研究了适合其的相对“轻型”Romega加密方案。相对于行存储系统,在多读操作环境中列存储系统具有性能优势。而对数据进行加密,会影响系统性能。为解决这个矛盾,进行了基于多级互连网络建立相对“轻型”加密方案的研究。首先,对Omega结构特点进行了分析。其次,利用其可逆性,研究了在列粒度上对列存储系统数据进行加密具体方案。最后,从理论上对新加密方案的安全性进行了证明。再次,研究列存储系统k-安全问题的解决方案。在列存储系统数据网格所有的n个节点中,每个节点存储的数据量是不同的。系统要求当其中有k个节点的数据遭受破坏后,使用余下(n-k)个节点中的数据,依然能够重构所有数据。基于不同应用环境的需要,提出两种解决方案,分别是基于拉格朗日插值多项式解决方案和基于牛顿插值多项式的解决方案。并通过具体实例,对两种数据分配与重构方案能保证k-安全的正确性与可行性进行了验证。最后,从优化列存储系统网络应用环境研究视角出发,提出了一种流排队模型。首先,对传统排队论和流排队的基本结构进行了分析;然后提出了模型假设,并根据假设,研究了一种新的带启动期的M/M/1排队系统驱动的流模型。