论文部分内容阅读
多租户数据库作为软件即服务的典型模型通过对不同租户的数据进行集中管理,降低数据管理服务的价格门槛,通过长尾效应创造巨大经济价值,因此如何针对多租户数据库进行软硬件优化设计已经成为国内外工业界和学术界共同关注焦点。但随着租户规模增大,服务要求不断提升,新型存储介质出现,多租户数据库的设计面临巨大挑战:第一,现有的多租户数据库设计方案不能同时兼顾系统性能、存储开销和可扩展性;第二,现有的多租户数据库没有给予租户高可定制的个性化设计;第三,现有多租户数据库没有针对新型存储介质(如:相变存储器)给出查询优化设计方案。针对这些问题,本文提出了一系列针对多租户数据库的优化设计方法,论文的主要研究工作和贡献包括:1.多租户数据库一般定制下的自适应数据模式设计:针对现有的多租户数据库无法兼顾系统的性能、存储开销、可扩展性的现状,本文提出了一种自适应的数据模式设计方案,该方法考虑到多租户数据库业务的相关性,从属性的角度设计建表方案,确保系统的表维护数量不会随着租户规模的增大而线性增长,该方法能够根据租户配置的不同和查询负载的变化而进行自适应的调节,确保系统在不同的情况下都能具备较高的性能和较低的存储开销。2.多租户数据库高可定制下的个性化数据模式设计:鉴于现有的多租户数据库给予租户个性化设计的支持十分有限,本文提出了一种基于高可定制下的个性化数据模式设计方案,该方案提供了基于推荐的方法帮助租户进行更准确的在线设计,为了确保系统的可扩展性,本文提出了基于聚类和基于交互的两阶段方法对个性化数据模式进行集成,此外,本文还设计了基于图分割的方法分别从存储空间和查询负载两个角度对数据模式进行优化,确保系统能够在高可定制的前提下,兼具高可扩展性、低延迟和低存储开销。3.基于相变存储器的数据库索引设计:现有基于相变存储器(PCM)的研究不足特别是基于PCM的数据库索引研究更是非常有限,本文提出了一种基于预测模型的针对PCM优化的数据库索引Bp树,该索引通过预测模型对索引节点空间进行预分配最大限度减少了索引不必要而又延迟大、能耗高的写操作数量,本文放松了索引叶节点严格有序的限制,同时设计索引状态参数实时对预测模型进行监控,保证预测模型的准确性。