面向文档的数据库存储系统的设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:lshwy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以微博、社交网络等为代表的Web2.0互联网应用的兴起及其处理数据量的爆炸性增长,对数据管理的灵活性、可扩展性、高性能的读写有了更高的要求。传统的关系数据库由于模式固定,查询处理过程复杂等原因,不能很好地满足这些新兴互联网应用的需求。为了解决上述问题,NoSQL成为数据库研究和应用领域的一个新热点。许多新型的NoSQL数据库管理系统如BigTable、HBase、Cassandra、MongoDB、Redis等已在很多互联网应用中逐步取代RDBMS。这些数据库通常被统称为“MoSQL”,即非传统的关系型数据库。   在这些非关系型数据库中,文档数据库能够支持复杂的数据类型和复杂的查询,在功能的完整性上最接近于关系数据库,被认为最有可能在某些领域替代关系数据库的下一代数据库。   尽管文档数据库近年来的发展十分迅速,但是在功能完善性和稳定性等方面同久经考验的关系数据库相比仍有不小差距。在索引管理、丰富数据类型、一致性、持久化策略等方面,现有的文档数据库的支持仍不够完善。   针对目前文档数据库存在的一些问题,本文重点研究文档数据库存储管理的设计和实现,主要工作包括:   1、在数据存储方面,我们通过引入属性管理和类型管理,解决目前文档数据库普遍缺乏对元数据信息管理的问题,同时通过属性编码和类型编码,将文档数据转换为紧凑的二进制格式存储到数据库中;   2、在缓存管理方面,我们分析了传统关系数据库基于页面的缓存替换策略的弊端,提出一种更为灵活和高效的缓存管理方案;   3、在数据更新的管理上,为使系统在高并发的写操作下依然能保持高性能,我们将更新操作的持久化过程延迟,提出一种既能保持高可用性又能保障数据安全的持久化更新策略。
其他文献
神经活动是最复杂、最神秘的生命活动,揭示其奥秘是自然科学的最大挑战。而生物学研究表明生物神经系统的功能很大程度上受到其结构的影响,对生物神经系统拓扑结构的研究显然是
在物理仿真与动画领域,多种运动物体之间的碰撞检测以及多体多点非光滑接触仿真计算模型,由于多体自身特有的非光滑非连续数值特征,依旧存在非常大的困境和挑战。本文将围绕高效
随着社会经济的发展,机动车辆与日俱增,随之而来的驾驶安全问题受到越来越多的关注与重视。统计表明,在所有的交通事故中,10%-20%是由于疲劳驾驶造成的。因此驾驶员疲劳检测成为了
印刷行业面临着日趋激烈的竞争,客户对印刷品质量的要求也越来越高,而印前数据处理的优劣在很大程度上决定着印刷品的质量。在如今的印刷品中,图像占据了越来越重要的地位,由
粒计算是一门快速发展的新兴学科,它主要思想:把复杂信息按照特征和用户需要划分为若干较为简单的块,每个块称为一个信息粒,划分粒的过程称为信息粒化。它以模糊逻辑、粗糙集和商
数字印刷是印刷技术发展的重要方向,数字印刷的一个重要特征是每张印品上的图文数据是可变的,因此数字印刷要求极高的数据传输速率,当前主流硬盘带宽无法满足数字印刷对传输
基于视频的人体运动姿态跟踪是计算机视觉领域一个重要的研究课题,其广阔的应用前景对推动虚拟现实、人机交互、智能监控、医疗以及其他领域的发展有重要的研究意义。人体运
基于J2EE平台的轻量级开发框架消除了一些传统开发中多余的复杂性和技术方面的约束,业界应用十分广泛,但仍然采取效率低下的手工方式的模型转换,所以需要建立一套可行的系统
随着数码设备的普及和互联网的快速发展,网络资源环境下的图像资源越来越丰富。如何从海量的web图像资源中检索用户感兴趣的图像成为信息检索领域的热点问题。近年来,基于概念
随着科技的进步,观测手段,实验工具的巨大革新,导致的数据的爆发式膨胀,科学研究方法从过去的经验科学阶段转变到以数据处理,分析,挖掘为核心的数据探索阶段。在十多年前,计算方法被