电子资源分布式存储子系统的设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:z_asdf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字图书馆向读者提供了各类电子资源服务。近年来,随着数字图书馆的快速发展,各类电子资源的数量也在快速增加,而传统的电子资源系统多是单机系统,处于“各自为政”的状态,存储扩展能力差,难以应对日益增长的资源;处理能力低,难以应对大并发访问;稳定性不足,服务器发生故障会影响系统的服务。采用统一的分布式存储系统可以很好地解决这些问题。流行的分布式存储系统有GFS,HDFS,FastDFS,OceanStore等。但考虑到数字图书馆中资源种类多,简单照搬现有的分布式存储系统并不能完全满足电子资源存储和获取的要求。   本文以国家“211”工程“中国高等教育文献保障系统”(简称CALIS)“十五”项目“中国高等教育数字图书馆”(简称CADLIS)为背景,提出了一种分布式的电子资源分布式存储子系统的总体架构。该子系统以开源软件HDFS为基础,针对电子资源的存储和服务的特点,提出了具体改进和优化方案和相关算法,使之能够更好地满足数字图书馆系统服务的要求。本文针对电子资源系统对外服务的特征,将缓存机制加入到系统中,改进了副本复制策略,使数据块索引得到优化,从而节省了索引服务的内存空间并提高了检索的效率。同时,优化的数据块索引便于持久化,加快了系统的启动时间,还可以减少系统节点之间同步信息的传输量。针对数字图书馆资源尺寸变化大的特点,本文设计了可变长度的数据块模型,使得系统可以同时适应大文件和小文件的存储要求。另外,本文还针对电子资源系统的写入频率特性,设计了集中式的数据写入模式,把索引的读写分开,可以使写入管理更加简单和稳定,并且能够减轻中心节点的负担。   本文将上述方案与实际业务应用相结合,利用前沿的分布式对象存取技术完成了电子资源分布式存储子系统的开发,通过实际测试,验证了该子系统的实际性能。
其他文献
当今,用户界面交互设计已经成为人机交互研究领域的重要组成部分,同时也是设计阶段最容易发生变化的部分。而原型设计作为目前交互设计中的主要设计方法,使得对其的研究工作引起
随着中国保险业的迅速发展和保险总资产的快速增长,寿险资金的运用对于寿险公司的稳定发展起到关键性作用,而寿险投资风险的度量和管理是其核心问题。由于国家对于保险业投资政
本文详细的研究了基于SOA的设备管理系统设计与实现过程。面向服务的体系结构(Service-Oriented Architecture,SOA)是一个组件模型,它将应用程序的不同功能单元(称为服务)通过
热轧是钢铁企业重要的生产工序之一。其调度技术则是热轧生产管理中的核心内容和关键。热轧调度的好坏将直接影响到热轧前后工序的物流畅通、轧线产能的提高和轧辊的工作寿命
BBS(Bulletin Board System)作为一种在拨号网络时代就已经出现的网络应用,随着Internet和技术的发展,因为其开放、自由、交互性强等特点,应用极为广泛。目前国内通常所说的网络
伴随着信息技术的飞速发展,互联网在带给人们极大生活便利的同时,也向我们提出了新的挑战。由于互联网上的信息具有海量异构、更新频繁、增长迅速等特点,导致网络用户很难通过简
为了适应空间技术的发展,空间数据系统国际顾问委员会(CCSDS)针对复杂航天任务的数据传输需求,提出了一种具有高灵活性的数据处理系统——高级在轨系统。高级在轨系统把有效
随着传统的数据库技术日趋成熟、计算机网络技术飞速发展、应用范围不断扩大,在许多领域出现了分布式数据库系统。如何为分布式数据库提供一个高效、灵活、准确地检索系统成为
道路与道路相交的部位称为交叉口,道路交叉口把各条道路联结起来,形成网络。由于相交道路上的各种车辆和行人均须汇集于交叉口,才能转向其他的道路,这时车辆和车辆之间、车辆和横
随着移动用户的快速增长和新业务类型的不断涌现,传统的无线传输技术已经无法满足用户对高带宽和多业务的需求。在这种背景下,能够提供更高数据速率并支持多种业务的宽带无线网