分布式LOP时态数据索引

来源 :华南师范大学 | 被引量 : 0次 | 上传用户:wxyz0123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库与信息技术的深入发展,信息系统面临着许多新的应用和需求,对时态信息处理的需求也越来越迫切,例如电子商务、数据仓库、地理信息系统。通常把具有一种时间属性的数据称作是时态数据,时态数据的时间属性是指有效时间或事务时间,而把同时具有两种时间属性的数据称为双时态数据。论文主要探讨时态数据的索引方法。   互联网的发展也越来越快,新型社交网络的出现和快速发展,使得用户愿意主动产生数据,智能手机、平板电脑为代表的新型移动互联网终端的普及使得人们接入网络的途径更为便捷。这些因素使得互联网上产生了海量的数据,推动了分布式数据库系统的发展。近年来出现了一些非关系式的分布式数据库,例如Google的BigTable,Apache基金会的HBase,Amazon的Dynamo。   论文根据时态数据本身特性,根据时间期间之间的包含关系定义了时态数据的“拟序关系”,并且在“拟序关系”框架内建立时态数据基本结构:线序分支(LOB)与线序划分(LOP)。线序划分将杂乱的时态数据的集合划分成一条条有序的线序分支。根据线序划分,本文提出的时态数据索引Tindex(MLOP, LOP)是对时态数据的有效时间(Valid Time)进行索引的一种有效的索引技术。论文分析了Tindex的查询操作的效率,并且对于Tindex的更新的实验表明大部分的更新不会影响超过5条线序分支。   本文尝试将LOP用于分布式数据库系统(DDBS),提出分布式时态索引DTindex;提出Master-Slave结构的时态索引查询系统,使用线序分支为最小单位分割LOP,用分割式的方法将LOP的分割分布到各个Slave。LOP的数据分配的目的是使整个分布式数据的总体代价最优,这也是在数据分配设计时需要考虑的首要问题。为了更好地解决数据分配问题,论文提出了基于时间期间个数和时间期间查询期望的2种时态数据索引分割方法。并且用实验验证了2种方法。
其他文献
无线胶囊内镜(Wireless Capsule Endoscopy,WCE)是一种全新的医疗诊断技术,它能够方便医生观察病人的消化道信息。该胶囊是一种可吞服的小型摄像设备,病人吞服胶囊之后,胶囊拍摄
在自然生态环境与人类的关系越来越密切的今天,随着虚拟现实技术的迅速发展,虚拟植物可视化研究方向被人们广泛重视,成为了众多研究热点之一。虽然植物形态结构十分复杂,与环
在确定性微分包含的基础上加入Gaussian噪声或更一般的Lévy噪声,则成为带多值算子的随机微分方程,是近一二十年随机方程和随机分析领域的新兴问题之一,引起了广泛关注。这类特
随着计算机网络技术的飞速发展,计算机已不再是遥不可及的高科技产品。如今,计算机已经普及到了千家万户,成为了大多数人工作、学习、生活不可或缺的工具之一。由于网络已经渐渐
信息技术的快速发展使计算机软件的执行效率和硬件的性能都得到了很大的提升。在当今时代,很多设备都具有计算能力与数字通信能力,而且这些设备之间可以互相交换信息和使用对
近年来,社交网站、微博、微信、博客、论坛等社会媒体作为人们用来分享意见、经验和观点的平台,受到网民的热烈追捧,浏览社会媒体传播的信息已经成为网民日常生活不可或缺的部分
经过数十年发展,尤其是随着近几年高速通信网络的普及,信息产业已经开始由“提供应用”向“提供服务”转变。在这种转变中,一个明显的特征是直接面向用户的应用开发者急剧减少,绝
在人机交互领域,传统的单语音识别技术在相对安静的环境下对连续的单词或短语能够达到较高的识别率。然而,将其应用到真实环境时,其识别能力通常会由于背景噪声等因素的影响受到
在网络数据量急速增长的现代社会,大数据存储处理技术正在蓬勃发展,其中HDFS(Hadoop Distributed File System)系统是大数据存储处理技术中应用最广泛的。由于HDFS的存储机制
随着科技的不断发展,人们与网络的联系已经变得十分紧密,网络的交流和分享给人们的生活带来了极大的便利。而网络信息的迅猛增长,使得用户在查找资料时不得不从搜索引擎返回