基于哈希桶Variety-B树的数据流存储与查询

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:yaci
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的不断发展,许多企业为了捕捉生产过程中设备的相关信息,产生了大量的数据流;以及电子商务公司随着业务规模的扩大,产生了巨大的交易量引发的数据流,这些数据流对企业的发展和领导层的决策起着非常重要的作用。一般地说,传统的数据存在磁盘上,以关系型数据的形式呈现出来;而数据流不同,它是按照时间顺序快速变化,具有海量和无限延续性等特征,很难将其数据全部存储起来。因此,本文选取对数据流的研究具有一定的理论意义和应用价值。  为方便对数据流数据存储和查询以及快速处理等操作,本文首先设计了一种循环缓冲区处理框架。然后,从B+树出发,设计一种改进的Variety-B树结构。为简化B+树的结构,Variety-B树去掉了B+树叶子结点指向兄弟的指针,这样就使Variety-B树的所有结点不能分裂。为避免Variety-B树叶子结点不能进行分裂而导致存储结构的复杂,采用哈希桶进行改进,利用若干哈希桶代替Variety-B树的叶子结点,使Variety-B树对叶子结点具有可分裂性。Variety-B树是一种层次索引存储结构,它是一种能存储和索引多维属性数据的内存数据结构。对Variety-B树叶子结点中哈希桶存储的数据位置引起的冲突采用专门设计的哈希函数进行解决,本文采用线性探测法解决数据流插入哈希桶所产生的位置冲突问题,建立Variety-B树结构,对循环缓冲区处理的数据流进行存储,达到对数据流高效、快速地查询。  理论分析和实验测试结果表明,本文所设计的Variety-B树结构内存数据库可以对循环缓冲区处理的数据进行高效地存储和快速地查询,可以满足实际应用中对数据流操作的要求。
其他文献
随着无线通信技术与计算机技术的高速发展,先进的无线移动网络有望得到普遍应用。由于移动Ad hoc网络具有不需要基础设施与集中式的网络管理等显著特点,近年来受到越来越多的
粗糙集理论由Z.Pawlak于1982年提出,是继概率论、模糊集理论、证据理论之后的又一个处理不确定性的数学工具。该理论不需要任何附加的信息或先验知识,就能有效地分析和处理不
本文根据“散裂中子源(CSNS)快周期同步加速器(RCS)磁铁电源”的实际应用需求,为其设计电源监测系统方案。该方案包括系统整体设计、硬件设计、软件设计和系统测试。传统电能
企业输电线路监测对及时准确地发现企业线路故障和保障企业正常生产有着十分重要的意义。大中型企业都有采用购适合本企业变电所具体情况的输电线路监测系统的愿望,但是各个
随着无线通信技术的快速发展,人们对网络应用需求不断提高,无线网状网Wireless Mesh network (WMN)得到了广泛的部署,由此可以得到更大范围的网络服务。无线Mesh网络中数据通
虚拟人足球比赛系统涉及计算机图形学、虚拟现实、运动学与动力学、多功能感知、认知心理学等多个学科,是一个非常典型的复杂系统,目前国内外在此方面的研究尚处于初探阶段。
当今越来越多的信息、服务都被发布在互联网上,信息搜索、服务集成技术已经成为IT行业关注的焦点。电信服务作为一种传统的通信服务,也顺应这种趋势,越来越多地被运营商以Web服
商品过度包装屡禁不止,而目前质量监督部门采用手工测量+经验评估+计算推理的传统手段已不能满足日常检验的需要。另一方面,计算机视觉经过多年蓬勃发展,在立体测量、逆向工程及
P2P搜索引擎是一种基于P2P网络结构的全文检索引擎,它是网络技术研究中的一个新兴领域,现有的P2P搜索技术在如何面对大规模的网络节点保持系统的稳定性、可靠性,减少对超级节点
无线Mesh网络是一种新型的宽带无线通信网络,它既类似于Ad Hoc网络具有自形成、自组织、自修复、多跳通信等特点,又因为其移动性较低、拓扑结构相对稳定等特点区别于Ad Hoc网络