面向多维离散无序数据空间的索引构建方法研究

来源 :东华大学 | 被引量 : 0次 | 上传用户:abczvw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在生物信息、电子商务等领域,随着离散无序(non-ordered discrete)数据规模的不断增长,有效的离散无序数据空间(non-ordered discrete data space,NDDS)索引技术正逐渐成为关注的热点。传统的单一加载(tuple loading,TL)技术已经不能满足数据规模的要求,加快索引构建速度的批量加载(bulk loading,BL)方法应运而生。近年来,并行计算技术快速发展,特别是处理大数据的并行计算框架的出现,使得并行模式在数据空间索引中受到越来越多的重视,并在许多实际应用中得到使用,大大提高了索引的构建性能和查询性能。本文在深入分析国内外连续数据空间(continuous data space,CDS)和NDDS索引以及并行批量加载技术的基础上,就以下内容进行了研究:  1)NDDS索引方法的分析与设计  分析了 NDDS中数据特性,并介绍了这种数据空间中重要的几何概念以及常用的查询类型,讨论了索引加载的相关技术,设计了一种NDDS中并行批量加载方法。  2)NDDS静态索引PND-tree及其拓扑结构  分析了NDDS中已有动态索引的结构,提出了NDDS中静态索引结构PND-tree,并根据先验知识对其拓扑结构进行了定义。  3)PND-tree的并行分割策略与过程  研究了NDDS中动态索引结构的分割策略,为PND-tree提出了基于启发式方法的多路分割策略,并描述了基于MapReduce的并行分割过程。  4)PND-tree的构建与实验分析  通过分割过程中获得的信息,自下而上地构建PND-tree;为了进行性能对比,使用基于缓冲的批量加载方法构建了BoND-tree。以基因数据的索引构建实验表明,本课题所设计的并行批量加载方法在不损失查询性能的情况下,其构建速度远远快于传统的索引构建方法。  综上,面向并行编程框架,设计并实现了NDDS并行批量加载算法,并通过实现算法验证了方法的有效性和正确性。
其他文献
随着时代的发展,GUI (Graphical User Interface,图形用户接口)已经发展成为了软件领域必不可少的技术,大部分的软件都使用了GUI,这也使得基于GUI软件的测——GUI测试变的必
近年来,微博作为一种新的信息发布平台和社交平台越来越受到人们的关注,蕴含着巨大的政治和商业价值。通过对博文大数据展开情感倾向性分析,可以实现微博营销、品牌宣传、客户关
视频点播服务(Video-on-Demand)允许用户进行交互式操作,即用户可以跳跃式观看某个影片的不同时间段,已成为互联网上最流行的应用之一。在P2PVoD中,观看同一部影片的不同用户
SYN洪泛攻击是目前网络中危害最大的拒绝服务攻击,由于很难区分攻击请求与正常请求,SYN洪泛攻击很难防御,目前提出的各种防御措施均不能保证网络设备在SYN洪泛攻击中存活。流量
超声检查报告记录了病人在一次超声检查后得到的影像描述及医生的诊断结果,是重要的临床信息,也是医学领域研究重要的数据来源。为了能够更准确地描述患者的病情,医生通常以
随着云计算的普及,越来越多的数据信息逐渐向云端转移。将数据存储到云计算服务器中将大大减轻用户或企业本身的存储管理负担,同时使用户能够十分便捷的访问云计算服务器中的
指针分析,是指通过对源程序的分析近似地求出源程序中指针表达式所指向的目标,它在程序静态分析领域中有着非常重要的作用,并非常具有挑战性,它的分析结果也被广泛应用于程序的优
无线传感器网络(WSN)是由部署在监测区域内数量众多的传感器节点通过无线设备自主交互而形成的网络。它具有大规模部署、自组织、低功耗等特点。在现实生活中,WSN有广泛的应用,如
作为网格技术在制造业的应用,制造网格不仅具有动态性、开放性、自治性和分布性等传统网格的特性,还具有制造系统自身特有的多主体性、协同性、共享性和灵活性等特点,这些特
基于视觉的手势识别是当前人机交互研究中的一个重点和热点。本文总结了典型视觉手势识别即包括图像采集、图像预处理、手势分割、手势建模、特征提取和分类识别数个步骤的工