面向数据中心的分布式多维索引设计与优化

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:huanying19870604
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,数据中心和分布式存储系统被广泛应用于数据管理、数据分析、数据检索等应用中,在这些业务领域中占有重要地位。构建高效的多维索引可以有效提高数据中心和分布式存储系统的性能,也是保证数据业务服务质量的关键策略。本文分析了R-树多维索引结构和Fat-Tree数据中心网络的特征,遵循双层索引机制的思想,构造了面向数据中心的分布式多维索引FR-Index。FR-Index探索数据中心网络结构在数据管理中可能发挥的巨大作用,结合R-树多维索引结构的优点,在数据中心上构建了一个含有多个索引实例的双层索引系统。在该系统的下层,数据中心中的每台服务器应用R-树为存储的数据建立本地索引,在系统的上层,部分本地索引节点构成的分布式全局索引为整个数据集刻画了一个简要的全景。根据FR-Index索引的分层结构,本文给出了利用FR-Index进行辅助查询处理的策略。针对FR-Index的多种索引更新需求,本文也设计了不同的索引更新策略,并提出索引节点开销模型作为索引更新的理论依据。为了进一步提高索引构建和查询处理的效率,我们充分利用数据中心的架构特征,设计了索引空间构造、维度顺序传播算法等多种具有创新性的细节优化方案。在Amazon EC2平台上运行的系统性能评估表明,FR-Index可以高效地处理查询请求,并具有良好的可扩展性和轻量级特征。与现存双层索引机制RT-CAN的对比测试表明,FR-Index对数据中心的适用性更佳。
其他文献
2020年1月底,一家名为“浑水”的做空机构在其官网发布了一份做空中概股瑞幸咖啡的报告,该报告不仅直言瑞幸商业模式存在重大缺陷,还指控其财务造假,虽然瑞幸对此予以否认,但事实胜于雄辩,4月2日,瑞幸承认在财报中虚报了22亿人民币的收入,此消息一出,直接造成其当日股价暴跌75.57%,并引发新一轮中概股连锁信任危机。在这一背景下,本文选取瑞幸事件作为案例研究对象,重点研究事件原因和由此引发的新一轮中
在植物的生长过程中,及时确定病害的严重程度对维持植物的健康起着重要的作用。农业技术人员大多采用肉眼观察的方法估算植物的病害程度,这种传统方法缺乏科学性和客观性,一
图像作为一种历史悠久的信息载体,自古以来在人类的生活和工作中都起到了非常重要的作用。随着高科技的飞速发展和电子数码产品的普及,图像越来越多的被应用到人们生产和生活
随着互联网的出现,现代人的生活已经完全改变。随着现代技术的发展,互联网开始渗透到人类生活的各个领域。互联网也已成为社交交流的重要渠道。该网络的出现和发展,信息技术
背景胆管扩张症(biliary dilatation,BD),又称先天性胆管囊肿,是临床上少见的胆道发育异常疾病。包括了肝内与肝外不同位置多发或孤立的胆管囊状扩张病变,其中肝外胆管扩张症(extrahepatic biliary dilatation,EHBD)是临床上最常见类型,占90%以上。因病变胆管反复受到炎性刺激,有较高的癌变风险,成人癌变率最高达28%,因此胆管扩张症的早期诊治非常重要。
近年来,人工神经网络技术在各类场景中发挥着重要的作用,它被广泛用于计算机视觉、语音识别、自动驾驶等领域。其中生成式神经网络是一种由卷积、反卷积、残差模块组成的神经
当前人工神经网络的模拟计算过程有必要在微观动力学层面找到神经元或突触的模拟单元,利用忆阻器来模拟人脑突触的可塑性行为近年来成为人工智能领域的研究热点。尤其是制造
高炉煤气系统作为典型的二次能源系统是钢铁生产中的重要环节,其平稳运行是企业高效生产,节能减排的重要保证。因此,对高炉煤气系统进行建模与调度对企业生产意义重大。本文
村务监督委员会作为依法设立的村务监督机构,是健全村级组织架构,惩治农村基层权力腐败,推进农村基层民主政治建设、优化村民自治的重要载体。但在一些农村,村务监督委员会制
随着移动终端和网络技术的快速发展,物联网(Internet of Things,Io T)技术引起研究者们的广泛关注,人们期待万物互联时代的到来。然而,目前依靠地面无线通信技术的物联网技术