基于副本选择的Impala并行查询执行调度

来源 :第31届中国数据库学术会议 | 被引量 : 0次 | 上传用户:wnan100
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对目前并行查询执行调度方法不适用于Impala大数据实时查询系统的问题,提出基于副本选择的Impala并行查询执行调度方法.该方法将所有查询分为单表查询和多表查询两类:若是单表查询,则转化为多副本检索优化问题,应用最大流方法选择副本和执行节点;若是多表查询,则结合提出的Impala并行查询执行代价模型搜索近似最优调度.在Impala系统上实现了提出的并行查询执行调度方法,并在TPC H数据集上进行了实验,结果表明,集成后的Impala的查询响应时间比集成前的减少10%~50%.
其他文献
现实世界中的实体及其相互关系可以用图模型来表示,关系强度用边上的权重衡量.模式匹配查询是数据库研究领域的基础查询之一.针对有向带权图,提出一种权重约束的模式匹配查询
本文主要围绕县级图书馆在服务乡村振兴中的作用展开研究,通过分析县级图书馆的作用,结合乡村振兴要求和县级图书馆建设过程中需面对的问题,从完善县级图书馆基础设施建设和
一、cdmaSea~(TM)简介 东方通信CDMA交换系统(CDMA Switch System of EAstern Communications?cdmaSeaTM)的体系结构如图一所示,主要由系统控制模块(SCM)、网络交换模块(NSM
数据分析和处理是大规模分布式数据处理应用中的重要任务.由于简单易用和具有灵活性,MapReduce编程模型逐渐成为大规模分布式数据处理系统(如Hadoop系统)的核心模型.由于MapR
会议
介绍了天津移动通信网管系统开发建设的必要性及所开发网管系统的特点、系统网络、软硬件的结构、功能和应用的效果。 The necessity of development and construction of T
今年4月初我得了膝关节病,白天疼痛行走困难,晚上患处跳着疼,医院诊断为关节骨质增生,经多天服药、贴膏药、烤电等,均效果不明显。后得一单方:生白芍一公斤,磨 Early April
由于地理关系及历史原因,广东、广西两地石市一直关系密切,互为补充。我们在离开广西南宁后,便马不停蹄的进入柳州和广州石市。近半年来,这两地石市的情况如何?是否在春暖花
为加强企事业单位、大专院校、科研机构广大焊接工作者的联系、交流,促进焊接技术的发展,为成都地区经济建设作出贡献,由成都市机械工程学会焊接分会主办 To strengthen the
党中央指出,要贯彻新发展理念,必须坚持和完善党领导经济社会发展的体制机制.具体到微观层面,在新形势下,现代企业管理方式不仅要追求经济效益,更要考虑通过创新创优思想政治
文章以SCOR标准供应链运作模型为理论参考,结合跨境电商特征和前人研究基础采用结构方程模型对跨境电商供应链影响因素进行研究.构建了跨境平台、跨境物流、跨境售后、采购、