基于HBase的海量数据分布式序列存储策略优化

来源 :自动化技术与应用 | 被引量 : 0次 | 上传用户:slie726
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对海量数据分布式序列数据量大、增长速度快、序列重复性高等特点,结合HBase分布式数据库的相关理论和技术提出并实现了一套基于HBase的海量数据分布式序列存储方案。该方案设计了基于分布式数据分类码的预分区和行键优化策略,解决了服务器的均衡负载问题。通过构造文件索引替代二进制码序列实现了数据的高效存取。利用HBase协处理器实现了分布式序列记录单次提交多表插入的功能,提升了分布式多格式存储的效率。实验表明,通过上述方案设计的分布式序列存储系统具有良好的存储能力和扩展性。
其他文献
电力负荷短期预测在发电计划、调度制定与安全评价中起着重要的作用。杂交方法可降低单一预测方法的风险,能有效提高预测准确性。为了降低噪声干扰与提升预测性能,提出了基于
随着现代数据处理越来越依赖于信息技术,类似的方法可用于分析中医药数据中的大量信息。本文利用语义标注和语义本题等工具,将中医药相关的数据进行整合,建立一个中医药数据
在南方区域现货市场两级运作阶段,仅有部分省份开展现货市场交易,因此需要综合考虑不同省份市场化改革所处的不同阶段,在充分考虑全网新能源发电消纳、负荷预测、水电计划和
随着电力系统的智能化、现代化发展,电力负荷的种类越来越多,气象因素对负荷的影响愈显突出。文中提出了针对气象因素的电力系统短期负荷预测方法,共分为回归分析和负荷预测
以相似邻居预测候选服务QOS值作为参考依据,选择部分最优QOS值组成的服务作为节点,连接不同服务的相似能相得到连边,提出了以随机游走以及多样性图排序作为分析依据的个性化