基于HBase GPS数据存储设计及优化

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:hongguoboy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代数据收集技术的迅速发展使各领域的数据不断增长。传统的计算机在海量的数据面前已经略显吃力。在这样的背景之下云计算悄然而生,而Hadoop为一个开源的分布式处理系统平台,属于Apache研发公司的一个平台。Hadoop以Hadoop分布式文件系统(HDFS,Hadoop Distributed Filesystem)和MapReduce(goole mapreduce的开源实现)为核心,为用户提供了系统底层细节透明的云计算基础构架。Hadoop平台还包含了集群管理,数据仓库,文件查询等平台。Hadoop已经发展成企业与研究领域对云计算进行研发与应用的一个标准。HBase为Apache Hadoop中的数据仓库,可以实现实时、随机的读/写大规模文件的请求。HBase将数据存储和数据的并行计算完美地结合起来。HBase是开源的,并且可以轻松地在便宜的硬件上部署规模巨大的结构化储存的集群。目前已经有好多国内外的大公司应用HBase作为他们的数据存储仓库。人们的生活水平越来越高,物流车辆变得很多很多,它们产生的GPS数据也越来越多,我们希望存储相应信息的时间也越来越长,人们对信息处理的要求也越来越大,对GPS车辆信息的处理需求也变得越来越大,面对GPS产生的海量数据传统的处理方式、存储方式已经力不从心,云计算、云储存技术的产生给大数据的处理、储存提供了一种很好的解决途径。因此GPS信息基于Hadoop的应用,基于HBase的存储是物流行业未来发展的潮流,是解决物流大数据很有效的途径。本论文首先对hadoop的基础知识进行了介绍,讲解了Hadoop的核心子项目分布式文件系统HDFS(Hadoop Distributed File System)和MapReduce分布式处理编程模型,以及Hadoop的数据仓库HBase。然后对所需要的分布式环境进行了搭建,讲述了Hadoop集群的搭建过程和HBase的搭建过程,及Sqoop的安装。接着通过Hadoop的分布式编程模型对GPS物流车辆信息进行了处理,编写实现了基于Hadoop的四个应用实例,通过应用实例加深对Hadoop编程模型的了解。最后介绍了HBase的基本原理,及GPS数据基于HBase表存储的设计,其中重点对rowkey进行了设计,对HBase的写入性能进行了分析,并对写入性能进行了调优以提高HBase的写入性能,设计实现了GPS数据基于HBase的存储,并通过实验给予了验证。
其他文献
随着科技水平与商业模式的迅速发展,越来越多的企业将自身的业务与互联网进行强关联,这使得对信息数据的计算量、存储量、传输量大幅增加,同时,基于节能减排、绿色环保、企业
随着社会的不断发展,交通方式也越来越多,如何选择最佳的交通方式成了人们关注的重要问题。以攀成线(攀枝花与成都之间的线路)的主要交通方式为研究对象,分析了影响旅客选择交通方
潜规则就是不成文的见不得光的一些暗箱操作的规定和原则,它最早产生于人们的贪婪和私欲,并且随着时代的前进不断发展,滋生繁衍,如今已经无孔不入地渗入到社会上的各行各业中。今
对于喜爱DIY玩家来说,机箱散热性能与外观是他们的选择的方向。先马针对这些用户群体的需求,推出了一款性能全面兼出色外观的颠覆了传统领秀标准版游戏机箱,以199元的价格满足众多DIY玩家的需求。  机箱以出色散热为宗旨,采用了时下流行的电源下置结构,使显卡下方空间增大,可以通过气流得到更充足的冷空气,给散热器进行散热,并可以通过上下开孔、CPU侧吹散热向上的方式,形成整体上的垂直风道,并且在机箱的前
物联网作为近年的热门词汇,已成为全球性的技术发展潮流。其市场潜力巨大,且近年来快速发展,即将进入大规模发展阶段,并在未来形成井喷式发展。在个人市场日趋饱和的今天,物联网市场将成为电信行业新的利润增长点。在物联网大发展的背景下,适用于超低功耗、超大连接、超强覆盖、超低成本的NB-IoT网络应运而生。NB-IoT是3GPP专为运营商定制的LPWA蜂窝解决方案,适用于运营商的组网与运营。NB-IoT的相
当前我国确立的环境公益诉讼模式为环境民事公益诉讼与环境行政公益诉讼“二元并存”的诉讼模式。从集体行动逻辑视角出发,通过对材料分析发现,当前“二元并存”的环境公益诉讼模式主要存在如下不足:一是利益主体自然人被排除在诉讼主体之外;二是起诉原告博弈动力缺失;三是诉讼中非利益集团成员被寄予厚望。突破当前环境公益诉讼之困境,应当由环境公益诉讼“二元并存”模式向“新环境行政公益诉讼”模式转变。在新的环境行政公