基于Hadoop的海量工程数据处理技术研究

被引量 : 38次 | 上传用户:zhifeiji1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
摘要:随着工程项目信息化程度越来越高,海量的工程数据随之产生,然而传统的工程数据存储技术无法满足越来越高的数据存储质量的要求。近年来,云计算技术在工业界和学术界共同推动下取得了巨大的发展,大量的云计算系统投入使用。其中,Hadoop平台被广泛用来开发云计算程序。Hadoop最大的优点就是实现了并行化对应用开发者的透明处理,应用开发者可以像开发普通程序一样来开发云计算的应用系统,而集群的并行化则由Hadoop底层自动完成。本文基于Hadoop技术来研究工程领域海量数据的处理问题,主要采用Hadoop的HDFS分布式文件系统以及MapReduce分布式处理模型来支持海量工程数据的存储和处理。海量工程数据的处理过程主要分为两大部分:海量数据的存储过程与计算分析过程。针对工程领域数据存储的问题,本文分析设计了基于Hadoop的HDFS分布式文件系统的工程数据存储系统。该系统基于Java7文件监控器设计了的文件识别算法,该算法可以快速、准确地监控并识别客户端本地文件目录变化信息。配合基于Quartz的调度器的存储作业调度以及HDFS文件操作API接口的调用,实现了跨平台文件同步功能。经过在云仿真平台存储系统中应用测试,表明该系统具有较好的通用性、高效性以及经济性。所设计的文件同步方法较好地完成了文件同步任务,解决了云仿真平台存储系统中核心的文件同步问题,提供了快速、正确的文件同步功能。针对海量工程数据计算分析的问题,本文基于Hadoop技术另外一个核心技术MapReduce分布式处理模型,以城市海量噪声数据为应用对象提出了海量数据分析处理模型,为城市社区噪声监测系统提供海量数据处理服务。针对城市噪声数据特点,提出了由四个部分组成的数据处理过程,分别是数据清洗、数据预处理、数据处理以及数据可视化。基于该处理模型,对城市噪声监测采集系统采集到的海量噪声数据进行存储,将存储后的数据进行测试分析处理,实现了移动计算与海量工程数据存储及分析的结合。测试结果表明该分布式处理模型快速、准确、有效地完成了噪声数据处理的任务。最后对基于Hadoop的海量工程数据的存储与计算分析的应用情况进行了研究成果总结,并对下一步工作进行了展望。
其他文献
目的:观察序贯结肠透析联合锡类散治疗溃疡性结肠炎的临床疗效。方法:将90例溃疡性结肠炎患者随机分成治疗组和对照组各45例,治疗组在采用序贯结肠透析联合锡类散治疗,对照组采
济三煤矿综放工作面撤除工艺中,应用超前收尾切眼作为撤架空间,实现了快速搬家.本文详细介绍了收尾切眼的矿压特点和支护参数,为类似条件下综放面收尾切眼支护提供了依据.
摘要:波形钢腹板箱梁与混凝土腹板箱梁相比,优点突出,在我国工程中的应用逐渐增多。这种结构由混凝土和钢材组成,其徐变特性可能不同于传统混凝土腹板箱梁;长期以来对其徐变研
当前随着女性工作与家庭压力的增大,患月经过少的患者数量不断增加,同时伴随很多月经过少的患者常常伴有睡眠障碍的症状,从中医"五脏"角度来探讨一下月经过少与失眠之间的关
作为高中阶段物理学科中重要概念之一,牛顿第二定律在整体知识结构中有着重要的承上启下作用,是对高中阶段物理知识的有效连接。不少物理教育工作者将牛顿第二定律视为高中物
相近各国牌号:美国的Inconel X-750,德国的Ni Cr15Fe7TiAl,法国的NC15Fe TNb A,日本的NCF750。材料的技术标准为Q/3B 4088—1994《GH4145合金毛细管材》;Q/3B 4098—1995《GH4
介绍了预掘收尾空间、采用锚杆、锚索、钢带、铁丝网联合支护项板,使综采工作面安全快速回撤,节省时间,解决接续紧张的困难,减少人工和材料上的消耗。
目的探讨质量管理在静脉药物配置中心的应用价值,以为药剂人员的工作提供合理化建议。方法采用回顾性方法,选取2015年12月~2017年3月以来本院药剂人员统计的静脉配置中心和病区
以蛋氨酸和氯化锰为原料,合成了蛋氨酸锰,最佳工艺条件为:配体摩尔比2∶1,反应温度80℃,反应时间90min,产品螯合率为89.91%。通过红外光谱及产物组成分析,可以确定其组成为Mn(M
唢呐是中国民族乐器体系中的一种古老乐器,在中国民间有着极大的影响力,其不仅是民间婚丧嫁娶以及舞蹈表演活动不可缺少的演奏乐器,在各种类型的戏曲表演当中也不可或缺。不