【摘 要】
:
大数据是互联网时代产生的格式各异、结构各不相同的数据的统称,具有数据量极大的特点。随着互联网在各个领域的深入普及,大数据产生的速度越来越快,呈现指数增长。近年来,人
论文部分内容阅读
大数据是互联网时代产生的格式各异、结构各不相同的数据的统称,具有数据量极大的特点。随着互联网在各个领域的深入普及,大数据产生的速度越来越快,呈现指数增长。近年来,人们将目光投放到云计算技术上,通过将计算机技术和互联网技术结合,引入新的云计算技术,解决大数据的处理问题。分布式计算(Distributed Computing)是将数量级大的工程数据划分成若干个小分块,由多个计算机即计算节点分别来计算后将运算结果进行上传,最终把结果进行合并从而得出统一的数据结论的计算过程。并行计算(Parallel Computing)指的是将一个总的计算任务划分成多个子分块,在具备了并行处理能力的计算节点上,分配给不同的处理器,各处理器之间遵循调配机制并行地执行子分块任务,最终达到提升计算规模或者提高计算速度的目的。在本设计中利用的是Hadoop分布式架构,其主要由3个子项目组成:MapReduce(编程模型和软件框架,用于在大规模计算机集群上编写对大数据进行快速处理的并行化程序)、HDFS(构建于廉价计算机集群之上的分布式文件系统)和Hadoop Common(为整体架构提供基础支撑功能)。着重研究了MapReduce处理框架并建立了一个能够对数据进行可靠处理的分布式系统平台,使其以分布式并行工作方式加快处理速度,从而体现出其在云计算应用中处理大量数据时的优势。最终通过程序测试来了分析MapReduce框架在数据处理中的流程及特点。
其他文献
以中医现代化之灸疗仪器的研制为出发点,结合目前国内外关于艾灸机理的研究,围绕艾条的光谱,从温热刺激、艾燃烧光谱的光辐射特性、艾的药物特性来探讨艾灸的作用机制。提出
器物是经过人类加工的一种物质形态,在某种意义上,"器物"必然和"非物"一起形成二重组合。在资本主义科技和工业复制时代到来之后,乡村手工业作坊及其技术开始湮灭,旧式工匠带
2008年金融危机让影子银行进入中国金融监管视野,而应对金融危机让影子银行得到迅速发展。影子银行在补充传统信贷方式同时也对金融稳定产生较大负面影响。在混业发展、综合
知识产权有广义和狭义之分。狭义的知识产权即传统意义上的知识产权,包括著作权(含邻接权)、商标权和专利权,后两者又被合称为工业产权。广义的知识产权包括著作权、与著作权
民族预科教育是我国高等教育的一种特殊层次,是我国民族高等教育不可缺少的重要组成部分。为适应21世纪中国少数民族和民族地区对高等教育发展的需要,民族预科教育必须立足于
毛泽东论《金瓶梅》及对其研究的意义蔡琼一、毛泽东什么时候看过《金瓶梅》毛泽东什么时候开始接触《金瓶梅》的呢?目前尚无明确的史料记载。何况《金瓶梅》是一部“暴露黑暗
2008年全球金融危机之后,影子银行问题开始进入人们的视野并备受关注。这一阶段,我国影子银行发展迅猛,银信合作、委托贷款、地下钱庄等影子银行模式在金融行业中其规模所占
对灵芝的免疫调节、抗肿瘤、抗衰老、心血管系统活性、护肝解毒、镇静、降血糖等方面的药理作用进行了综述,充分展示了灵芝的补益强壮作用,为灵芝的临床应用开辟了广阔的前景
随着我国经济结构的调整,家族企业粗放式的生产经营模式受到了日益严峻的挑战,企业所面临的风险日益多样化、复杂化。当家族企业经营者由于“短视”或激进的投资决策给企业带