MapReduce编程模型相关论文
提出了一种基于Hadoop架构和MapReduce编程模型实现的面向大数据的FP-Growth频繁项集挖掘的改进算法。首先将事务数据库按每个频繁......
随着互联网的兴起与日益激增的数据处理需求,云计算以其低廉的成本,强大的运算存储能力与高可靠性等众多优良特性逐渐受到各大IT企业......
信息化技术的不断深入应用,特别是网络技术的迅速发展,导致了数据的规模急剧增长。因此,如何保证海量数据的有效存储和管理,提高针对海......
并行计算是提高计算机系统计算速度和处理能力的一种有效手段。MPI是目前开发并行应用程序的主要编程模型——消息传递编程模型的......
复杂系统是现实世界的重要组成部分,复杂网络是对复杂系统的抽象。研究并发掘复杂网络的性质可以帮助人们更好的理解复杂系统。随着......
社团划分在生物、医疗等方面有着举足轻重的作用,但是随着数据规模的扩大,经典的串行算法已经不能满足人们的需要,为了能够适应大规模......
随着信息技术的飞速发展,设备日趋集成化与复杂化。对于如何能及时发现和预测故障,保证设备在工作期间高效、可靠的运行,以及如何从历......
随着信息技术和互联网的发展,基于流式数据的应用越来越多,传统的计算架构已经无法满足这类应用的需求。本文针对于基于数据采集和在......
随着数据爆炸性地增长,如何高效的分析和存储海量数据引起了人们的广泛关注,传统的网格计算、并行计算和分布式计算已经不能满足现在......
随着互联网技术的飞速发展以及云存储技术的不断完善,大规模数据的处理机制也发生了巨大的变化。面对在互联网应用中每天产生的大规......
近年来,数据密集型计算越来越得到相关学者的关注。数据密集型计算环境下的数据具有海量、高速变化、分布、异构、半结构化或非结......
数据的指数级增长向世界互联网巨头Google、Yahoo、Amazon和Microsoft等这些处于市场领导地位的公司提出了挑战,它们需要分析TB级和......
以虚拟化技术为基础的云计算正成为研究人员关注的焦点,基于云计算的商业模型和学术研究不断涌现。在过去的几十年里,由多核和多处理......
实体解析用于判断两个数据记录是否描述的是同一实体对象,记录聚合则把所有属于同一实体对象的数据记录进行聚集,建立关联,方便交......
约束频繁模式是利用用户给定的约束条件,生成的一种频繁模式,具有针对性强、挖掘效率高等特点.随着数据量的增大,约束频繁模式生成......
本论文在研究MapReduce编程模型的基础上,对Maper和Reducer函数的编程流程进行了深入的研究并在Hadoop框架的基础上,进行Kmeans聚类......

