基于Hadoop的数据流管理系统设计与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:qunimadebicaocao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着信息技术的飞速发展,计算机网络的应用已经深入到各个领域,并发挥着积极的作用。作为网络数据的重要形式,数据流的应用价值日益凸显,在网络管理、工业控制、市场分析等方面都有着十分重要的作用。在网络管理方面,管理员可以通过数据流分析网络运行情况,优化网络配置;在工业控制方面,控制系统可以通过对数据流的实时监控,提高工业管理的智能程度;市场分析方面,工作人员可以通过数据流挖掘用户的行为记录,分析用户的消费规律。   然而,随着网络数据的不断丰富,数据规模不断扩大,数据流变得越来越难以管理。传统的数据流管理系统在扩展性、并行性等方面,逐渐不能满足网络管理员的管理需求。网络管理员希望使用更加高效的工具,来分析管理目前庞大的数据流。近年来兴起的云计算技术,为我们提供了解决大数据处理问题的思路。我们可以利用云计算的并行计算、分布式存储等能力,提高数据流管理系统的扩展性、并行性等能力,提升数据流管理系统的总体效率。在调研比较了众多云计算平台之后,本系统采用Hadoop作为数据流管理系统的支撑平台。Hadoop是目前应用最广的云计算平台之一,拥有丰富的功能、开放的接口、良好的性能,符合作为数据流管理系统基础平台的要求。   本文在深入调研了数据流管理的特点,认真研究了Hadoop关键技术的基础上,设计并实现了基于Hadoop的数据流管理系统。本系统采用Hadoop的分布式文件系统HDFS存储管理数据流文件,并设计实现了一种文件存储加速策略,提高数据流文件的存储速度;采用Hadoop分布式数据库Hbase存储管理数据流信息,为用户提供高效可靠的数据库服务;采用Hadoop并行计算框架MapReduce开发分布式计算程序,用来高效处理用户的查询搜索等计算请求;并基于Hadoop的Web接口开发了一套良好的用户功能界面,为用户提供多项数据流管理服务。本系统较集中式的传统数据流管理系统,在扩展性、并行性等方面有了一定的改善。
其他文献
步入当今信息社会,信息作为一种重要的资料及传输媒介,其价值已显得愈加重要。随之而来的就是对于信息的安全保护问题,大量黑客等的攻击、不法窃取造成的信息泄露等使安全问题愈
移动互联网技术的飞速发展,给人们的学习和生活带来了极大的便利,吸引着越来越多的人接触并使用移动互联网提供的业务。与此同时移动互联网的数据业务流量也以指数级不断增加,这
伴随着移动终端产品与3G网络的技术跃进,移动互联网的发展也进入了一个高峰时期,众多软件纷纷定制了可运行在移动终端上的版本,其中部分软件在涵盖了PC版本中全面功能的同时也继
近年来,互联网业飞速发展,由于其在本质上具有成长性、自治性和多样性的特性,而当下缺乏适合互联网自然特性的计算环境,这已成为制约互联网信息资源有效共享和利用的瓶颈,因
伴随着计算机技术的发展,云计算概念悄然兴起。云计算将普通的IT资源整合成虚拟资源池,供用户通过网络按需取用,从而大大提高了资源的使用率。云计算这些令人激动的特征,得益于虚
近年来,移动互联网展现了蓬勃的发展势头。一方面,计算机科学日新月异,移动网络带宽大幅提高,同时大量运算能力更强、交互方式更容易、价格更低的智能终端诞生;另一方面,随着社会的
随着网络技术的发展,Web Services已经成为现今最热门的企业级技术,它的应用已普及到社会的各个行业和领域。在这种趋势下,为了提供给用户可靠、安全、稳定的Web服务,在任何一个W
车载自组网为智能交通系统提供了道路交通安全应用,可以实现碰撞避免、安全警告等功能,从而防止和减少交通事故的发生。为了实现这些安全应用,车辆之间会周期性地广播包含车辆状
近年来,随着MapReduce分布式计算框架的提出,一场席卷全球的变革正在互联网领域内悄然发生。作为MapReduce的开源实现,Hadoop分布式系统得到了国内外各大互联网公司的广泛应用。
下一代互联网采用IPv6技术早已成为业界共识,然而时至今日在IPv4向IPv6过渡方面取得的成绩与以前的期望仍存在差距。在各种IPv4向IPv6过渡的方案中,DS-Iate方案是一种向IPv6