分布式流计算框架节点管理功能的设计与实现

来源 :北京邮电大学 | 被引量 : 9次 | 上传用户:qu123qu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今时代,信息技术的迅猛发展带来了数据量的飞速增长。这些数据不仅包含数据库中的结构化数据,还含有海量来自于电子邮件、传感器、在线视频等非结构化、互不兼容的、实时的数据。面对极大的实时数据流量,传统计算模型不再能满足需求。如何有效处理海量非结构化实时数据成为焦点,这促进了处理实时数据的分布式流计算框架的蓬勃发展。目前比较典型的分布式流计算框架有IBM的InfoSphere Steams和Yahoo!公司的S4(Distributed Stream Computing Platform)[1]系统。InfoSphere Steams是一款比较成熟的流计算产品,遗憾的是,该产品需要付费并且不开源,不能进行研究和改进。后者是Yahoo!公司开发开源分布式流计算框架,目前高速发展,是Apache旗下的子项目。S4是一个分布式流计算平台,它有良好的可扩展性,具有部分容错能力,能够支持插件并且较为通用。S4系统有诸多优势,但仍然存在节点管理不完善,不能动态增加,删除节点的缺陷,同时S4系统管理员不能直观地使用管理界面对分布式流计算框架中各节点进行全面的管理和监控。本文改进S4在节点管理方面的不足,首先介绍流计算和S4的研究发展情况,重点描述S4在节点管理方面的不足。接下来针对S4在节点管理方面的不足,提出分布式流计算框架节点管理总体需求,包括动态管理节点需求及Web节点管理需求。之后针对总体需求,设计相关方案和架构。针对动态管理节点需求,设计并实现两阶段映射的节点管理方案;针对Web节点管理需求,提出采集层、分析整合层、表示层、用户层的分层架构,并对各层次进行设计与实现。接下来,对分布式流计算框架节点管理各项功能进行全面的功能和性能测试,验证了本文设计实现的分布式流计算框架节点管理在功能和性能方面的优势。最后对本文设计实现的分布式流计算框架节点管理提出建议和下一步研究方向。
其他文献
云计算是一种通过网络以便利的、按需付费的方式获取计算资源的范型,这些资源来自一个共享的、可配置的资源池,并能够以最省力的、无人干预的方式获取和释放;它们通常是基于虚
社会网络可视化技术属于信息可视化技术中复杂网络可视化的范畴,社会网络的结构非常复杂,如果只用数据表格或文字的形式来表示网络,不但难以理解,而且网络所包含的信息难以体现。
2005年IETF(Internet Engineering Task Force,因特网工程任务组)提出的NBS(NetworkMobility Basic Support,网络移动性基本支持)协议扩展了MIPv6(Mobile IPv6,移动IPv6),提供一种当
随着机动车使用数量的日益增多,公安部门从监控图像查找犯罪车辆的难度也日益增加,如何快速、实时地从海量视频数据查找犯罪车辆问题成为摆在公安部门面前的核心问题。基于多核
云计算是一种将大规模的IT资源通过互联网按需快速地交付给用户的服务模式。通常基础设施(IaaS)云服务将云计算中心的物理资源转化为由虚拟机组成的资源池,实施资源池化管理。
随着时间的推移,客观物质在不断变化,不断有信息数据发生变化并有新的信息数据产生,如何有效处理这些历史数据,当前数据,和未来数据,这使得时态数据库应运而生。由于时态数据需要海
当前网络安全问题已经从传统的互联网范围延伸到了工业控制领域。随着工业4.0进程的不断推进,工业控制网络这种最初被设计成相对封闭环境的网络结构与互联网的连接愈加紧密。
更快速的处理海量数据,是数据中心计算领域永恒的追求。随着数据量的爆炸式的增长,以及应用领域对于数据处理时效性的要求越来越高,数据处理的压力越来越大。人们不得不着手
随着信息技术的发展,企业数据量的快速增长,全球数据量向PB发展,传统的文件系统已不适应这种大数据量的管理。在这种背景下,并随着分布式系统、网格计算等技术的发展云存储系统逐
人脸关键点是指人脸中具有特质特征的区域,比如眼角、嘴角等。人脸的关键点检测不仅对于人脸识别有很大作用,而且可以为表情识别提供基础。人们在日常生活中相互交流,语言的交流