多资源服务器协同环境下的HTTP流量分析

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:denggaoangyuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数年以前,基于HTTP的网络业务由若干服务提供商以中央集中的方式提供,鲜有分布式服务器的存在。通常的情况是,单一服务器提供独有的网络服务,并且固定在某个IP地址上。现如今,网络结构日益复杂,IP地址与其提供的内容及服务开始变得动态化和复杂化:运营商大量使用内容分发网络(CDN, Content delivery network)、内容缓存,基于云的网络服务不断涌现,服务提供商与承载服务的基础设备之间耦合程度正在减弱,所有这些都使得网络管理更加困难。在如此形势下,运营商迫切需要把握HTTP流量构成及使用模式,搞清HTTP流量在不同服务提供商间的分布,以便合理配置网络资源。与此同时,由于网络流量的剧增,传统的流量分析方法已无法满足海量数据的存储和处理要求,需要引入更高效、更可靠的方式进行处理。Hadoop正是一个能够对海量数据进行可靠的分布式处理的可扩展开源软件框架,并已经被应用于越来越多的研究领域。本文首先介绍了基于关联规则的HTTP流量分析算法,利用jaccard系数衡量流量相关性并给出数学描述。随后,本文介绍了Hadoop的基本原理,并在Hadoop技术的基础上提出了HTTP流量分析系统的三层体系结构,将网络流量的采集、存储、处理和分析等独立的功能整合到一起,形成具备完整功能的处理系统。接着,本文对前述系统数据层的IP地址识别组件进行了重点介绍。此组件实现了服务器IP地址向服务提供商的映射,是本文所述HTTP流量分析系统最重要的组成部分。最后,利用系统采集层和数据层的处理的中间结果,本文在HTTP流量分析应用层总结了HTTP流量分布规律。
其他文献
内容中心网络(CCN, Content-Centric Network)是一种以内容为中心进行路由、缓存的新型网络体系架构。内容中心网络力图改变当前互联网以主机地址为中心的点对点通信模式,提
随着国民经济发展和国防安全的需要,合成孔径雷达图像应用已经成为SAR技术中的一个重要领域。合成孔径雷达图像是对被测地面目标的电磁散射特性的映射,映射包含了雷达信号在大
木素是自然界中含量最丰富的可再生性有机资源之一,其生物降解构成自然界碳素循环的限速步骤。真菌中的白腐菌类具有完整的木素降解体系,能将木素彻底氧化性降解为CO和HO。黄孢
发光LED是当前新型的发光源,比传统光源(白炽灯和荧光灯)节能50%~80%。城市景观照明及室内外装饰照明灯具必将逐步被节能、环保、寿命长、可靠性高及可实现全彩变化的LED灯具所取