论文部分内容阅读
近几年来,P2P应用程序的使用得到极大的发展,现在网络上流行的P2P业务,包括文件共享、即时通信、协同计算和联网游戏等带来的数据流量,已经超过了HTTP和FTP,占到了整个Internet流量的一半以上,给网络带来很大的负担。由于这类应用的普及和对网络带宽的较高需求,从而使得对其他的网络应用产生明显的影响,而且由于P2P协议的多样性、复杂性,造成了对该部分流量难以做出统计和控制。只有从网络中有效的识别出。P2P的数据流量,才能够对其进行流量控制、流量管理等工作。这使得对P2P流量识别技术的研究变得愈来愈重要。随着新开发和改进后的P2P程序不断出现,原有的一些识别方法已无法满足需要,这就要求研究新的识别方法来满足这一需求。
首先本文针对具有典型代表意义的P2P系统一BitTorrent的网络流量进行了传输层标志位、数据流分组尺寸、TCP握手时间和数据流头部分组分布四个方面的分析和研究,总结出了BT流量的两个特征,用于后面识别引擎的设计。
然后通过对主机进程与网络流量相关性的研究,提出了一个基于客户端特征进程的P2P流量识别方法。该方法通过对接入网络的主机上运行的进程进行检查,自动识别出P2P进程所产生的流量,使每一台客户端主机具有了识别自身产生的:P2P流量的能力。
在前面的研究成果基础上,设计了一个具有多种识别引擎的P2P流量识别系统。该系统由五大功能模块构成,其中识别模块是关键部分。客户端识别模块的主要功能是:客户端程序在服务器上下载P2P进程列表库,与本机运行的进程做比较,如果检测到P2P特征进程,则将该进程与外部主机的流量信息报告给系统,从而完成客户端主机对自身产生的P2P流量的识别。
与传统的:P2P识别系统相比,本文提出的新系统有以下特点和优势:
引入基于主机进程的客户端流量识别技术,可以有效地解决传统识别方法对于端口跳跃和数据加密造成的识别失效问题;单点识别与多点识别相结合,多种识别方法相结合,有效降低服务器负担,提高识别效率;引入识别引擎管理控制机制,增强识别系统的扩展和更新能力;引入了TLS安全通信机制,以保证客户端识别模块与系统之间的通信安全。整个系统采用了多种识别方法相结合,从不同的层面对P2P流量进行识别,与传统的P2P流量识别方案相比,能在一定程度上提高局域网中P2P流量识别的效率和准确率。