论文部分内容阅读
                            
                            
                                近年来P2P网络应用和多媒体技术飞速发展,使得P2P流媒体应用逐渐成为一个深受广大互联网用户欢迎的热点业务。但随着P2P流媒体业务的普及和其流量的扩大,各种严重的安全问题也层出不穷。因此对P2P流媒体流量进行有效监管成为一个研究热点。然而到目前为止,在大多数技术方案中,通常是将P2P流媒体流量作为P2P流进行处理,还没有单独将流媒体流量和文件共享系统的流量区别开来,无法有效并精确地识别P2P流媒体流量。  
 论文从研究P2P流媒体流量行为特征出发,通过有监督的分类学习达到了P2P流媒体流量识别的目的。论文主要研究内容如下:  
 (1)P2P流媒体流量特征分析  
 论文设计并实现了一个完整的流量特征分析系统,该系统包含了流量采集模块、数据包预处理模块、流量分流模块以及特征属性计算模块。通过对几种常用P2P流媒体系统的数据包进行大量的实验,利用数据包分析处理技术分析、总结出各P2P流媒体应用的流量特征。  
 (2)基于机器学习分类的流量识别研究  
 对基于数据挖掘的P2P流量识别技术进行了研究和总结,在分析P2P流媒体流量特征规律的基础上,采用机器学习分类算法对所选取的流量特征属性进行了分析和处理。通过使用有监督的机器学习方法首先对训练样本进行了建模,并利用所建分类器对待测样本进行了分类学习,最后从建模时间、测试时间和分类准确率三个方面评估了所选数据挖掘算法和流量属性对于P2P流媒体流量识别的性能和效果,并重点研究了TTL值对于流量识别正确率的影响。