论文部分内容阅读
P2P文件共享系统在全球范围内的大规模应用,为用户的资源共享带来便利的同时,也给网络流量监管、软件版权保护等工作带来了新的挑战。针对P2P系统开展测量与可视化分析的研究工作,可更好地理解P2P系统特征,获知P2P系统对当前互联网的影响,并可为P2P系统优化、网络流量监管和网络内容规范等工作提供技术支持。为此,本文对P2P系统的网络测量、数据分析及特征可视化等关键技术进行了深入的研究与实现。
本文以eDonkey、BitTorrent和Gnutella等主流P2P系统作为研究对象,深入分析了它们的运行机制与协议内容,比较了P2P系统主动测量与被动测量两种方法的原理与特点。通过综合分析已有的研究工作,发现其存在测量方法单一、数据完备性不高、特征分析不全面、可视化研究较少、研究成果的实用性较差等问题。针对这种现状,本文结合主动测量与被动测量两种方法确保了数据的完备性,并从监测的角度出发,实现了P2P特征可视化系统,深入分析和全面展示了P2P系统的多种特征,具有较强的实用性。
P2P系统测量是特征可视化的基础,本文对三种主流的P2P系统分别进行了主动数据探测和被动流量分析,解决了主动测量和被动测量实施中的典型问题。其中,eDonkey主动测量主要获取了eDonkey服务器信息、客户端信息及共享文件信息,BitTorrent主动测量主要获取了种子信息及节点信息,而Gnutella主动测量则获取了节点信息及网络消息。被动测量方面,重点实现了协议特征匹配等P2P流量识别技术。经过实际的部署,获取了大量的数据实例。通过对主动和被动测量融合的方式,提高了数据的准确性、可靠性和完备性。
在对P2P系统的特征数据进行了分类的基础上,针对不同类别的信息,分别设计了相应的可视化方式,完成了一套P2P系统特征的可视化软件,将多种P2P系统的可视化界面集成在一起,并从拓扑特征、资源分布、用户行为和流量特征等方面对各个P2P系统的特征信息进行深度刻画和展现。针对拓扑特征,用国内节点分布图、国际AS分布图、AS拓扑图等方式进行可视化,有助于了解P2P节点地理分布情况与变化趋势,确定关注的重心;针对资源分布与用户行为特征,采用列表及统计图的方式进行可视化,有助于发现P2P系统的资源中心,保存资源历史记录和用户查询记录,作为网络流量管理和内容规范等工作的依据;针对流量特征,综合了连接关系图和流量统计图进行可视化,有助于发现网络中流量较大的节点,作为流量管理的对象。总之,通过该软件,使用者可便捷、直观地了解P2P系统的使用情况,有目的地开展P2P系统优化、网络流量管理和网络内容规范等工作。