论文部分内容阅读
二十世纪九十年代以来,互联网逐渐深入到人们日常生活的各个方面,成为其不可或缺的一部分,而网络蠕虫也随之泛滥,产生越来越严重的危害。人们从不同思路和防范目的出发,研发了多种网络蠕虫检测技术;其中基于特征匹配的蠕虫检测技术误报率低,但是它对计算资源要求比较高,无法检测未知蠕虫,甚至已知蠕虫的变种;而近几年开始流行的基于统计的蠕虫检测技术虽然能检测蠕虫变种和部分未知蠕虫,但在实际应用时往往关注于大尺度的网络蠕虫发现,需要大范围地部署探测器,而且它们基本上都没有考虑到P2P流量对其算法的影响。现在P2P应用越来越广泛,P2P流量已经占到互联网流量一半以上,鉴于P2P流量和蠕虫流量在网络表现上有极大的相似性,P2P流量和蠕虫流量的区分在蠕虫检测算法中就显得尤为重要。
本文提出了一种适用于局域网、轻计算资源要求,基于流量统计信息的网络蠕虫检测方法。它只需在网关处部署,而无须在终端主机上安装,使用上极其方便。其基本思想是根据所监控的局域网内采集到的流量统计信息,应用机器学习中的监督学习方法(论文中具体采用C4.5决策树算法)得到网络正常流量行为模式和蠕虫流量行为模式之间的差异;在算法具体实现时使用了终端主机对外连接的(不同)IP地址数目、接收的数据包个数、接收的流量大小等多个流量统计特征。实验结果显示,该方法能很好的检测出已知蠕虫及其变种,对未知蠕虫也有一定的成效;对实际网络流量数据的检测结果显示它的误报率极低、同时漏报率控制在可以接受的范围内。特别需要指出的是,当网络流量中含有P2P流媒体、P2P文件下载等应用时,检测方法也能达到上述良好效果。此外,检测算法已在一个实际项目中得到应用。