基于数据挖掘的异常流量分析与检测

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:kollisjordan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网络的飞速发展、网络的规模及其所承载的业务类型日益增多。虽然互联网的发展给人们带来了很大的方便,但是,网络出现异常情况的机会也随之增大。如何准确、快速地检测出网络中的异常流量并做出及时、合理的响应具有重要的实际意义和应用价值。近几年,研究者们提出了基于数据挖掘的异常流量检测方法,从海量数据中自动地发现隐含的、有用的知识,形成检测规则,从而发现异常情况。针对这些内容,学者们进行了广泛的研究。首先,本论文通过广泛的调研对国内外异常流量检测与分析的技术发展和现状有了一定的了解。然后对异常流量定义及其分类、异常检测方法进行概述,并对主流的流量检测和异常流量检测技术进行详细的分析和对比,根据其原理,对其优点与不足进行说明。其次,本文对数据挖掘算法中的聚类算法进行了研究,将基于密度的DBSCAN算法用于异常流量的检测。采用改进的基于网格的DBSCAN聚类方法对离线数据集进行训练与测试,得到异常流量特征趋势,区分出哪些是正常行为,哪些是异常行为。此方法可以发现任意形状、不同大小的簇并有效地识别边界点和去除噪声点,使得聚类结果更加精准,同时执行效率也有所提高。再次,本文对异常流量分类的方法进行了研究。运用交叉熵理论来度量流量特征的分布变化,当出现异常行为时,会使得两个连续观测点之间的交叉熵突然增大。本文使用源IP地址、目的IP地址、源端口、目的端口、流大小、入度、出度、包数目8项特征属性的交叉熵来对网络异常流量进行分类。定义蠕虫病毒、DoS攻击、DDoS攻击、端口扫描攻击、异常P2P流量5种异常流量的属性特征,采用欧式距离判断攻击类型。此方法能根据异常流量的特征将异常流量分类,使得分类结果准确度有所提高。最后,本文通过离线数据集KDD 99以及基于网格的DBSCAN算法和交叉熵理论进行异常流量监测的模型建立,采用基于NetFlow形式的网络流进行流量数据的采集,对模拟实时流量进行检测与分析,为日后能迅速排查网络异常、找准异常原因、提供解决方案提供检测依据。
其他文献
毛泽东的书法艺术在现代书法史上独领风骚,堪称大家。其书法的用笔特点主要是:藏露结合、中侧并用、方圆兼得、轻重变化、牵丝映带;其线条风貌主要是:粗犷、刚劲——立体感与力感
旨在探析设计语义的使用对商品形象创建和传播的意义,如何实现商品符号与消费者之间的有效沟通。从语义学的概念和意义出发,将设计语义学和消费社会的“符号消费”特征相结合,论
沈阳市城乡收入差距问题已十分突出,其城乡收入差距指数已高于同等收入国家水平,必须引起高度重视。为促进城乡经济的协调发展,加快城市化建设,减轻农民负担,增加农民收入,缩
三甲基叠氮硅烷是一种重要的化工原料。在二氯甲烷溶剂中,以三甲基氯硅烷和叠氮化钠为原料,碘化钠为催化剂,聚乙二醇400为相转移催化剂,合成了三甲基叠氮硅烷。实验考察了摩
提出一种基于SOA的教育资源整合平台的解决方案,给出了整合方案的系统架构,实现整合平台中的单点登录。
首先介绍了DDS(直接数字频率合成器)的结构和工作原理,然后给出了一个基于AD公司的DDS芯片AD9952和TI公司的DSP芯片TMS320VC5402的跳频通信用信号源的方案,分析了部分组成.最
中国手工业时代从公元前21世纪夏初期开始至19世纪中叶。技艺教育起源于原始人类对生存技艺的传承。最早的手工业专门著作《考工记》记述了官营手工业工种规范和制造工艺的文
幼儿莫不可爱。其面目之哈喜。举动之娇憨。一嗔一笑具足动人怜爱而为父母者。亦几无不以聪慧目这英器许之。迨年稍长。则钝者有焉。顽者有焉。能能副向日之所期者甚寡。则幼
期刊
从古至今南方丝绸之路与海上丝绸之路承载了经济、文化、政治功能,促进区域经贸合作,带动地域文化交融。云南是海上丝绸之路和陆路丝绸之路的交汇点,地理战略位置意义非凡。
本文对王力《古代汉语》四册教材的文字关系的注释部分进行研究分析,运用有关文字学知识,对其可商榷之处作系统的论证,尽可能给予准确的解释和说明。从自相矛盾、误注通假、