基于sniffer数据的分类学习算法的研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:xiaoxiaoDang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的发展,信息安全正日益成为人们关注的焦点。而且目前的入侵者不再限于最初的熟知操作系统和各种软件的专业人员,现在的Internet上到处充满着各种各样的黑客工具,只要稍有一些基本计算机和网络知识的人都可以直接利用这些工具对机器和网络进行攻击,这就使得计算机系统和网络基础设施受到更加严重的威胁。 入侵检测技术是信息安全主动防御技术的关键技术之一,它的目标是主动发现并阻止入侵行为的发生,但是不影响系统的正常运行。入侵检测技术按照其核心即分析器来看,可以分为误用检测和异常检测两类,误用检测能将观察到的现象与己知的入侵模式进行匹配从而得出是否有入侵行为的发生;异常检测建立系统的正常模式,任何偏离正常模式的行为都被认为是可疑行为从而不让其进入系统。 1998年,美国麻省理工学院林肯实验室提供了DARPA的模拟系统的入侵检测数据集,针对这种基于sniffer的数据集,很多个人和组织提出了他们各自的检测方法;在1999年,同样出现了DARPA 1999数据集,它比DARPA 1998的数据集包含的攻击类型更多,数据更丰富。佐治亚理工学院的Wenke Lee教授和哥伦比亚大学的一些教授们将DARPA 1998的数据预处理后生成了KDD CUP 1999的比赛数据,期望能获得一个最佳的分类学习算法。本文也对此进行了研究,我们的工作主要有以下几点: ● 对现有的利用DARPA组织提供的sniffer数据源进行入侵检测的方法的综述和分类,它们分别是基于数据挖掘分类学习的RIPPER分类学习算法、袋装推进C5算法和决策森林算法;基于改进的机器学习方法的LERAD算法;基于神经网络的关键字选取算法。 ● 对上述算法主要从检测率和误报率上进行了比较,并指出,①对于DoS攻击,RIPPER算法和决策森林算法相对表现较好,但是检测率并不理想,并且它们对于一些没有出现在训练数据中的新攻击和一些攻击的变种基本不能检测;②对于PROBE攻击,RIPPER算法表现很好;③对于U2R攻击,基于神经网络的关键字选取算法的执行结果有较大的优势,而另外两种决策树算法对于U2R攻击的检测率非常低;④对于R2L攻击,由于只出现在测试数据中的新攻击较多,而且这些新攻击和已知攻击的变种由于利用了系统或网络的漏洞,变化较大,所以不容易检测到,RIPPER等算法的检测效果很不理想。但是对于改进的机器学习算法LERAD来说,检测结果相对较好。 ● 我们先使用了C4.5算法进行了训练,对于某些攻击记录检测结果相当理想,对于 不理想的攻击记录数据,我们又提出了扩展的C4.5算法,即袋装保持C4.5算法和GT算法,并使用这两种方法进行了大量的实验,实验证明这两种方法具有检测效果好、运行代价低和训练代价低的优点。然后,我们又进一步提出了利用normal规则对于已经经过训练的攻击记录的测试和未训练过的新攻击记录的测试,最后得出结论是利用C4.5算法训练出的normal规则来做异常检测对于前一种情况是比较理想的,但是后一种情况是不理想的,同时也提出了解决的方向。
其他文献
由于片上系统(SoC)的规模和功能在不断膨胀,为了保证设计的正确性,缩短设计的周期,在设计过程中的验证就变得越来越重要,也更为复杂,向业界提出了挑战。  SoC的验证包括模
当前,Web技术在网络上的应用日益广泛,其中使用Java的Web开发者飞速增长。J2EE已经变成Web开发的主流平台之一。 J2EE(Java2platformenterpriseedition)是美国Sun公司推出的
随着企业竞争全球化的发展,企业必须不断提高自己的信息化水平,来满足现代企业业务变化、激烈竞争的需求。目前,EAI是企业进行信息化改造的主要方法,而网格技术的出现则为新一代
随着计算机应用的日益普及,人们对计算机的依赖程度越来越高,运行在其上的软件就显得尤为重要。但是自从软件诞生以来,其质量问题一直是困扰软件开发者和管理者的主要问题,近年来
本文研究的烟箱搬运机器人视觉系统主要应用于国内的烟草生产企业,也是国内烟草生产企业第一次使用带有视觉功能的机器人系统,无论从理论还是实践方面都具有里程碑的意义。通过
本文首先介绍了分布式系统和分布式对象的概念,对比分析和研究了分布式对象和传统面向对象的区别以及当前应用于分布式对象系统中的主流技术。然后结合分布式系统的特点和Java
当前,WEB技术在Internet上得到了广泛的应用,它支持实时的信息发布、动态的拥护交互以及与后台系统的灵活的安全的连接。因此如何构造功能更加强大、应用更为灵活、开放更为简
软件产业的快速发展越发体现出构件技术的重要性,构件技术是软件的可重用性的基础,本文介绍了几种流行的软件构件标准。同时随着Internet的快速发展,面向构件的J2EE互联网应用基
网络世界的数据信息一般涉及文字、图像、视频、音频等多种模态,这些多模态数据在表达相同语义信息的同时也包含了丰富的互补信息,使人们可以从不同角度对相关事件或目标对象的
Web服务(Web Service)是松散耦合的、可复用的软件模块,封装了离散的功能;服务在Internet上发布后,能够通过标准的Internet协议在程序中访问。Web服务组合就是多个服务按照一