【摘 要】
:
随着入侵检测等高维数据机器学习问题的不断涌现,已有的特征选择算法和机器学习算法面临着严峻的挑战,迫切需要准确性和运行效率等综合性能较好的特征选择算法以及机器学习算
论文部分内容阅读
随着入侵检测等高维数据机器学习问题的不断涌现,已有的特征选择算法和机器学习算法面临着严峻的挑战,迫切需要准确性和运行效率等综合性能较好的特征选择算法以及机器学习算法的出现。本文将围绕特征选择、集成学习及其在入侵检测中的应用三个方面展开研究。主要工作包括以下方面:1.提出了基于margin的特征子集的评估。该方法通过计算特征子集的margin值来评估由Rough Set模型诱导出的特征子集的优越。实验表明,多数情况下,当特征子集的基数相同时,margin大的特征子集比那些margin值相对较小的特征子集有更好的分类效果。2.提出了一种基于混合差别矩阵的特征选择算法。该算法通过构造混合差别矩阵的方法,解决了传统的粗集特征选择方法只能够处理离散属性的数据却不能直接处理混合属性(既有离散属性又有连续属性)的数据的缺点。实验表明分类器在该算法得到的特征子集上有较好的分类效果。3.提出了一种新的适于高维数据的有监督的特征选择集成学习算法。该算法用基于margin的特征子集评估准则来选择特征子集,构造了准确率比较高的个体分类器,提高了集成学习的效果。实验表明该算法比传统的基于特征选择的集成学习算法有更高的分类性能。此外,本文还把Bagging技术引入到特征选择集成的算法中并且取得了比较理想的实验效果。4.提出了一种基于分类器集成的半监督学习算法。该算法通过分类器集成技术从未标记示例中挑选出若干置信度较高的示例进行标记,从而使分类器模型得以更新,解决了在入侵检测系统中,训练数据稀缺的条件下保证检测效率难的问题。实验结果表明,本文提出的算法能有效地减少学习样本数,并且能有效地提高入侵检测系统的检测率,降低入侵检测系统的漏报率和误报率。
其他文献
序列流水车间调度问题(Permutation Flowshop Scheduling Problem,PFSP)在物流、交通、流水线生产等实际工业领域有大量应用,合理的时间内高效地解决PFSP关系到许多领域的生产
事件关系检测是一项面向文本信息进行事件关系判定的自然语言处理技术。事件关系检测的核心任务是以事件为基本语义单元,通过分析事件之间的语义关联特征,实现事件逻辑关系的
时空数据库是涉及对象时间和空间特性的复杂系统,对其拓扑关系的描述与判断在时空数据建模、时空查询、时空分析、时空推理、数据更新等方面起着重要的作用。因此,对时空数据
软件测试作为软件开发过程中的重要一环,对于保障软件质量起着至关重要的作用,而测试数据生成方法的J下确性和有效性,又是一个成功测试的根本。因此,测试数据生成方法的研究,对于
电信自助服务是自助服务在电信行业中的应用。随着各种信息技术的发展,电信自助服务的发展趋向于网络化和功能多样化。网络化和功能的多样化发展将直接导致自助服务受各种攻
文本分类技术是对文本进行有效管理的方法之一,是一项重要的智能信息处理技术,是文本检索技术的基础。文本分类对于提高信息检索的效率和效果很有帮助,良好的分类性能是人们
随着我国CDMA网络建设规模不断扩大、应用逐步走向深入,如何对网络资源进行合理调配、不断提高业务质量成为吸引客户和进一步拓展业务的必要条件,相应的运行维护支撑工作、特
所谓视频驱动就是对视频中的人脸进行跟踪,利用人脸的表情信息驱动卡通人脸模型,使其产生一致的动画效果。视频驱动的人脸动画一直是计算机图形学和计算机视觉研究领域中的难
随着电子商务技术的高速发展,特别是近几年以XML为基础的ebXML ( Electronic Business XML)技术逐渐成熟并开始应用,XML已经逐渐成为数据交换的标准。XML由于具有简单性、易
智能视频监控涉及到数字图像处理、机器学习、模式识别、人工智能和数据挖掘等诸多研究领域,其中智能化部分的运动目标的行为分析与理解属于高层视觉处理,该部分是计算机视觉领