【摘 要】
:
网络技术的发展,促进了社会经济的进步,同时也带来了新的安全风险,入侵检测是维护网络安全的关键技术之一。入侵检测可以看作分类问题,可从分类的角度进行研究。本文研究工作如下:(1)针对入侵检测中已知类别的检测问题,设计了权重森林算法。权重森林属于集成学习,从多样性与准确性的角度设计。权重森林多样性体现在数据样本扰动、每颗树只由一个属性生成和权重矩阵的更新方式;权重森林准确性通过激活函数与全连接层保证。
论文部分内容阅读
网络技术的发展,促进了社会经济的进步,同时也带来了新的安全风险,入侵检测是维护网络安全的关键技术之一。入侵检测可以看作分类问题,可从分类的角度进行研究。本文研究工作如下:(1)针对入侵检测中已知类别的检测问题,设计了权重森林算法。权重森林属于集成学习,从多样性与准确性的角度设计。权重森林多样性体现在数据样本扰动、每颗树只由一个属性生成和权重矩阵的更新方式;权重森林准确性通过激活函数与全连接层保证。实验中,数据集采用CICIDS2017,使用668个样本作为数据集,全部样本作为测试集(共两百多万个样本)。实验结果为,15个类别中10个类别的检测率都大于等于0.99,性能好于随机森林。(2)针对入侵检测中变种攻击的检测问题,权重森林融合PCA,通过距离检测变种攻击,在本文中称为Weight_Forests-PCA算法。基本过程是对权重森林上的叶子节点进行编号,对训练得到的编号数据集进行标准化和PCA降维,利用均值计算类别中心,在测试数据上实时计算出样本到类别中心的距离。如果距离在大幅度的改变则说明有变种攻击的产生。实验中,验证了该算法能够实现无监督变种攻击的检测。(3)为了降低权重森林的训练时间,从数据并行与模型并行的角度,设计了权重森林的并行化方案。权重森林并行化的基本思想是将节点进行并行设计。将训练数据按照特征进行数据集划分,实现数据并行。模型并行,是通过各节点的生成、权重矩阵的生成和更新、各节点在训练全连接权重时节点输出的并行实现。实验中,使用加速比与并行效率指标,测试了权重森林并行化的性能,结果表现良好。(4)针对入侵检测资源受限的问题,对权重森林的增量化改进,使其具有增量学习的能力,改进的算法被称为增量树算法。增量树是将样本信息存储在叶子节点上,设置分裂条件和有效树系数,用于树的生长与替换。实验中,验证了增量树算法的增量学习能力。(5)对权重森林进行模块设计与实现。权重森林模块包含分类、概念漂移检测和增量学习三个模块,分别用来实现分类、概念漂移检测和增量学习。本文首先针对已知类别的检测,设计了权重森林算法。其次对权重森林进行增量化的改进,实现增量学习。然后结合PCA,通过距离的变化反应变种攻击的发生。最后对权重森林进行模块设计与实现。
其他文献
与完全公开了通信规约的已知协议不同,当今的网络中有着许许多多的未知协议,个人或者一些软件厂商考量到有关安全问题、经济利益甚至个人隐私等各种各样的问题,他们并没有选择将协议的细节部分公之于众。由于未知协议在实现和实际应用过程中可能存在各种类型的安全威胁,且在实际网络环境中,目前的网络安全设备多基于已知的协议报文格式进行检测和防护,导致未知协议在实际通信应用过程中面临着极大的安全威胁。分析其存在的安全
分类、定位、检测、分割是计算机视觉领域最核心的任务。近年来,卷积神经网络(CNNs)技术取得了瞩目的成就,促进了目标检测技术飞速发展,越来越成为人类生活的便捷工具,在智能安防、智慧医疗、自动驾驶等领域广泛应用。尽管基于深度学习的目标检测取得长足进步,但在检测不同大小的物体存在相当大的性能差异。小目标物体由于自身尺度问题,存在被遮挡,特征不明显等问题,导致小目标难以检测。因此,小目标检测的研究也逐渐
域适应(Domain Adaptation,DA)是迁移学习的一个分支,其目的是将知识从带标记的源域迁移到缺乏标记但任务相关的目标域,为借助已有的数据知识和节约模型训练的资源成本提供了有效途径。根据目标域数据的获取形式,域适应方法可分为离线域适应和在线域适应。现有的域适应研究大多针对目标域数据全部提前收集的离线域适应场景,它们提出的方法大多从特征层面上关注如何减少两域数据分布的差异,在知识迁移的过
随着大数据时代到来,问答系统作为一种能够高效获取有效信息的手段,引起了各行各业的广泛关注。在军事装备领域,大量的装备类型、型号以及参数信息等对指挥作战人员非常有用,但这些信息却未能得到有效利用。主要原因是现有的搜索引擎给出的查询结果数目过于繁多,相关工作人员无法迅速找到自身所需的信息。针对传统搜索引擎在装备领域存在的问题,本文基于军事装备数据,构建了一个契合用户的个性化问答系统。该系统采用模块化方
目标检测通俗来说,便是找出图像中指定的目标,同时需要找出目标位置和大小。目标检测的根本内容便是“什么目标在哪里”。对于小目标的定义一般有两种,一种是COCO数据集[1]中定义的,物体像素值小于32×32,另一种定义方式是目标的宽和高均在原图十分之一以下,满足以上两种条件之一,则定义为小目标。随着科技的发展,高分辨率航拍图像可用性越来越高,其中包含了大量安全、土地开发、疾病控制、缺陷本地化、监视等相
安全外包计算技术作为云计算的一种应用方式,已经得到了个人和企业的关注。外包计算就是一些硬件条件有限的客户端将需要大量计算资源的任务外包给云服务器,以达到节约自身资源的目的。虽然外包计算在大数据时代拥有广阔的应用前景,但云服务器的不可靠行为是制约外包计算发展的重要因素。如何保证客户端外包数据的安全是设计方案时关注的重点之一。此外,方案的正确性、高效性和结果可验证性也是外包计算的基本要求。大规模矩阵乘
随着人工智能技术的成熟,语义分割方法也迎来了飞速发展的机会。语义分割作为一种像素级的预测任务,为了获得较高的性能,需要耗费大量的计算资源进行训练学习。然而随着自动驾驶和移动机器人需求的日益增长,在分割精度和分割速率之间进行平衡显得尤为重要。鉴于此,本文以自动驾驶领域作为应用场景对语义分割展开研究,兼顾分割精度和分割速率,实现快速准确的语义分割。本文主要研究内容如下:(1)针对不同尺寸特征图之间像素
近年来,在线社交网络已成为信息传播最为重要的网络平台。推特作为境外分享信息的主要社交平台,拥有海量的活跃用户与大量的推文发布,充斥着海量隐私信息并暴露于公众视野,导致了社交网络中极高的隐私泄露风险。因此,研究社交网络中的隐私信息传播具有重要意义。本文针对推特中包含隐私信息的推文,构建了隐私信息传播的级联图,对隐私信息的传播特征开展分析,在此基础上提出了隐私信息传播模型的构建方法。本文的主要贡献如下
深度学习的发展提高了计算机处理图像的能力,拓展了计算机视觉的应用。同时,基于视觉任务的端到端的自动驾驶技术也在不断地发展。但是,目前深度学习在端到端的自动驾驶领域应用较浅,基于深度学习技术构建的决策模型不能很好的完成自动驾驶任务。因此,研究基于深度学习的决策模型具有重要的理论意义与应用价值。本文基于深度学习技术,设计了一个可以根据道路图像预测出驾驶动作的模型,并在模拟器上进行了实验仿真测试。最后,
对话系统作为自然语言处理的重要研究分支,在近几年持续受到研究者的关注。海量数据的出现和深度学习的快速发展为对话系统的建模提供了重要支持。对话系统一般分为任务型和检索型,任务型对话系统需要从对话中对用户意图进行识别并完成特定任务;检索型对话系统需要根据多轮历史对话,结合深度匹配模型,从回复模板库中检索出与当前对话最为匹配的回复候选项。检索型对话系统的回复检索性能,容易受到数据集质量的影响,并且当前的