【摘 要】
:
异常检测(Anomaly Detection)是一个经典的机器学习任务,其目标是识别出数据集中的异常样本,在智能生产、视频监控、网络入侵侦测等领域有着广泛的应用。在20世纪初期随着机
论文部分内容阅读
异常检测(Anomaly Detection)是一个经典的机器学习任务,其目标是识别出数据集中的异常样本,在智能生产、视频监控、网络入侵侦测等领域有着广泛的应用。在20世纪初期随着机器学习算法的普及,异常检测有了较大的突破,有基于SVM的方法如One-Class SVM,有基于密度的局部离群因子算法,也有基于决策树集成的孤立森林等等,在今天依旧有着不错的表现。近几年来随着深度学习的盛行,也逐步出现了基于深度神经网络的异常检测方法,相较于传统的机器学习方法在面对高维数据时有着更好的表现。通常情况下,异常检测定义在正常样本和异常样本混合的无标注数据集上,其中正常样本占据大多数,由于标注信息的缺失,异常检测被定义为无监督学习任务。在实际的应用场景中,除了无标注样本之外,通常可以获取到少量的有标注样本。半监督异常检测旨在利用少量的有标注信息来提升模型的性能,而已有的半监督异常检测方法很少,并且都是针对特定的领域。半监督异常检测更加贴近真实的应用场景,但其发展尚未完善,是异常检测研究的一个重点课题。在此背景下,本文针对半监督异常检测中的若干问题进行了研究。本文的创造性研究成果有:1.形式化地定义了半监督异常检测的数据场景,分析了该数据场景的特点以及存在的挑战:异常检测单一的数据类别导致学习到的模型判别能力较弱;无标注样本中存在的噪声,容易导致模型拟合到有偏输入分布;少量的标注信息应被充分利用。本文针对该数据场景的特点提出了一种基于迁移学习的异常检测方案来增强模型的判别能力,同时解决了基于深度学习的异常检测方法难以从外部数据获益的问题。还提出了一种新的损失函数,平衡了各个样本间的权重,在强调有标注样本的同时增加了对无标注样本集中噪声的鲁棒性。实验表明提出的模型对于噪声有较强的鲁棒性以及对于有标注样本有较好的利用,相较于已有的方法取得了更好的结果。2.针对异常发生概率较为稳定的场景,本文提出将异常发生的经验概率作为先验引入到异常检测的模型中,通过对抗训练约束模型预测的类别分布服从先验异常概率。训练好的模型在预测未知样本集的类别时会考虑先验异常概率,进而减少异常检测时漏检和误报的发生。在本方法中,对于有标注样本的利用不再局限于最小化其分类误差,同时还要约束预测的类别分布符合先验的范畴分布。实验证明引入异常发生的概率作为先验可以很大的提升性能,相较于其他的方法同样取得了更好的结果。本文提出的两种异常检测方法都面向更贴近真实应用的半监督数据场景,适用于不同的具体情况,旨在为实际的应用提供切实可行的方案。
其他文献
肿瘤免疫系统对于人类和生物学有着重要意义和应用而得到广泛地研究。当采用化疗来治疗肿瘤时,系统就演化为肿瘤免疫-化疗反应系统,而肿瘤能否治疗取决于这个系统是否稳定。
加思来提·麻合苏提,男,乌孜别克族,新疆乌鲁木齐人,1962年10月出生,1984年10月参加工作,1995年6月加入中国共产党,新疆维吾尔自治区纪委原副书记、监委原副主任。2020年3月2
低压台区三相负荷不平衡是供电企业常见而又难于解决的问题之一。现阶段,我国大部分低压三相四线制供电线路中,由于单相负荷分布的不均衡及不同步使用,容易造成三相负荷不平
[基本案情及争议]2018年12月19日,最高人民检察院在其官网上发布了第十二批指导性案例,于海明正当防卫案(检例第47号)赫然在列。该案基本案情是:2018年8月27日晚九时许,刘某
目前,许多种类的肿瘤疾病对人类的危害也越来越大。依据相关机构的分析,预计到2030年,肿瘤或将超过心血管疾病成为人类生命的最大威胁。因此对肿瘤的相关研究显得更为重要和
随着信息技术快速发展,云计算、大数据广泛应用,以移动互联网为基础的新媒体成为当下信息传播最快、社会交流最频繁的渠道,深刻地改变着信息传播方式、舆论传媒生态和社会交
随着互联网技术的发展,人们对信息安全也有了更高的要求,现有的身份识别方式包括密码,口令等已经满足不了人们的需求,密码被盗现象屡见不鲜,于是出现了一些新的基于生物生理
本文利用非线性动力系统的理论和方法对不确定因素影响下肿瘤生长模型平衡点的稳定性和Allee效应影响下肿瘤-免疫系统的动力学特性两方面问题进行研究.首先,构建随机影响下的肿瘤生长模型.将随机变量按照概率分布进行分类,分为均匀分布、高斯分布和λ-分布.基于正交多项式逼近将随机的肿瘤生长模型约化为等价的确定性模型,并利用线性稳定性理论分析等价模型零解的稳定性.其次,建立确定性的具有Allee效应的肿瘤-
肿瘤免疫应答是一种复杂的动态过程.在肿瘤和免疫系统的相互作用中,免疫系统发挥了双重作用,一方面免疫系统能够激活一些免疫细胞去杀死肿瘤细胞,如辅助性T细胞、效应细胞等,但另一方面免疫系统中也存在抑制肿瘤免疫反应促使肿瘤逃逸的细胞,如调节性T细胞(Regulatory T cells,Tregs).基于Tregs介导的肿瘤免疫逃逸机制,本学位论文构建了肿瘤免疫系统相互作用的动力学模型.本论文分为四章,
目的:(1)探讨溃疡性结肠炎患者出生日期的五运六气分布特点;(2)探讨溃疡性结肠炎患者发病日期的季节、24节气分布特点;(3)基于五运六气理论研究北京、浙江杭州、河南焦作三地区溃疡性结肠炎发病与当年同期气象因素的相关性,并建立多元回归分析的医疗气象预测模型,从而为溃疡性结肠炎的预防和治疗提供新的思路。方法:本研究所有病例来源于北京中医药大学东直门医院、浙江中医药大学附属第一医院、焦作市人民医院从2