基于免疫原理的计算机病毒检测系统的设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:feihuaxp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
受到免疫原理的启发,本文提出了三种基于人工免疫原理的病毒检测算法,目的是构建一个轻量级的、具有较快检测速度、较高检测率而且有一定泛化能力的病毒检测系统。   基于统计分析的方法使用了可执行文件中二进制比特串的频率特征,并模拟了免疫系统中记忆细胞的生成和抗原细胞动态更新机制;   基于距离向量的方法提出了两种新的比特串距离度量公式[1](论文"AVirus Detection System Based on Artificial.Immune System"已在CIS2009,IEEE国际会议上发表):汉明最大距离和循环移位连续距离。通过比特串的特征向量来计算文件的危险度,并对比了rbf神经网络、KNN和SVM三个分类器对文件分类的性能;   基于信息熵的方法借鉴了信息论中经典的信息熵和趋向性的定义,算法将其应用到构建探测集时对比特串的选择中,获得了更小更有效的探测器集,有很快的检测速度。待检测文件被看成是固定长度的危险度向量,使用SVM分类器进行训练和分类。试验中对不同参数对算法结果的影响做了验证,有较完备的实验结果和结论。   在实验中,将数据集划分为训练集和测试集,分别使用25%、50%和75%的训练集对算法的有效性进行验证,并对不同参数的情况进行了对比和分析,实验结果表明:   基于统计分析的方法检测结果有平均92%的正确率,具有较强的动态学习能力,消耗资源少;   基于距离向量的方法检测结果有平均97%的正确率,有一定的泛化能力;   基于信息熵的方法检测结果有平均95%的正确率,检测速度快,受参数影响小。   这三种方法相比传统的病毒检测技术,不用提取病毒特征码,消耗资源少,检测速度快,有相似或者较高的检测率,较低的虚警率,能够检测未知病毒,有一定的泛化性能,达到了预期的目的。
其他文献
民主选举作为社会民主与进步的重要表现形式,同时也是公民参政议政的主要途径,大力发展社会主义民主政治、建设社会主义政治文明是新时期中国特色社会主义现代化建设的重要目标
随着工艺尺寸的加深,工艺偏差、串扰效应、电源噪声以及互连线的阻性开路与短路给通路的传播时廷带来了极大的不确定性。这种通路传播时延的不确定性被统称为时延偏差。时延偏
随着数据采集和处理技术的进步,人们对数据的不确定性的认识也逐步深入。在诸如经济、军事、物流、金融、电信等领域的具体应用中,数据的不确定性普遍存在。如何快速、方便、
软件过程对于提升产品质量和生产率意义重大。过程构造是过程管理活动的起点,其重要性不言而喻。然而,它也是一项复杂的、动态的、知识密集型的活动,需要耗费大量的时间和资源。
学位
近年来,作为互联网上用户生成内容(User Generated Content)的形式之一,协同标签系统(Collaborative Tagging Systems)也越来越流行。随着标签系统的发展,在该应用背景下的用
查询相关的多文档摘要技术依据给定的查询,将多篇相关文档的内容浓缩为一个简洁、流畅、并能反映主题内容的摘要。该技术能够大大提高人们获取信息的效率,近年来一直是自然语
随着全球经济技术的发展和Internet的普及,企业的通信需求已经趋向多元化。传统PBX(用户级交换机)己经难以适应现代企业的发展模式和增长需要,而IP-PBX符合下一代网络融合的
人类基因组工作草图绘制完成后,生命科学已进入后基因组时代,结构生物学正处在具有战略性的关键地位,研究蛋白质的结构与功能,特别是蛋白质的三维结构,是揭示基因组功能的基本途径
虚拟技术的发展带给IT安全领域很大的机遇和挑战,在虚拟化架构下对虚拟机进行监控成为十分必要的安全管理方式。本文在此背景下提出利用Xen虚拟化技术对虚拟机内运行的进程进
随着互联网上信息资源的日益增多,用户对个性化服务的要求不断提高。协同过滤推荐技术是个性化服务发展中最成功且应用最广泛的推荐技术之一,然而,出于隐私考虑,许多用户不愿