基于深度学习的图像型垃圾邮件分类

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:iversonKKE3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的不断发展,互联网上的信息呈现出爆炸式增长的局面,但信息质量良莠不齐,其中色情图片、广告图片、反动类图片等影响尤为恶劣。如何有效遏制不良信息在互联网的疯狂传播已成为一个亟待解决的问题。一方面,传统治理方法主要是依据图像浅层信息,在图片数量和样式日益增加的情况下,各类模型的表现均受到了限制和挑战。另一方面,由于图像型垃圾邮件自身的敏感性和特殊性,传统的深度学习网络模型并不能在这类图像上取得出色表现,新的网络结构和设计仍需要进一步探索。本论文致力于图像型垃圾邮件分类问题的研究,主要是根据垃圾邮件中包含的图像判断垃圾邮件的类别。相对于已经公开的垃圾图像数据集,本文从图像型垃圾中收集、整理了全新的数据集,一共有垃圾图片五万余张,分为七个不同类别,满足深度学习实验所需。本文提出了一种基于卷积神经网络(Convolutional Neural Network, CNN)和支持向量机(Support Vector Machine, SVM)的级联分类模型,并引入二次分类模型,提出了一种深度学习方法在图像型垃圾邮件分类任务中的应用方案。通过迁移学习和支持向量机的引入,改进后的卷积神经网络在模型结构和参数训练过程中都发生了很大变化。相比于原始的卷积神经网络及卷积神经网络和支持向量机的简单串联模型,改进后的级联模型在垃圾邮件图像数据集上有更好的分类表现;对于第二层分类模型,本文给出了第一级分类模型的分类效果和仍未解决的问题,根据实际情况给出了相关分析,通过对比实验最终找到了一个鲁棒性和区分能力都较好的局部特征,并设计了相关实验证明特征选择及模型设计的有效性。最后,本文针对现有模型的性能表现给予了客观评价,还对后续工作给出了可能深入的研究和改进的方向。
其他文献
主动配电网的结构和运行都面临着较大的不确定性,电网脆弱性直接反映了电网结构的稳健程度和持续供电能力,因此亟需提出合理的主动配电网脆弱性评估指标,对其中关键的脆弱元
以实测数据为基础,以NH3-N为参数,以年均浓度为分析对象,采用线性(一元回归)分析法及向前3年滑动平均法,对1984-2005年以来珠江八大口门水道水质的年际变化进行趋势分析。结
随着短道速滑运动的不断发展,其比赛竞争也越来越激烈,这就要求短道速滑运动员要有优秀的身体素质、过硬的技术水平同时还要具备良好的战术意识。本文主要对影响运动员战术意
学生获取数学知识,主要是在教师的指导下,通过课堂教学完成的。学生要想学好数学,就必把握好预习、听课、复习、作业这四个环节。作为数学教师,则要抓好课堂教学这一中心环节
【正】学校绩效考评包括对教职员工工作绩效的考核与评估。考核是一个客观的过程,是对每一位教职员工的工作业绩的完成数量与质量进行考核的过程,而评估则是一个主观与客观统
目的通过结合高通量测序技术和生物信息学分析,阐明广州市2013-2018年环境污水中诺如病毒(Norovirus,NoV)GI、GII组中各基因型别的分布情况及其动态变化特征。此外,将其与广东省NoV疫情流行病学数据及序列进化特征相结合,探索环境污水的NoV监测在疫情预警和防控中的作用。方法选取广州市猎德污水处理厂作为采样点,采用定时采样法,在2013年1月至2018年8月每月中旬采集4份污水样本
珠江流域地域辽阔。珠江水能资源丰富,在促进流域经济社会可持续发展中发挥着巨大的作用。分析珠江水电开发现状及水电开发对河流生态环境的影响,研究并提出减少对生态环境不利
过渡金属磷化物催化剂作为一种新型催化剂,在加氢脱硫(HDS)反应中表现出优异的反应活性和较高的稳定性。本论文分别以SiO2、大孔Al2O3(m-Al2O3)以及Ce改性Al2O3(Ce-Al2O3)为载体,采