基于行为分析的垃圾邮件过滤算法研究与实现

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:ldd3663
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文从对垃圾邮件的行为分析入手,研究与实现了基于行为分析的垃圾邮件过滤技术。 在具体实现过程中,通过对垃圾邮件进行深入的分析和研究,建立相关行为特征分布模型,从而提取出垃圾邮件的特征。为了研究分析垃圾邮件的行为特征普遍性,对垃圾邮件的某些行为特征趋势进行一年的统计分析,得出较为普遍的垃圾邮件行为特征。为了便于行为识别算法的实现,建立行为特征的数学模型,将处理后的邮件数据集的行为特征进行量化。以开源数据挖掘系统WEKA为基础,实现基于决策树的过滤系统,对量化后的行为特征数据进行挖掘,得出影响最终决策的行为规则,利用行为规则实现对邮件的分类。 实验采用标准的邮件过滤性能测试方法,在TREC邮件数据集上的实验结果以及现实的邮件系统中的应用结果来看,基于行为分析的垃圾邮件过滤算法要比基于贝叶斯的bogo算法有较大,特别在垃圾邮件的误过率方面。
其他文献
植物克隆生长及其与生态适应性之间关系的研究是当今国际上植物种群生态学研究的热点和前沿课题,开展小半灌木克隆植物种群生态学的研究对于开拓和丰富该领域的科学研究具有极
OFDM技术具有良好的抗多径干扰的能力。它将高速数据通过串并变换转换为低速数据,同时通过插入保护间隔和循环前缀最大限度的减小了无线信道的多径时延扩展所产生的时间弥散带
狼(Canis lupus)属于食肉目、犬科、犬属。狼的生态适应能力很强,目前主要分布在东北、内蒙以及西藏人口密度较小的地区。目前对于狼的研究很少,尤其在其繁殖方面,这对于了解
Zigbee技术是一项从2000年开始才逐步发展起来的无线组网技术。它能成功的实现多节点自组网络,主要适用于自动控制和无线传感器网络等领域。它与其他无线组网技术相比具有独特
手征介质中的电磁场交互作用已经被人们研究许多年了,手征介质已经被应用于许多方面,其中包括天线、天线屏蔽器、微带线的介质基片以及手征波导等。手征介质能够对右旋和左旋圆
摘要:目前,我们的学生课外阅读情况不容乐观,它表现的是一种社会现象,但却折射出青少年人生观存在的缺陷。因此,我们学校为青少年课外阅读提供一个良好的环境,让他们在充满书香和温馨的文化环境中健康成长,让健康向上的文化占领青少年的头脑。如果把他们仅仅禁锢在几门功课上,只会按标准答,只会就课本论课本,不爱读书,不能养成读书的好习惯,那么,可以说我们学校教育的根本任务并没有真正完成。我们教育工作者在积极实施
在数字移动通信系统中,信号传输的环境有时是非常恶劣的。传输过程中,除了受到信道传输特性不理想和加性噪声的影响外,还同时存在信号衰落和多址干扰。由于移动台的位置不断变化
压缩图像的后处理技术指对解压缩后的图像进行处理,从而消除由于压缩而导致的各种失真,达到改善图像质量的目的。本文主要研究了静态压缩图像和视频序列图像的后处理技术。现
彩色CCD或CMOS图像包含的信息量大,内容更加丰富,对军事、航空航天、天文等领域的作用更是不言而喻,但是海量的数据传输负担成了空间彩色相机广泛应用的瓶颈,因而研究高效的图像
随着移动通信业务向多样化和个性化发展,移动终端集成的功能越来越多,如何实现小型化、多频带、宽频带的移动终端天线日益成为天线工程领域的重要课题。分形因为具有空间填充性