论文部分内容阅读
以图像格式出现垃圾邮件是新近出现的一种垃圾邮件的表现形式,甄别这样的垃圾邮件是一项难度较大,而极具意义的研究课题,它涉及到图像处理、模式识别、计算机视觉、人工智能等多门学科,吸引众多学者纷纷关注的研究热点。但达到实用化还存在一些问题。本文对图像格式的垃圾邮件过滤的预处理步骤进行了研究,本文的主要研究成果如下:
1)在对邮件图像分割自身特点研究的基础上,提出了一种基于小波变换页面分割算法(WTTZD)。实验表明,该算法对复杂背景的邮件图像定位较准,受背景影响小,区域定位的功能具有通用性,符合实际应用的要求。
2)根据扫描图片有时存在的倾斜问题,本文给出一个利用Hough变换进行倾斜角度校正算法,实验表明倾斜度在15度倾角的范围内时,可以准确地识别倾角并加以校正。
3)在对传统的文档图像分类常用的规则基础上,针对图像邮件的特点,扩展了规则集合,提高了规则集对于多样化的图像的分类效果。并在这个规则集合上设计了一个简易的规则产生式系统,能高效完成图像语义单元的分类。
4)在图像语义分类的研究中,提出了一种基于多方向模板的纹理特征抽取方法,实验结果表明该方法可以替代通用的傅立叶能量分析方法,在保留纹理信息的同时,提高了特征抽取的效率,并给出了一种边缘方向的统计数据作为分类的辅助特征。利用最小风险Bayes分类算法进行区域分类,效果良好。
5)在邮件信息过滤系统中,设计了图像垃圾邮件过滤模块的主要功能。