论文部分内容阅读
目前,互联网已成为人们日常生活不可或缺的部分。但网络中存在大量有害的敏感图像,严重危害了社会稳定和人们的身心健康,尤其是青少年的健康成长。因此,利用计算机视觉技术,自动识别与过滤网络中日益泛滥的敏感图像,已成为网络信息安全领域一项重要的研究课题。 近年来,基于内容分析的敏感图像识别与过滤技术成为国内外学术界的研究热点。这类方法通过提取颜色、纹理、肤色和人脸等视觉特征建立识别模型,来检测图像中是否包含敏感信息。由于提取的低层视觉特征与图像高层语义之间存在着语义鸿沟,因此该类方法所面临的最大难题是无法适应敏感图像表现形式的多样性,仅能用较为简单的模型描述语义内容。此外,这类方法多在像素域进行特征提取,识别速度较慢,无法满足实时性要求。 为此,本论文针对图像大多以压缩格式存在这一现象,开展了基于视觉单词的压缩域敏感图像识别与过滤技术的研究,以提高识别速度和准确度性。基于视觉单词的图像识别技术将图像的局部特征转化为描述图像整体信息的语义内容,从而减小视觉特征与语义之间的差距。而压缩域图像处理技术则将图像压缩与处理两个过程相结合,利用未经解码或部分解码出的数据快速进行图像处理分析,有效地提高速度。 本论文的主要研究内容包括以下几个部分: (1)将压缩域图像处理与尺度不变算子提取方法相结合,提出一种基于尺度不变算子的压缩域视觉单词提取方法 首先利用压缩数据重建低分辨率图像;然后基于该图像计算尺度不变描述算子,得到压缩域的视觉单词,并通过聚类分析的方法构建视觉单词库;最后利用这些视觉单词描述图像内容,进行敏感图像的识别。实验结果表明,与像素域方法相比,本论文提出的压缩域方法在获得相当的敏感图像识别率下,能够更快地提取出图像的视觉单词特征。 (2)利用压缩数据的特点和视觉注意模型,提出一种基于压缩域视觉注意模型的感兴趣区域检测方法 首先从压缩域提取颜色、方向和亮度等信息,构建局部显著图,并采用进化规划的方法在压缩域计算图像的全局显著图;然后将两种显著图进行归一化合并,采用赢者全取网络查找注意焦点,并根据返回抑制机制和显著度增强因子,转移注意焦点;最后采用阈值分割的方法,从视觉显著图中提取感兴趣区域,计算区域兴趣度。实验结果表明,采用本论文提出的这种基于压缩域的视觉注意模型来检测感兴趣区,无论是速度还是准确度,都得到了令人满意的检测结果。 (3)分析了敏感图像的特点,对压缩域感兴趣区域检测方法进行了改进,提出一种基于敏感区域检测的压缩域视觉单词库构建方法 首先从敏感图像内容出发,利用压缩域肤色检测算法,计算图像的视觉显著度,检测暴露的人体性器官等敏感区域;然后提取了区域的亮度、颜色、纹理和肤色等特征,并通过k均值聚类方法,完成了视觉单词库的构建。实验结果表明,本论文提出的方法可以更快速地检测出敏感图像区域,构建的视觉单词库更符合人的主观感受。 (4)在上述研究内容的基础上,搭建了基于视觉单词的压缩域敏感图像识别与过滤演示系统 该系统首先对输入图像进行人脸检测,完成图像的初步识别,排除大头照等正常的图像;然后分析图像的语义内容,建立视觉单词直方图;最后采用支持向量机分类器对图像进行最终判决。实验结果表明,该敏感图像识别与过滤系统不但能获得较高的识别准确率,而且可以满足实时处理的要求。