论文部分内容阅读
                            
                            
                                近年来,随着电子信息技术的进步、图像采集设备的广泛普及以及借助于互联网/移动互联网等新型传播媒体,数字图像的使用范围迅猛发展,传播速度大大增强。同时随着图像处理软件功能的不断增强和智能化,图像的编辑、修改变得越来越简单。数字图像给人们的生活带来巨大便利的同时,也引入了一系列网络社会管理以及司法取证方面的问题。数字图像相比于传统的胶片相片更容易篡改和传播,这会给司法取证中的声像资料鉴定、新闻媒体单位中的新闻素材真实性审核以及网络舆情分析中虚假图像信息的确认带来巨大的挑战。鉴于这种情况,数字图像篡改检测技术获得了广泛的关注,在最近几年逐渐成为图像取证领域的研究热点,并得到了快速的发展。数字图像篡改检测技术可以划分为主动检测技术和被动检测技术两大类。主动检测技术借助嵌入图像中的数字水印/指纹等先验信息鉴定图像的真伪。被动检测技术不需要事先嵌入数字水印/指纹等先验信息,而是通过验证未知图像在成像原理(如CFA滤波阵列)、物理属性(如相机模式噪声、光照方向)或图像统计特征等方面是否与正常图像一致,达到判断图像是否经过篡改操作的目的。本文在深入研究当今主流被动篡改检测技术的基础上,针对目前最为常见的一种数字图像篡改方式——拼接,提出一系列基于图像统计特征的数字图像被动拼接检测关键技术和理论方法。具体研究工作和创新点如下:1.篡改者在拼接图像时,虽然能够通过图像编辑软件尽可能地掩盖拼接痕迹,达到欺骗人眼的目的,但是拼接操作会不可避免地导致图像底层统计特征的改变。本文第三章提出分块离散余弦变换(Block Discrete Cosine Transform,BDCT)域的三阶统计特征和色度域的游程长度游程数目(Run-length Runnumber,RLRN)特征用于捕捉图像底层统计特性的改变,以达到图像拼接检测的目的。在一阶Markov特征的基础上,将图像的BDCT系数看作单方向的一维随机信号,提取该信号的三阶统计特征以区分正常图像和拼接图像。同时将色度域信息引入到图像拼接检测中来,以排除图像背景内容对于拼接检测的影响,通过提取色度域rlrn特征捕捉图像拼接痕迹。实验部分综合分析比较了三阶统计特征和色度域rlrn特征的检测性能,实验结果表明这两种高阶统计特征的检测识别率均高于传统的低阶统计特征。2.目前基于图像底层统计特征的方法,大都是将待检测图像看作一维信号进行处理,忽略了图像的二维非因果特性。本文第四章提出二维非因果模型用于解决图像拼接检测问题。将原始图像(或其对应的变换域系数矩阵)看作二维非因果信号,并通过状态的先验概率直方图、不同状态所对应的观测值的概率密度函数以及状态之间的转移概率矩阵三个特征集合描述该模型。给出了计算三个特征集合的公式推导和具体计算方法。最后将这三个特征集合作为统计特征,结合机器学习的方法以区分正常图像和拼接图像,实验结果显示基于二维非因果模型的检测方法优于目前的基于一维因果信号的方法。3.图像的拼接痕迹在不同的颜色通道往往表现不同,因此特征提取方法在固定颜色通道上的检测性能往往不是最优的。本文第五章提出了一种面向图像拼接检测的最优类色度通道选择算法,该方法结合支持向量机(supportvectormachine,svm)和广义判决分析(generalizeddiscriminantanalysis,gda)学习算法,能够使得特征提取方法在其对应的最优类色度通道上的检测识别率高于已有的颜色通道。实验结果显示该颜色通道选取方法对于目前六种主流的特征提取方法均是可行的,这六种特征提取方法在其对应的最优类色度通道上的检测结果均优于其它已有的颜色通道。4.随着图像拼接检测技术的发展,越来越多的特征引入到拼接检测中来,高维度的特征虽然能够捕捉到更多的拼接痕迹,但同时也会引入分类器学习时间过长、特征冗余等问题。本文第六章讨论了图像拼接检测中高维度特征处理问题,提出一种基于分布式局部margin学习的特征优化选择方法。该方法利用局部margin最大化准则优化一个非负线性变换矩阵,通过该矩阵去除冗余特征同时保留重要特征,达到特征优化选择的目的。同时将该算法并行处理,可以大大提升该特征选择算法的效率。实验结果显示该特征优化选择算法能够大幅度降低现有主流高维特征的维度,从而大大降低分类器在训练、预测阶段的时间消耗,同时保持算法的检测识别率在一个较小的范围内波动。本文从特征提取、颜色通道选取以及高维特征优化选择三个角度研究图像拼接检测问题。首先提出使用色度域的rlrn特征以及bdct域的三阶统计特征进行拼接检测。接着将检测工作由一维扩展至二维,提出使用二维非因果Markov模型捕捉更多的拼接痕迹,以提升检测识别率。然后将特征提取方法与机器学习理论结合,给出了一个面向图像拼接检测的最优颜色通道选择架构,从而能够进一步地提升不同特征提取方法的检测识别率。最后针对目前图像拼接检测算法中特征维度较高的问题,提出一种高维特征优化选择方法,提升拼接检测算法的性能和运行效率。