论文部分内容阅读
随着自适应多速率(Adaptive multi-rate,AMR)语音在IP电话及移动通信领域的广泛应用,基于AMR语音的隐写方法层出不穷。然而,与大多数安全技术类似,基于AMR语音的隐写技术若被不法分子利用,将会给信息安全带来巨大的安全隐患。因此,面向AMR语音的隐写分析技术成为了一个重要的研究课题。从已有研究成果来看,该技术仍存在诸多问题亟待解决,例如检测特征维度过高等。论文针对已有研究存在的问题,结合AMR语音编码的原理,分别对基音延迟参数域、固定码本参数域和线性预测参数域上的隐写分析方法进行了深入研究,具体研究工作如下:(1)针对现有研究存在特征维度过高和对AMR语音基音延迟特性表述欠完整的问题,提出了一种基于基音延迟统计特性的隐写分析方法。该方法对已有特征进行细致筛选提出了低维度但高效的基音延迟值二阶差分统计特征,并引入奇偶统计特征以弥补基音延迟值二阶差分统计特征表达能力的不足。以支持向量机为分类器,通过大量的样本对所提出的方法进行了性能评估,并与已有方法进行比较。实验结果表明,本方法在不同嵌入率和不同样本长度条件下均能得到较现有方法更好的检测效果。(2)为了解决现有方法检测特征维度过高的问题,提出了一种基于XGBoost(e Xtreme Gradient Boosting)的AMR固定码本域隐写分析方法。该方法利用XGBoost算法对基于脉冲值对统计特性的特征进行特征选择,得到有效且维度更低的特征集合。选用XGBoost作为分类器,通过大量的样本对所提出的方法进行了性能评估,并与相关工作进行性能对比。结果表明,本方法特征维度(最低70维,最高不超过289维)明显低于目前最好方法的498维,而其检测性能优于次最优方法,且并不逊色于当前最好方法。(3)为实现线性预测参数域上隐写方法的高效检测,提出了一种基于空间局部统计特性的隐写分析方法,其原理是将一维参数序列转换成二维“参数块”,利用卷积神经网络从整体上对语音参数块的空间局部统计特性进行建模,并提取有效特征。以支持向量机为分类器,通过大量的样本对所提出的方法进行了性能评估,并与已有方法进行比较。实验结果表明,本方法在检测线性预测参数上的隐写方法是可行有效的,且较之已有方法具有更好的检测性能。