论文部分内容阅读
随着音频信号的分析、合成及压缩编码技术的发展,在要求其具有更高压缩比的同时,还要求其具有更高的合成音质。传统的压缩方法建立在对音频信号局部平稳性的假设上,利用短时傅里叶变换等方法去除其统计冗余,从而实现对信号的压缩。然而音频信号是一种典型的非平稳信号,且对于非平稳信号的分析和处理已经成为了现代信号处理的主要方向,并取得了引人注目的成绩。基于此背景,本文对经验模态分解(EMD,empirical mode decomposition)算法这一新近提出的非平稳信号分析方法进行了深入的研究,并结合心理声学模型和加权匹配追踪算法对音频信号进行正弦参数提取,并最终提出了一种基于EMD分解算法的音频分析与合成方法。
首先,本文研究了EMD算法的基本原理和实现方法,并对实际音频信号进行分解,通过分析分解出的各个固有模态函数(IMF,intrinsic mode functions),验证了该算法所具有的滤波特性;同时,结合音频信号自身的特点,对IMF分量进行分类组合,最终将原始音频信号划分为低频类谐波和高频类噪声两种成分,并通过实验对分类效果进行了检验。
其次,本文对MPEG标准中的心理声学模型进行了研究和实现,并将该模型应用于MLT(Modulated Lapped Transform)嵌入式编码器,提出了一种基于心理声学模型的子带重要性排序方法,验证了利用感知特性选取音频信号中不同频率成分从而实现压缩的可行性和有效性。
最后,本文利用加权匹配追踪算法对经过EMD算法分类后的音频信号进行正弦参数的提取,并且结合心理声学模型理论,采用梯度感知加权的方式对感知权值进行更新,提高了建模效率。最终,提出了一种基于EMD分解算法的音频分析与合成方案,并通过实验证明了该方案的有效性。