论文部分内容阅读
低码率语音压缩是数字通讯系统中的关键技术之一.该文从人耳的听觉特性和合成语音的包络匹配入手,研究了低码率语音压缩中的合成语音的嘶哑问题以及自然度损失问题,并提出了相应的解决方案.主要工作有:(1)提出了基于听觉模型的小波分带编码方法.通过把输入语音信号利用听觉小波滤波器组分成四个通道,并且对每个通道分别进行最优编码处理,就能够按照符合人耳频域分辨率的方式提取LPC预测系数.在解码端对四个通道的信号解码后进行叠加,就能够得到解码后的合成语音.这种方法在低码率下取得了较好的结果,较好地解决了基于LPC的编码器难以解决的合成嘶哑问题,获得了比DOD CELPC和LPC10e更清晰的语音;(2)提出了考虑语音包络的编码方法,以提高合成语音的自然度.作者在编码器中提取语音信号的包络信息,仅用4比特将它量化,并编入信道文件传送到解码端.解码器利用包络信息,调整激励模型参数,使其合成语音的包络与原始信号包络尽量吻合.实验结果表明,这种编码器的低频效果有较好的增强,自然度也有较好的提高.