论文部分内容阅读
传统的定速率语音编码从总体来讲,较高速率的编码算法对语音质量较易保证,但占用网络资源较大;较低速率的编码算法占用网络资源小,但对语音质量较难保证。话音激活检测(VAD)技术的出现和发展,使对有无话音进行判断成为可能,从而可以对背景噪声和激活的话音部分以不同的速率进行编码,降低平均速率,也就是采用变速率语音编码的方法。变速率语音压缩编码理论上仍属于CELP,但在“变”上有了新的研究,由此引入了相关的先进技术,使变速率语音编码之后的语音合成效果几乎没有降低。这些相关技术主要包括:用来检测语音通信时是否有话音存在的话音激活检测(VAD,Voice Activity Detector)技术、为突出“变”字而进行速率判决(RDA,Rate Decision Algorithm)的自适应技术、为避免语音帧丢失后带来负面效应的差错隐藏(ECU,Error Concealment Units)技术、为克服背景噪声不连续的舒适背景噪声(CAN,Comfort Noise Aspects)生成技术等等。应用了这些技术的变速率语音编码的语音合成效果几乎没有降低。AMR(自适应多速率语音编码,Adaptive Multi Rate)是由3GPP制定的应用于第三代移动通信W-CDMA系统中的语音压缩编码,更加智能地解决了信源和信道编码的速率分配问题,使得无限资源的配置和利用更加灵活和高效。AMR支持八种速率:12.2kb/s、10.2 kb/s、7.95 kb/s、7.40 kb/s、6.70 kb/s、5.90 kb/s、5.1 5kb/s和4.75kb/s,此外,它还包括低速率(1.80kb/s)的背景噪声编码模式。本文就AMR的编译码进行了研究和仿真实现,并对AMR到IP电话编码方式的参数层转换也进行了可行性研究,希望这种探索对实际的网络互通效果的提高起到积极的作用。