基于AMR-WB语音编码器的压缩域语音增强技术研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户：windtree

【摘要】

：

移动通信网络中的语音增强技术是目前语音信号处理领域的研究热点之一。本文针对3G通信网络中的3GPP(The3rd Generation Partnership Project)AMR-WB(Wideband Coding of Spe

【作者】

：

梁岩

【机构】

：

北京工业大学

【出处】

：

北京工业大学

【发表日期】

：

2012年期

【关键词】

：

语音增强压缩域噪声分类码书增益调整高斯混合模型 AMR-WB语音编码器

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

移动通信网络中的语音增强技术是目前语音信号处理领域的研究热点之一。本文针对3G通信网络中的3GPP(The3rd Generation Partnership Project)AMR-WB(Wideband Coding of Speech at around16kbit/s using Adaptive Multi-RateWideband)宽带语音编码标准，研究并实现了两种压缩域语音增强算法，以明显抑制背景噪声，同时提高语音客观质量。　　本文所构建的压缩域语音增强算法框架主要包含三个模块。首先，利用对数线性预测(Linear Prediction，LP)谱能量特征将背景噪声分为有色噪声和白噪声两大类；然后计算增益调整因子，并联合调整含噪语音的自适应码书增益和固定码书增益：最后，在白噪声背景下选择适当的准则对线性预测编码(LinearPredictive Coding，LPC)参数进行调整，而在有色噪声背景下则利用梳状滤波器进一步增强谐波结构。　　在基于码书增益联合调整的压缩域语音增强算法中，采用固定码书增益最小值搜索方法估计噪声强度，以计算增益调整因子，同时利用线性外推方法调整含噪语音的LP参数。　　为有效利用纯净语音导抗谱频率(Immittance Spectral Frequency，ISF)参数的先验知识，本文利用纯净和含噪语音的ISF参数，以及对应的增益调整因子构成特征矢量，使用高斯混合模型拟合含噪和纯净语音特征参数的联合概率密度，并在最小均方误差准则下对纯净语音的特征参数进行最优贝叶斯估计。　　同时，为了兼容AMR-WB语音编码器中的非连续性传输(DiscontinuousTransmission，DTX)情况，本文所提算法在保持噪声帧谱包络参数不变的前提下，对对数帧能量进行衰减以抑制噪声成分。且当帧擦除情况出现时，算法不对输入码流进行调整，同时利用解码端的帧擦除掩蔽(Frame Erasure Concealment，FEC)操作恢复各码流参数，按照正常帧处理方法进行增强并更新相关历史。　　采用国际电信联盟电信标准部(International Telecommunication Union，Telecommunication Standardization Sector，ITU-T)G.160标准对本文所提算法进行性能测试。测试结果表明，与参考算法相比，本文所提的两种压缩域增强算法均可以在保证较高信噪比提高的同时，达到较大的噪声衰减量，并且有效提高增强语音的客观质量。

其他文献

SOC中跨时钟域问题的研究

随着科学技术的发展，在现代数字集成电路中，已经可以使设计规模达到千万门级甚至更大规模。同时，由于功能的复杂性，现代集成电路内部已经不可能只使用单一的时钟进行设计，通常一个

学位

跨时钟域触发器时序理论亚稳态电路设计SOC技术

共形四维阵列天线技术研究

随着现代战争对先进飞行器需求的不断提高,为了保持飞行器良好的空气动力学性能以及获得更佳的电磁收发性能,其收发天线往往希望与飞行器表面共形,形成共形天线或天线阵。共

学位

共形天线阵四维天线阵时间调制差分进化算法微带天线

采用动态元素匹配编码方法的电流源DAC设计

高速高精度数字-模拟转换器(digital to analog converter DAC)广泛应用与无线通信领域和视频信号处理领域。高时钟频率和高分辨率精度对DAC的无杂散动态范围(Spurious-Free

学位

数字模拟转换器动态元素匹配无杂散动态范围归零输出级

人源神经肽Y Ⅰ型受体NPY1R的结构生物学研究

神经肽YⅠ型受体(NPY1R)属于G蛋白偶联受体(G protein-coupled receptor，GPCR)超家族中的肽类受体亚家族，以神经肽Y为天然配体，主要分布于人体中央神经系统和外周神经系统内，参与

学位

G蛋白偶联受体神经肽YⅠ型受体晶体结构

白光发光二极管(LED)的光色特性研究

人通过视觉感官获取的信息量占通过所有感官获得的信息量的80％以上,而光源的光色特性决定了视觉获取色彩信息的正确性和客观性。本论文研究新型照明光源发光二极管LED(Light E

学位

发光二极管光色特性显色性能光视效能

长白山阔叶红松林乔木树种枝条木质部解剖结构和水分传导功能的研究

木质部水分运输对植物生存和生长至关重要，植物对环境的适应性在木质部水力结构性状上有重要体现。在较高纬度和高海拔的温带森林生态系统中，频繁的冻融交替现象对多数树种水分

学位

木质部解剖结构水分传导功能树种差异环境适应性

人乳头瘤病毒16亚型L1蛋白在多形汉逊酵母中的优化表达

多形汉逊酵母(Hansenulapolymorpha)表达系统具有强诱导型启动子、基因工程操作简单、易于在低廉的培养基中实现高密度发酵、表达产物更接近于天然状态等特点,是表达外源蛋白

学位

高速取样示波器时基失真与修正的研究

时基失真是高速取样示波器取样过程中产生的一种时基误差，它使取样值产生偏差，特别是在精密测量中，时基失真将会影响测量结果。国外有一些科学家对于时基失真修正算法进行了研究

学位

高速取样示波器时基失真最小二乘法不确定度误差修正正弦信号

全息阻抗调制表面天线的分析与设计

全息调制阻抗表面是一种利用全息原理进行阻抗调制的表面。它将光学全息理论引入到电磁场领域,实现阻抗的特殊调制方式,并通过控制表面电流辐射,达到设计特殊形式天线和控制

学位

表面波表面阻抗全息阻抗调制表面

发动机数字式点火控制系统的设计

随着人们生活水平的提高和环保意识的增强,发动机在动力性、安全性和环保性上面临着新的挑战。为满足燃料消耗量低和排放废气符合标准的要求,发动机数字式点火系统已取代模拟

学位

发动机数字点火技术FPGA点火控制

基于AMR-WB语音编码器的压缩域语音增强技术研究

其他学术论文