基于GMM的低码率语音编码器

来源 :南京师范大学 | 被引量 : 0次 | 上传用户:racheal2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究了一种新颖的基于高斯混合模型(Gaussian Mixture Model,GMM)的低码率语音编码系统。该编码器利用GMM对短时语音谱包络进行拟合后用GMM参数来表示语音谱包络。由于GMM参数较少,从而可以使得编码速率很低。语音谱包络决定了合成语音的可懂度,文中研究了LPC法、LPC倒谱法和SEEVOC法的谱包络估计,并进行了仿真实验。经过对比,本系统采用SEEVOC法来获取短时语音谱包络。研究了GMM和EM算法,用6阶GMM参数(均值、方差、混合权重)表示短时语音谱包络。人耳对基音的变化比对其它任何参数的变化都要敏感,因此基音的检测对合成语音质量很关键。文中基于变长平均幅度差函数(LVAMDF)提出了一种改进的基音周期检测算法(Modified LVAMDF,M-LVAMDF),改进算法在LVAMDF的基础上结合修正的阈值线和简化的自相关函数(ACF)。经仿真测试表明,此方法能检测出汉语语音中基音变化较快的语音帧的平均周期,提高了汉语语音解码质量。本文建立了基于GMM的低码率语音编码器方案,对方案各模块进行了仿真并最终实现了整个编解码系统。仿真结果表明:该编码器在传输码率降低到2.35kb/s时,解码得到的语音有较理想的清晰度、可懂度和自然度,令人比较满意。
其他文献
青藏高原是我国内陆及周边地区重要的生态屏障。高寒草甸是广泛分布于青藏高原东部及其周围山地的地带性植被,是发展畜牧业的重要物质基础,为人类提供了大量生物资源,然而这些资
随着社会的不断发展和人们需求的不断提高,传统广播系统现在面临着许多挑战,如施工问题,距离问题,音效问题,系统升级与扩容问题,稳定性问题等。为了解决这些问题,广播系统数字化成为
佳宏这个人长得就敦厚,所以画的画也厚实,气也很足,笔墨也不错。佳宏的画苍润浑厚,气象高雅,笔墨设色也很好,局部交待得明确、用笔凝重,中侧锋结合有序,有文脉相承的自己的笔
酶是生物体内化学反应的催化剂,它支配着生物的新陈代谢、营养和能量的转化等许多催化过程。酶抑制剂是一类可以结合酶并降低其活性的分子,由于抑制特定酶的活性可以杀死病原体
人脸识别系统作为泛在网络的感知节点,有着广泛的应用前景,如身份认证、视频监控等领域。以上场景对于图像的分辨率及数据的存储空间等有着严格的限制,这就对人脸识别算法提
由于我国主要的轨道信号信息量少,很难实现高效率的列车控制,因此需要一种大信息量的轨道信号。法国TVM430轨道信号是一种信息量大,且具有27比特的数字编码轨道信号。本文将细致
哺乳类干扰素调节因子9(IRF9)很早之前就被认为是作为ISGF3复合物的亚单元,其在I型干扰素抗病毒感染中诱导干扰素刺激基因(ISG)的表达中至关重要。近期研究发现鱼类中也是通过
本文通过对荣华二采区10
期刊
电泳显示(EletroPhoretic Display,简称EPD)技术,由于其本身所具有的显示特性,吸引了许许多多商家的眼球,逐渐在显示领域呈现出一定的竞争性。现在全世界范围内纷纷开展对该项技
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊