语音基频检测及其频模型的研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:abcd494895936
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着计算机及数字信号处理技术的发展,人机交互技术有了很大的进展,作为其中重要组成部分的语音合成技术也得到了迅速的提高。目前已有许多语音合成方法,合成语音的清晰度达到了令人满意的效果;而其自然度和韵律性还跟人们的期望有一定的差距,带有很大的机器味。从而寻找一种能够有效模拟自然语音的韵律特征的方法一直是语音合成技术的一个研究热点。 语音的韵律特征包括基频、时长及幅度等,其中最主要的是基频。自然语音基频曲线的准确检测在语音信号处理中占重要地位;它不仅是我们分析自然语音的韵律特征的一个重要工具,而且在语音合成和语音识别中有广泛的应用。为提高合成语音的自然度,需要建立一个更加有效的基频模型,而良好的模型的建立是以自然语音基频曲线准确有效的检测为基础的。 论文首先概述了课题的研究背景,并对语音的发音机制、语音产生的数学模型及语音的时频特性做了介绍。然后,对国内外基频检测的研究现状进行了回顾,论述了自相关法、倒谱法、平均幅度差法及小波变换等基频检测的原理及算法。简要的阐述了语音合成中的基频控制的现状;并对小波变换的原理及性质进行了详细的介绍。 本文提出了一种基于最佳尺度的小波变换基频检测。传统的小波变换基频检测,通过比较相邻两尺度下的极值点的位置是否一致,来确定声门闭合时刻,求得基频。由于小尺度下容易引入伪极值点,需要进行多次的小波变换及极值点搜索和判定,降低了算法的准确性和实时性。本文提出的最佳尺度的小波变换基频检测方法,利用发声器官的生理特性以及语音基频曲线内在的特点,结合小波变换的优点,先进行最佳尺度的判定,然后在该尺度下进行基频检测。新算法不仅有效的去除了伪极值点,增强了检测的准确性;而且不必进行多个尺度下的极值点搜索和确定,利用改进的极值搜索方法,提高了算法的实时性。 论文利用提出的基频检测方法,对一标准单音节语音库进行了基频的提取,阐述了各个声调的典型基频曲线模式。在此基础上对Target模型中的Target进行更详细的分类,设置了更加合理的Target;在设定好Target模型的表达式后,用改进的小波变换的基频检测方法来提取基频曲线,然后采用基于合成的分析方法,按照最小均方误差的准则来进行模型参数的求解;重新拟和后的基频曲线与原模型相比,更准确的反映了实际基频曲线的变化情况,从而证明了新模型的有效性。论文的最后对论文中的工作进行了总结,指出了实验中存在的不足,并对以后的研究工作提出了思路。
其他文献
光纤布拉格光栅(Fiber Bragg Grating,FBG)传感器技术是光纤传感中实用性最强、可靠性最高的传感技术,同时也是目前国内外研究的热点之一。相比于其它传感器,FBG传感器具有体积
如今稀缺的无线频谱资源不能满足需求,制约了未来无线通信技术的快速发展。认知无线电(Cognitive Radio,CR)技术可以动态检测网络中未被使用的频谱资源,并充分加以利用,可有
嵌入式机顶盒以电视机为显示设备,以因特网为传输网络,给用户提供多媒体信息服务。它是为了让广大普通家庭通过电视机享受到网络、数字媒体、计算机技术所带来的丰富应用,特
随着医学科技水平不断提高,医学影像案例也随之不断的增长,如何快速准确的找到和需要查询案例最相似的医学影像辅助医生进行诊断受到越来越多的重视。医学影像案例包含有图像的
运动目标的识别与跟踪技术是应用视觉领域中一个重要的研究课题,在诸如导弹的地形匹配、飞机导航、武器投射系统的制导等领域都有着广泛的应用。本文所设计的空中目标跟踪系
在移动通信从2G向3G过渡的今天,新技术不断应用,新的移动网络运营商日益发展,频谱资源日趋紧张,各种潜在的干扰源正以惊人的速度不断产生。在我国,中国移动、中国联通、中国电信、
2007年将是全球3G产业迅猛发展的一年,年初全球3G用户已经超过1.5亿,其中WCDMA用户已经超过1亿,CDMA2000用户5000万。作为我国自主研发的3G无线通信系统TD-SCDMA也加快了其发
多路径效应问题一直以来就是雷达波束分辨与测角的难题之一,其中多路径效应对近地入射目标仰角估值精度的影响尤为突出。米波雷达利用波长与目标尺寸可比的特点在获得反隐身
无线传感器网络是继因特网之后,对21世纪人类生活生产方式产生重大影响的热点技术之一。无线传感器网络技术集合了嵌入式系统技术、分布式信息处理技术、传感器技术及无线通信
传统的视频编码标准均采用基于块的空间域运动估计技术来减少视频帧的时间冗余。由于小波变换在静态图像编码应用中的优良特性,基于小波变换的运动估计技术也成为了近来研究