语音合成系统中语音库样本能量均衡方法研究

来源 :信号处理 | 被引量 : 0次 | 上传用户:iloveyouguoran
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音合成(Text to Speech,TTS)技术是实现人机语音通信的一项关键技术,语音库的质量是决定TTS效果的重要因素。本文针对TTS语音库制作周期长,发音人录音状态(音色、能量)差异而导致的TTS语音数据库录制后能量不一致问题,提出了一种语音能量均衡方法,包括时域包络波动检测和帧能量平均两个步骤。首先分析获得标准语音的相关能量参数和波动参数作为模板,利用时域包络波动检测算法对预调节语音样本的合格性进行检验;最后,根据帧能量平均准则,对所有合格语音样本进行时域幅值调整,以最大限度地保证语音库整体能量
其他文献
HJS复合型软岩是指具有高应力、节理化、膨胀性软岩,因此,巷道表现出十分复杂的变形特征。以古山立井西二采区运输石门(在巷)为例,详细阐述了现场监测试验结果,以及进行耦合支护和反馈
针对现有基于纹理特征的人脸识别算法中纹理特征维数偏大且对噪声较敏感等不足,提出了用于描述人脸图像大尺度局部特征的中心四点二元模式(Center Quad Binary Pattern,C-QBP)和用于描述图像小尺度局部特征的简化四点二元模式(Simplified Quad Binary Pattern,S-QBP)两种互补的新型纹理特征。在此基础上,实现基于新型纹理特征的2DLDA人脸识别算法。
对4种配套方式的岩巷掘进机械化作业进行了分析,提出了一种适合大断面巷道掘进施工的设备配套方案。
为了降低多天线信号频谱偏移、相位随机性和噪声的不均匀性、不确定性对频谱感知性能的影响,该文利用接收信号协方差矩阵主对角线包含主用户的主要信息,以及协方差矩阵元素的平
乡镇政务公开是我国政务公开的重要环节,具有重大的意义,推行多年来,在取得了不少成效的同时也暴露出了很多问题。本文从乡镇政务公开的内容、形式、机制等现实问题入手,侧重于乡
石门厚煤层掘进施工一般采用料石砌碹的支护方式,施工荒断面较大施工速度慢,工人的劳动强度大。开滦矿务局赵各庄矿十二水平西翼五石门在揭穿并通过水平距离20多米厚的12号煤层时,采