一种基于特征融合的耳语音向正常音的转换方法

来源 :南京航空航天大学学报 | 被引量 : 0次 | 上传用户:xiaozhu222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
使用耳语音的频谱包络来预估正常音的基频特征,这类算法在对正常音基频预测的准确性上存在一定不足,在合成语音自然度方面存在着明显欠缺,有时会出现音调失常等问题。本文提出一种声学特征融合的方法,通过双向长短期记忆(Bi‑long short‑term memory,BLSTM)深度网络来逐帧预测正常音基频。首先,使用STRAIGHT模型和相关代码,分别对耳语音和正常音语料进行预处理,提取耳语音的梅尔倒谱系数(Mel‑scale frequency cepstral coefficient,MFCC)、韵律及谱包
其他文献
市场上往往具有多款机型能够满足航空公司增加或更换退役飞机的需求,因此需要对这些机型进行产品竞争力及投资分析评估。本文从备选机型角度,提出了飞机选型的4大分析要素并
多标记学习和选择性集成是机器学习中的两个热点研究问题。本文利用聚类思想探究多标记学习中的选择性集成,提出了两种具体的多标记选择性集成算法:基于最小距离的簇中心选择
复合材料的耐撞性受到了广泛重视,而波纹梁因其优异的抗屈曲构型被广泛应用于飞机翼梁和直升机底板等经常发生碰撞的结构中。进行了复合材料波纹梁的屈曲分析,研究了高度对波
串联排队系统是构成排队网络的基本结构,但是除了满足马尔可夫性或服务时间为常数的串联排队系统外,一般的串联排队系统的平均排队时间难以精确计算。为了刻画串联排队系统各