采用超音段韵律特征联合短时频谱的语音转换

来源 :苏州大学 | 被引量 : 0次 | 上传用户:whjsdsdsd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音转换技术是指将源说话人的语音模式转换成目标说话人的语音模式,保持原有的语义信息不变,而使转换后的语音听出是目标说话人的。语音转换是语音信号处理领域一个较新的分支,该技术可用于文语转换系统、电影配音和保密通信等多个领域,具有很重要的研究价值。本文将主要围绕语音转换的频谱包络转换和韵律特征转换两项关键技术进行研究,并对相关问题进行分析,从而得到一个完整的系统,具体的实现语音转换。本文的内容主要包括以下几个方面:(1)研究了语音转换的相关知识,包括语音的产生、数学模型、常用的语音信号分析方法。介绍了基本的语音转换系统,并就实验中采用的STRAIGHT模型和转换性能评价标准进行了讨论。(2)通过分析常用的频谱包络转换方法的利弊,引出了本文选取的基于混合高斯模型的频谱包络转换,并对转换的相关问题与转换步骤进行了阐述。(3)针对传统语音转换方法中对超音段特征的研究与转换的忽视,本文重点研究了语音的韵律转换,提出了对语音进行多韵律特征同步转换的方法。转换的韵律特征包括基频、语速、停顿、重音。(4)给出了本文提出系统的总体框架,并编程实现。分别从主观和客观两个方面评价了转换后语音的质量,实验结果表明本文提出的语音转换系统转换性能优于传统方法。
其他文献
随着通信、多媒体和计算机相关技术的快速发展,图像传输已成为多媒体通信的关键组成部分。传统通信系统的基础是香农编码理论,即将信源编码和信道编码分开进行考虑,这种方法
随着城市规模的逐渐扩大,城市公交客流增长明显。为更好的为公交乘客提供优质的服务,建立一套完善的公交车视频监控系统显得非常迫切和重要。该系统不仅能极大地提高公交车内
肺癌是当今世界上最常见的癌症之一,并且确诊之后的存活率也是很低的。造成这种情况的最主要原因是,由于医学条件的限制,肺癌在早期的时候十分难以发现,而等到了晚期,症状明
大量测量数据表明传统的互联网流量具有自相似(或长相关性)特性,该特性对网络性能评价和业务建模技术产生了很大的影响。物联网具有不同于传统互联网的特点,包括低移动性、上
根据全国老龄委数据显示,“十二五”时期我国人口将呈现老龄化、高龄化、空巢化加速发展的新特征,而人口结构老龄化和生活方式的改变等因素也诱发了心血管疾病。心血管疾病死
近些年来,在无线通信领域,多输入多输出(MIMO:Multiple Input Multiple Output)技术和正交频分复用(OFDM: Orthogonal Frequency Division Multiplexing)技术取得了重大的突
无线通信技术因为其成本较低和使用、部署简单方便的特点在人们的生活、工作中有了越来越重要的地位。目前普遍使用的无线终端的工作频段都在微波频段,主要是2.4G和5G频段,这
三维运动视觉分析的热点和核心是从一系列的高速拍摄的二维动态图像序列中提供的信息来恢复三维形状和运动状态。由于非刚体在日常生活中更为普遍,所以非刚体的三维运动分析就
频谱资源短缺和海量用户接入是下一代移动通信系统(5G)面临的重大难题。稀疏码分多址接入(Sparse Code Multiple Access,SCMA)技术是一种新型非正交多址接入方式,其非正交性