基于隐马尔可夫模型的跨语种语音合成研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:fslihua
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着国际化社会的发展,仅仅一种语言已不能满足不同语言国家的人们之间的交流需求,而且并不是每个人都能短时间内熟练掌握多种语言,故而跨语种语音合成的产品应用需求急剧增加。随着统计参数语音合成技术的发展,尤其是基于HMM的语音合成技术,跨语种语音合成的研究取得了一定的进展。  若想将跨语种语音合成应用于产品中,必须构建一个速度快、精简的语音合成系统,而实际上满足要求的中英文语音合成系统较少。对于特定说话人的跨语种语音的合成,有研究者提出的基于音素的跨语种语音合成技术,来解决语料短缺的问题。虽然它能够合成特定说话人跨语种语音,但是对于中英文来说,两种语言的音素差异太大,合成语音的效果不尽人意。而后来有人提出基于状态映射的跨语种语音合成方法,效果较好,该方法具有很大的研究与应用价值。本文在前人的研究成果基础上,主要做了以下一些工作:  (1)本文以Flite+hts_engine为参考,在分析文本分析的各个模块的基础上,对英文合成软件Flite+hts_engine进行了一定的改进,包括文本预处理、句子结构调整以及数字化处理等等。改进后的系统,在保证合成语音质量几乎不变的情况下,减少了整个系统运行所需的内存空间,运行速度更快、系统占用空间更小,是嵌入式平台下英文语音合成的一种更好的选择。  (2)本文在SYN6658的中文TTS的基础上,结合改进的英文合成技术,经过分析比较中文TTS和英文TTS的特性之后,提出了一种构建简单快速、占用空间小的中英文语音合成系统的方法。构建的中英文语音合成系统能够实时快速地合成出中英文语音,系统简单、易实现且合成效果较好,是中英文语音合成产品的较好选择。  (3)本文以基于状态映射的中英跨语种自适应方法为研究对象,比较分析了MLLR、CMLLR、SMAPLR即CSMAPLR算法的性能,然后将状态映射应用于跨语种自适应中,并对自适应中两种使用状态映射信息的方式进行了比较分析。通过实验发现,基于状态映射的自适应方法具有一定的效果,CSMAPLR算法优于CMLLR算法,而且两种方式各有优劣。变换映射的方式能实现更好的语音音质,对原始的两个语言模型说话人特征的一致性有较高要求,而数据映射的方式可达到更高的说话人相似度。
其他文献
临终护理是对治愈无望的患者采取生活照顾、心理疏导、姑息治疗、缓解痛苦,提高临终患者生命质量,维护患者尊严,消除患者及家属对死亡的焦虑和恐惧,帮助临终者安宁地走完生命
护士绩效考核是护理管理的核心内容,进行科学的绩效考核,能够有效地调动护士工作积极性、主动性和创造性,增强护士的责任心,提高护理质量.同时,通过绩效考核,能够更好的规范
OFDM利用多个并行、低速数据流的子载波来实现高速数字通信。因其抗多径、频谱利用率高等优点,近年来得到了广泛关注,成为下一代移动通信系统的关键技术之一。然而在有共信道
老年患者随着年龄的增长,生理机能逐渐衰老,各系统的器官机能退化,以及伴随着心理方面的变化,这些变化直接影响了其生活质量、身体健康和疾病的康复.所以如何做好老年人的心
儿科门诊输液室是医院的重要窗口单位,也是高风险科室,其特点是患者多、周转快,具有较强的特殊性和复杂性.目前患儿多是独生子女,患儿家属多有紧张焦虑心理,护理风险系数较高
无痛内镜检查因其无痛苦、无不良记忆,为广大患者所乐于接受.然而在应用中笔者发现,无痛内镜检查因增加了呼吸、循环等方面的风险和手续复杂、麻醉及苏醒过程耗时较长等问题,
高速上行链路分组接入(HSUPA,或E-DCH)是WCDMA中专门为提高上行链路分组数据传输速度提出的技术。3GPP组织于2002年开始进行可行性研究,并于2004年在3GPP Release 6中正式推
本文就主要应用于水下宽频带鱼雷自导系统目标模拟的DSP系统——基于ADSP21160的阵列信号源的系统设计和研制进行了探讨和研究,重点研究了实现系统所需功能和技术指标的应用设
医院感染的预防控制工作中,护士发挥着至关重要的作用.因此,应在护理工作中有效预防和控制医院感染.rn1 加强医院感染教育与培训rn
放射治疗是肿瘤综合治疗的重要措施之一,放射性肺炎是胸部肿瘤放疗的常见并发症.放射性肺炎的临床表现放疗中或放疗后1~3个月出现低热、刺激性咳嗽、胸闷、胸痛、呼吸困难等,