文本-可视语音合成系统的研究及实现

来源 :新疆大学 | 被引量 : 0次 | 上传用户:yizhonglishi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本-可视语音合成系统,将语音和图像两种模态结合到一起,建立了多模式人机交互接口,大大改善了人机交互的方式,在许多领域有着广泛的应用前景。为了生成具有较强真实感的,能应用于网络、嵌入式等环境的TTVS 系统,本文工作如下:本文首先建立了一个二维标准人脸模型,并应用MPEG-4 人脸动画原理开发了二维人脸动画数据编辑工具,在此基础上建立以FAP 为驱动源的基于标准人脸的动画机制。通过改进的主动形状模型方法,开发了基于单张人脸图片的人脸模型匹配工具,从而建立了适用于任意人脸的动画机制。提出动态音节视位的概念,将文本映射为相应的音节视位。在音节视位的拼接过程中,先根据语音韵律规则对音节视位进行调整,然后根据用户指定的表情进行表情与视位融合,最后应用改进的Hermite 插值算法对音节视位进行拼接,从而合成了富有表情具有语音韵律感的人脸动画。借助科大讯飞文语合成系统,实现了语音与动画同步机制,实现了一个文本驱动的人脸语音动画系统。在原有聊天系统的基础上增加TTVS 功能,实现了一个网络语音动画聊天系统。与以往不同,本文开发的TTVS 系统数据量小,能够实时生成,动画机制具有模型移植性,具有表情和语音韵律感,更具有真实感,能够适用于网络与嵌入式环境。本课题受国家自然科学基金项目“虚拟人多模式行为协同关系学习算法的研究”资助。
其他文献
研究目的 (1) 以家兔为实验对象建立了4种医源性喉返神经(RLN)损伤的动物模型,研究不同损伤方式对喉返神经功能的影响。(2) 评价术中实时监控技术(RTIM)在预防喉返神经医源性损伤中的
目的探讨分析右美托咪定的剂量对妇科手术伴高血压患者的麻醉效果的影响。方法选择330例拟行妇科手术伴有高血压的患者,按随机数字表法均分为D1、D2和D3组,每组110例,D1组给
元代学记文是具有重要史料价值的文学文献,其所塑造的高水平教育大国的形象,蕴含着当时统治者企图通过兴学而强国的国家意志,并透露出元人对国家高度的自信心和强烈的自豪感
温室温度控制是一个非常重要也非常困难的课题。一方面,温室环境中温度与外界气候因素如气温、光照、风力、雨雪等因素相关,也与温室的建筑材料密切相关,而且,作物的生长也影
林业工程是一个比较广泛的概念,包括多重项目内容,每一个项目的内容又都比较复杂,稍有不慎就可能导致林业工程的质量问题,这显然给林业工程的工作人员提出了巨大的挑战和工作
目的探讨2μm激光治疗膀胱肿瘤的手术与传统的经尿道膀胱肿瘤电切术(TURBT)治疗非肌层浸润性膀胱癌的临床效果。方法 T2期以内膀胱癌患者78例,随机分为观察组(n=37)和对照组(
财政风险在目前呈现急剧扩大的趋势 ,其直接原因是制度变迁过程中的制度缺陷。因此 ,本文通过分析制度变迁过程中的制度缺陷寻找产生财政风险的根源 ,并提出以市场为导向进行
2013年12月23号至24号,中央农村工作会议在北京举行,中共中央总书记习近平发表重要讲话,国务院总理李克强作出具体部署。会议讨论了《中共中央、国务院关于全面深化农村改革加快推进农业现代化的若干意见(讨论稿)》。  材料一:会议强调,小康不小康,关键看老乡。一定要看到,农业还是“四化同步”的短腿,农村还是全面建成小康社会的短板。中国要强,农业必须强;中国要美,农村必须美;中国要富,农民必须富。农