面向情感的语音合成系统

来源 :第一届中国情感计算及智能交互学术会议 | 被引量 : 0次 | 上传用户:guanzheng52824
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感语音合成是近几年语音合成的研究热点,现有的研究多以语音的韵律和声学特征为指导因素.在情感语音合成的研究中,必须解决如下三个核心问题:(1)如何确定情感状态和情感语音的声学特征参数?(2)如何建立情感状态与语音的声学特征的关联关系,建立情感声学参数的综合控制模型?(3)如何结合文本分析和场景因素建立情感的预测机制?本文将围绕着这三个问题进行深入的探讨,在实验分析的基础上,对情感语音合成中需要处理的情感特征,以及情感特征的相互关系问题进行分析,并针对这些关联关系提出了情感声学模型和情感的韵律建模的思路,初步实现了一个情感语音合成系统的原型.
其他文献
本文提出了一种基于单幅正面人脸图像的人脸三维重建及表达方法.首先从图像中自动检测人脸、定位面部特征点;然后根据正面人脸属性估计特征点的深度信息;接着基于特征点坐标
会议
在离我工作和生活的小城不远处,有一座道教名山巍宝山,绵亘数十里,峰峦起伏,山形似一头蹲坐的雄狮,正回首俯瞰着整个巍山坝子。  巍宝山宫观密布,蔚为壮观。其山分前后两边,宫观建筑布局总的体现了“道法自然”的特点,前山绵亘叠障,宫观多藏于密林之中;后山险峻陡峭,庙宇多依山势显建于岩壁之间。“山不在高,有仙则名”。作为一座道教名山,巍宝山今日香火依然,山上,古木参天、浓荫葱郁、溪泉叮咚、花繁草茂。现存的
本文给出了一个针对有词表约束下的非母语连续英文字母串识别系统,采集了非母语字母串语音库,训练了基于Mel倒谱系数和连续HMM的英文音素三音子模型,识别时将词表约束结合进
目的探讨CT和MRI两种影像学检查方法在口腔及口咽部病变中的诊断价值。方法选取80例口腔口咽部病变患者作为研究对象,随机分为研究组和对照组,每组各40例,研究组患者采用MRI检查
周保中是白族优秀儿女的典型代表.作为一位著名的革命家和军事家,他在抗日战争、解放战争、新中国建设中都立下了不朽功绩.他革命的一生,是一个白族人追求光明、艰苦奋斗的一
本文以人工心理理论为基础,对情感计算作了初步的探索性研究.首先将情感状态划分为不连续的状态并构成了情感空间,其熵值表达出我们所构造的情感的细腻程度.其次将情感状态在
会议
目的研究多索茶碱在支气管炎治疗中的临床效果,对多索茶碱的临床应用情况进行分析探讨。方法回顾性分析2012年12月~2014年12月在我院收治的100例支气管炎患者的临床资料。按照
本文讨论了基于神经网络的汉语语音情感识别.首先录制了400句汉语语音作为情感语音数据库,从语音信号中提取了能量、基频、语速等特征.然后利用神经网络识别汉语语音中的四类
大理国(937-1253年)是云南历史的一个奇迹,也是外人眼里的一个谜。生活在大理国时代的人们热爱和平,民风淳朴,与世无争,风俗民情与中原之地迥然有异,被世人称为“妙香国”。
目的:探讨护理干预对重症支气管哮喘患者的临床应用及价值。方法选择90例重症支气管哮喘患者随机分为观察组和对照组,每组各45例。对照组45例患者采用常规护理,观察组45例患者在