基于HMM与RBF的语音情感识别

来源 :郑州大学 | 被引量 : 0次 | 上传用户:fenglin1985z
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,新型智能人机交互技术的研究是计算机科学领域一个十分活跃的课题。模仿和延伸人类的情感使计算机具有识别、理解和表达情感的能力,是智能人机交互非常重要的任务之一。计算机具备了情感能力才能理解语音信号表现的情感,真正做到与人自然的交流。语音情感识别的研究作为智能人机交互的关键技术之一,对增强计算机的智能化、人性化、开发新型人机环境有着重要的现实意义。计算机根据语音自动识别说话人的情感,作出更针对的、人性的响应,能够有效地改善呆板的人机交互服务,提高交互的亲切性和准确性。本文主要是针对单一模型识别情感时的缺陷,建立基于隐马尔科夫模型和人工神经网络的混合模型进行分类。主要进行的研究工作有:(1)分析语音情感库及情感分类现状,确定所需情感类别。按一定规则选定录音情感语句、以及实验设备、录音人员等,录制包含高兴、悲伤、愤怒、惊奇、平静五种情感的汉语情感语音库。(2)针对不同情感的变化规律,分析并提取了能量、基音频率、共振峰等情感特征参数组合成语音情感识别的特征矢量进行情感状态的识别。(3)详细介绍了隐马尔科夫模型和径向基神经网络情感语音识别的原理和方法,结合隐马尔科夫模型对动态序列良好的建模能力和径向基神经网络强大的分类决策能力,建立基于两者的混合模型。混合模型保持HMM的基本框架,在HMM后串联一个RBF网络。同时,混合模型不再采用常用的最佳状态序列,而改用状态累积概率作为径向基神经网络的输入进行分类,避免了特征向量时间规整的麻烦,克服了神经网络只能处理固定输入的缺陷。(4)通过MATLAB实验仿真。结果表明:本文提出的基于隐马尔科夫和径向基神经网络的混合模型的平均识别率为65.35%,与单一隐马尔科夫模型相比识别率提高了5.25%,识别效果更好。同时又在信号中加入白噪声进行了混合模型鲁棒性测试,结果表明本文混合模型的抗噪性能要优于单一隐马尔科夫模型。
其他文献
为了检查我县茶叶质量,进一步提高品质,县农牧渔业局于4月21——22日,举行了全县茶叶质量评比会,县科委、科协、外贸公司、商业局,地区农牧渔业局、井岗山报社等应邀参加了
20年来,有关小麦胚乳蛋白质的遗传,进化及功能特性的认识有了很大的进展。本文主要论述了这些方面的进展,其中包括蛋白质分离和小麦细胞遗传谱系分析方法的改进。重点评论了
运动目标跟踪作为计算机视觉领域的重要分支,在安防工程、交通监控等领域得到了广泛的应用。近些年来,随着水上运动的普及和安全意识的提高,水上人体目标跟踪受到了越来越多
户用光伏储能系统中,如何实现对户用光伏电池、储能电池、户用负载和交流电网的运行状态及主要参数的监测、控制和保护,如何协调好户用光伏电池、储能电池、户用负载和交流电网之间能量的合理调配,研究户用光伏储能系统的能源管理装置具有重要意义。本文阐述课题研究背景、研究目的与研究意义,对国内外能源管理装置的发展及研究现状做了具体分析。阐述能源管理装置的功能,控制方案及工作原理,确定能源管理装置的总体架构。在硬
遗传算法是模拟自然界生物进化过程的计算模型,本文阐述了遗传算法的基本理论,建立了背包问题的数学模型,给出了遗传算法解决背包问题的基本方法,并通过实例计算证明了该方法
埃及对新选育的棉花品种都要经过3—5年的区试。为了防止棉花品种混杂退化,埃及政府于1958年制定了棉种保纯的法律,其中规定“一地一种”、“一厂一种”。埃及把棉花品种保
1973年以来张家口地区各县相继在海拔千米以上的旱梁坡地开展了春麦夏播的试验研究,获得了成功。涿鹿县1979年试种夏播小麦,亩产150公斤,比同等条件下的莜麦增产40%。1984年
我区旱地间套带状种植面积常年在200万亩以上,其预留行绝大部分都空起未用。为了提高预留行的利用,我们从1984年开始,进行了小春预留行正中栽油菜的试验,收到了显著的经济效
几千年来,中国女性一直处于社会最底层,女性的文学创作无法与男性相匹敌,只是到了“五四”时期,在新文化运动的激荡下,女性个人的独立意识渐趋觉醒,于是出现了一大群女作家。女作家
随着计算机技术和成像技术的发展,数字图像处理技术在各个领域得到了广泛的应用。为了提高图像处理的速度,使图像处理过程更加可视化,是设计基于图形化组态的图像处理开发平