【摘 要】
:
在语音情感分类算法中,目前大多数基于深度学习的方法存在没有考虑时域和频域的特征进行建模,且网络训练时间长、识别率不高的问题,提出了一种基于神经网络的语谱图情感分类
【机 构】
:
昆明理工大学信息工程与自动化学院 昆明650500
论文部分内容阅读
在语音情感分类算法中,目前大多数基于深度学习的方法存在没有考虑时域和频域的特征进行建模,且网络训练时间长、识别率不高的问题,提出了一种基于神经网络的语谱图情感分类算法.首先选取语谱图作为模型的输入,且为了减少语音情感特征提取过程中浅层特征和训练时上下文细节特征的损失,神经网络模型采用带有残差块的ResNet18网络和嵌入注意力机制的双向长短时记忆(BLSTM)网络的融合模型作为改进,利用ResNet18提取语谱图特征,然后使用注意力机制对其进行特征加权,在BLSTM网络中对加权后的特征进行训练和分类,最终该模型在CASIA数据集上的识别率分别为88.2%,与其他方法相比,所提算法有更好的语音情感分类效果,并且大幅度缩短了整体训练时间.
其他文献
为了对封闭容器中的液位高度进行实时测量,设计了一种线性调频连续波体制的导波雷达.雷达天线采用同轴导波杆,主控制器采用Xilinx公司ZYNQ系列芯片,完成了雷达系统控制程序的
无人飞行器在陌生场景中的自主路径规划与着陆工作一直是相关领域研究的重点,提出了一种基于激光雷达采集到的点云数据来给飞行器推荐最优着陆地址的方法.该方法通过飞行器位
随着现代社会的高速发展,多智能体系统编队控制在军事、航天等多个领域展现了广阔的应用前景,逐渐成为了自动控制领域的研究热点。梳理了多智能体系统(MAS)的研究脉络,首先,介绍了多智能体系统的研究背景;然后,分析领航者跟随法、基于行为法、虚拟结构法和图论法这4种常用的编队控制方法及虚拟势场法等非主流编队控制方法,研究并综述学者多年来的研究成果;接着,分析了编队控制的4个研究内容,即队形生成、队形保持、
机械振动工程中存在极端低频和极端高频信号,现有基于FFT的频谱分析法在测量极端频率信号的相位差时存在较大误差.为改善算法性能,首先对极端频率信号进行频谱分析,阐述其中