【摘 要】
:
情感识别研究对于人机交互有着非常重要的意义,情感的表达通常涉及语音、文本和面部微表情等多个模态,其中情感语音数据库的构建难度较大,因此针对语音情感语料的数据增强方法具有重大意义。近年来,研究人员开始尝试将其它模态信息引入到语音情感识别研究中,更好地挖掘出各模态之间的关联信息变得尤为重要。 本文围绕数据增强和多模态特征融合两个方面展开研究,基于神经网络和注意力机制等搭建模型框架。论文主要工作如下:
论文部分内容阅读
情感识别研究对于人机交互有着非常重要的意义,情感的表达通常涉及语音、文本和面部微表情等多个模态,其中情感语音数据库的构建难度较大,因此针对语音情感语料的数据增强方法具有重大意义。近年来,研究人员开始尝试将其它模态信息引入到语音情感识别研究中,更好地挖掘出各模态之间的关联信息变得尤为重要。
本文围绕数据增强和多模态特征融合两个方面展开研究,基于神经网络和注意力机制等搭建模型框架。论文主要工作如下:
(1)基于语谱图数据,利用卷积神经网络来学习空间信息,同时使用长短期记忆网络来学习语音信号固有的时间序列信息,为了平衡两者之间的关系,提出了时序分割卷积神经网络模型。同时基于语音情感分布局部性的特点,提出了基于局部翻转的语谱图数据增强方法。
(2)针对多模态融合问题,使用注意力机制学习各模态之间的内部关联信息,然后提出了基于注意力机制的单向交叉融合模型、双向交叉融合模型、交叉融合模型以及全融合模型。
通过实验分析,本文提出的改进数据增强方法和混合神经网络可以提升语音情感识别性能,提出的多模态融合方法相对于传统融合方法更加有效,相对于已有基于注意力机制的融合方法可以挖掘出更深层次的情感信息。
其他文献
作为极小种群野生植物种之一,天目铁木(Ostrya rehderiana)仅分布于浙江西天目山,现存野生成体只有5株,属于国家一级保护植物。本论文以分布于西天目山的天目铁木幼苗(小于10年)、人工林成株(约40年)和自然成株(约100年)为对象,通过野外和室内试验,分别测定了6月、8月和10月对3个主要生长季的光合日变化、叶绿素荧光参数和叶绿素含量等光合生理特征。 在此基础上,本文着重开展了如下
九龙山榧Torreyajiulongshanensis是分布于我国浙江省西南部和中部的红豆杉科Taxaceae榧属植物,是新生代第三纪孑遗特有树种,也是我国国家Ⅱ级保护野生植物。自九龙山榧定名以来,所报道的种群数量仅17株,分散分布于金华市磐安县、丽水市遂昌县、丽水市莲都区、丽水市松阳县等少数分布点。由于地史冰川作用、人为干扰,其分布面积小、数量稀少,然而其濒危原因却尚未有研究报道。本文主要从九龙
我国人工林面积在近些年来不断扩大,然而我国现存人工林仍面临诸多的问题,如何提高森林生态系统可持续性与稳定性成为当今的热点问题。抚育间伐是一种重要的森林经营的措施,能影响森林生态系统的内部生物多样性。物种多样性较高的植被可以阻止生态因子的单向累积,增加生态系统稳定性。近些年来我国开展了大量有关抚育间伐对林下植被多样性影响的研究,但研究方法以抚育间伐若干年后的常规野外调查方法为主,其研究结果难以更加全
【目的】 化学合成及鉴定两种重组神经肽PACAP13和OT23,细胞水平上,设置PACAP13/OT23与细胞一起培养体系,分析和比较PACAP13/OT23对小鼠淋巴细胞的增殖和凋亡的细胞活性作用。在个体水平上,在Pristane诱导的红斑狼疮小鼠和自发性MRL/lpr狼疮小鼠两种系统性红斑狼疮小鼠模型基础上,分析PACAP13/OT23对小鼠自身抗体和肾脏免疫复合物沉积的效应,对胸腺和脾脏初
昆虫表皮(又称外骨骼)主要由坚硬的外表皮层和柔软的内表皮层构成,结构蛋白是其主要的组成成分。表皮不仅具有保护功能,也作为肌肉的支点构成昆虫的运动系统。白蚁是最古老的社会性昆虫,巢群内有明确的品级分化(工蚁、兵蚁和生殖蚁)和社会分工。工蚁担负筑巢、清洁、觅食和抚育幼蚁等工作;兵蚁承担防御任务;成虫可以飞出原巢建立新巢,成为原始生殖蚁。白蚁的外表皮层和内表皮层结构在不同品级间是否存在差异还不清楚。为了
现有互联网原始设计思想中的诸多弊端影响了互联网的进一步发展,因此世界各国研究并提出了多个新型网络体系结构,如具有“三层”、“两域”结构模型的智慧协同网络。在实际应用部署中,智慧协同网络分为接入网和核心网两部分。在接入网中,通过引入族群的概念实现组件的虚拟化。在核心网中,通过组件标识的映射实现数据包的安全传输。现有的网络管理系统目前并没有对智慧协同网络的接入网和核心网进行针对性管理,不能有效地用于智
造成电磁波空间传播轨迹发生偏移的结构体被称之为散射体,而电磁波传播轨迹偏移的物理现象被称之为散射现象,因此散射体建模即对其造成的散射进行建模的过程。散射体建模对车联网的发展具有重要意义,主要原因是电波传播特性的深入理解是任何车联网无线通信系统设计和优化的基本保障。而车联网场景的电波传播(或无线信道)特性取决于场景中散射体的类型与位置分布。区别于传统蜂窝小区,车联网场景中的无线信道有着复杂多样的特性
偏振保持波导作为波导的一个重要分支,是偏振敏感及偏振依赖的通信和传感系统不可或缺的组成部分。偏振保持少模光纤将“少模”与“偏振复用”结合,可作为空分复用技术的一种实现方式,为进一步扩充光通信传输容量开启了一扇新颖的大门。在偏振敏感的太赫兹(Terahertz,THz)传感、光谱成像及无线通信等系统中,THz偏振保持波导在传输偏振信息的同时,提高了系统的稳定性,减小了系统的体积,是当前的一个研究热点
近年来,空气污染问题严重化促使人们不断提高自身环保意识,出行工具从燃油汽车转变为电动汽车,因而电动汽车将拥有广阔销售市场。电池组是电动汽车的重要部分,其工作状态是车辆运行情况的重要依据,基于这一实际价值,本文设计了一款BMS一体机,其中BMS指电池管理系统。本课题所研究的重点是电池组SOC估计,即荷电状态估计,详细阐述了电池模型筛选、对应内部参量辨识、应用参量后的精度验证、电池SOC估计方法的比较
医用输液是我国五大常用药品制剂之一,在各类医学场景都应用广泛。显而易见,输液瓶包装的质量直接影响着患者的安全。然而,由于输液瓶制备工艺的不成熟,一些外观缺陷会以小概率稳定的出现。目前,为了确保出产的输液瓶包装合格,制药厂采用的是人工检测的方式。但是,人工检测有着效率低下、可靠性不足的问题。因此,本论文研究医用大输液外观缺陷的视觉检测技术,配合硬件采集设备和处理设备,以达到代替人工检测的目的。从而在