【摘 要】
:
情感识别的主要任务和目标是让机器感知人类的情绪,不仅可以听懂看懂人类表达的意思,还可以通过表情、文字、声音来读懂人类的情绪。通过机器感知人类的情绪,可以更好地定制化为人们服务,情感识别的相关研究不仅对于未来的人工智能相关研究发展有巨大的意义而且还有巨大的商业价值。情感分析是自然语言处理的一项基本任务,现在基于单一模态的信息处理(文本)的处理已经非常成熟,但是对于文本、图片、声音的多模态的情绪识别则
论文部分内容阅读
情感识别的主要任务和目标是让机器感知人类的情绪,不仅可以听懂看懂人类表达的意思,还可以通过表情、文字、声音来读懂人类的情绪。通过机器感知人类的情绪,可以更好地定制化为人们服务,情感识别的相关研究不仅对于未来的人工智能相关研究发展有巨大的意义而且还有巨大的商业价值。情感分析是自然语言处理的一项基本任务,现在基于单一模态的信息处理(文本)的处理已经非常成熟,但是对于文本、图片、声音的多模态的情绪识别则增加了更多的挑战。人与人之间的交流是一种多模态信号,人们的情绪通常通过文字(文本模态),面部表情(视觉模态),和语气语调的变化(声学模态)作为载体得以表达,人和人之间可以轻松地感受到彼此情绪的变化,对于机器准确的识别情绪还十分困难,通过研究多模态情绪识别可以让机器更好地识别情绪。在处理多模态情绪识别的过程中,目前较为常用的方式是对单一模态进行特征提取,采用联级的方式进行特征融合,这种方法会使信息量过大且默认向量影响效果相同导致情绪识别效果不理想,为了解决该问题,本文主要采用了两种方法进行多模态情绪识别。(1)分别对输入的特征(文本、声音、图片)进行特征向量提取,将提取的特征向量输入到Self-attention网络中进行特征融合,融合后的特征向量连接到全连接的网络结构中,通过Softmax进行情绪的分类,得到分类结果。(2)基于Video-BERT模型对输入的视频进行处理,将提取到的visual token和text token输入到BERT网络中进行特征提取,将提取的特征输入到Selfattention层中后续接入全连接层进行分类。在MELD数据集中进行对单一模态的情绪识别、多模态情绪识别进行实验,并且对比其他情绪识别方法和本文提出的两种方法的识别准确率。为了验证本文提出方法的可扩展性,在CUM-MOSEI数据集中进行验证。实验结果表明,本文提出的两种情绪识别的模型可以有效的识别情绪,在相同数据集中实验结果表明多模态情绪识别的效果均高于单一模态的情绪识别。且基于自注意力机制的特征融合方法的准确率高于其他方法,基于Video BERT的情绪识别方法与目前最优的方法相近,本文还将情绪识别的方法应用到实际的基于对话的人工智能客服系统中,均有良好的表现且提高了客户的满意度。
其他文献
高速公路在经过有地下开采的区域时,受到附近地下开采的影响,导致原来平整的公路路基产生变形。地下开采的位置和公路相对位置不同,造成的公路路基的破坏也不相同,地下开采造成的地表沉陷与水平变形也会给公路的路基造成不同的破坏,所以地下开采的存在对高速公路路基正常使用造成了影响,因此在高速公路附近有地下开采时,对高速公路路基进行稳定性评价十分具有必要性。本文以阳蟒高速高速公路路基为研究对象,结合西河煤业32
我国自2000年以来,老年人口急速增长,如何应对庞大老年人群体的护理需求,化解随之而来的社会风险,使老年人高质量、有尊严的度过余生,是我国迫切需要解决的问题。2016年人力资源和社会保障部印发的《关于开展长期护理保险制度试点的指导意见》中明确提出,要探索为老年人及失能人士建立提供基本生活照料及相关医疗护理所需资金或服务的社会保险制度。而构建长期护理保险制度极为重要的长期护理评估体系,既决定了老年人
扬州农商银行根植扬州多年,是有较长历史的农村金融机构。自成以来,扬州农商银行坚持其市场定位,以服务“三农”和“支农支小”为宗旨,抓住了经济发展的机遇,坚持不断创新,不断发展壮大,取得了一定的成绩。但是,随着我国宏观经济的调控以及经营环境的变化,使得扬州农商银行的发展面临新的机遇与挑战。那么,扬州农商银行如何在激烈的市场竞争环境中找准定位,如何适应复杂多变的外部环境,如何根据自身的发展情况制定发展战
研究目的:1.进一步总结VLS临床特征2.分析病变程度与病程的相关性3.分析点阵式激光治疗对VLS的临床疗效分析4.总体治疗效果分析。方法:本研究于2018年5月至2019年4月回顾性收集分析大连医科大学附属妇产医院妇科门诊40例VLS患者的临床资料,所有患者均经活检病理学检查证实VLS。本研究方案经大连医科大学附属妇产医院伦理委员会批准,并与患者签署了知情同意书。结果:年龄范围为26~73岁,平
密码S盒设计与安全性分析一直是分组密码研究中的重点。密码S盒作为分组密码的关键性部件,为密码算法提供混淆,决定着算法的安全性。衡量密码S盒安全强度的指标包括代数次数、线性度、差分均匀度、透明阶等。传统的构造方法设计S盒有一定的局限性,如因搜索空间有限导致构造的S盒复杂性不够容易受到攻击,或者效率太低等。计算智能算法在S盒的设计方面表现卓越,具有较好的优化性能。本文侧重研究4×4和8×8密码S盒的自
多模态隐喻在意义的构建中并不是从源域到目标域的单向映射,而是多向的、动态的构建过程,在电影语篇中尤为如此。以电影《时间去哪儿了》中五个以"时间"为主题的短片为语料,
目前煤矿已配备较完善的视频监控系统,但依赖人工查看,查看疏漏易留下安全隐患。运用智能目标检测与跟踪技术处理矿井视频,可及时发现安全隐患并发出警告,对矿井安全有重要的现实意义。本文具体工作如下:1.利用背景差分法检测目标,进行混合高斯背景建模,动态更新背景。矿工头戴矿灯及手电筒会形成动态光斑,检测时误判为目标,提出双阈值背景差分法去除光斑;针对矿工的阴影部分,结合像素阈值判断及相关系数进行阴影判断并
市场集约化趋势下,单一企业的竞争逐渐演变为供应链之间的博弈。中小企业可以依托核心企业信用或流通物的资产价值进行融资。与传统的融资业务不同,供应链融资参与主体多、流程复杂、信贷资产价值动态变化等特点决定了其信用风险管理方式的差异性。当下国际经济形势复杂、尚有不确定性因素存在,国内经济下行压力较大、经济增速放缓。尽管2018年加征关税,中国进出口贸易额并未出现较大波动,短期内影响不大;但从长期来看,若
古筝是中国传统乐器,至今已有两千多年的历史,随着时间的推移,其左手弹奏技法也经历了巨大的变化,从“做韵”到“取音”再到二者的平衡,左手的弹奏技法在不断加大难度,甚至有“右手化”倾向。《大漠行》是笔者在研究生音乐会中演奏的曲目,这首筝曲创作年份较新,因此,研究其作品的文献较少。笔者通过实践加理论的研究,以及鉴赏其他优秀的演奏家对该曲的演绎,对该曲的左手演奏技法产生浓厚的兴趣。本文将对分成三个章节,第
棚户区改造工程项目是我国的一项惠民工程,致力于解决棚户区居民的居住条件和居住环境问题。随着经济的高速发展,城市建设也不断加快,对建设整体舒适性的要求也在不断提升。为了保证这项惠民工程能够最大限度发挥作用,使居民切实感受到国家和政府的关怀,棚户区改造工程的全程施工作业及工程质量就要格外重视。本文以佳木斯棚户区改造项目七期安置区工程为例,研究施工单位在施工过程中可能遇到的风险,进而对其进行预防和应对,