基于深度多任务学习的图像美感和情感联合感知研究

来源 :山东大学 | 被引量 : 0次 | 上传用户：huanying19870604

【摘要】

：

【作者】

：

余俊

【出处】

：

山东大学

【发表日期】

：

2020年12期

【关键词】

：

多任务学习深度卷积神经网络特征融合图像美学质量评价图像情感信息识别

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近几年,随着深度学习技术的普遍运用,图像处理与分析的研究工作取得了巨大成功。在以车牌号码识别、人脸识别、单目标检测等为代表的图像分类、目标检测等应用领域,取得的进展可谓是突破性的。然而,在对图像更高层次的抽象理解上,仍面临着严峻的挑战。典型地,例如图像的美学质量评价(美、不美)和图像的情感信息识别(快乐、愤怒、恐惧、悲伤等),都是值得深入研究的问题。现阶段,两个问题都已有同行在研究,并取得了一定的进展。但是,迄今为止,无论图像的美学质量评价还是情感信息识别任务,在科研界都被视作单独的任务分别进行研究。直观上,图像所表达的情感信息与图像的美学质量评价结果可能存在一定的联系。例如,让人感觉心情愉悦的图像,有较大的可能性被认为是美的。让人恐惧、厌恶的图像,被认为是美的可能性相对较小。客观上,已经有神经美学专家证明人类在做出美学判断和情感认知的时候,大脑的应激反应区域相同,这可从一个侧面表明图像所表达的情感信息与图像的美学质量之间存在一定的联系。由此,本研究工作起源于一个自然的思路:图像的美学质量评价和情感信息识别两个任务是相互关联的,且共享某些高层次特征,因此将两个问题联合建模研究可能同时提升两个任务的性能。本文首次利用多任务学习的方法同时去解决图像的美学质量评价和情感信息识别问题,并且将它们建模于同一个深度卷积神经网络框架中。具体来说,本文提出了一种新型的美学-情感多任务学习卷积神经网络(Aesthetics-Emotion hybrid Network,AENet)。与传统深度学习网络一样,AENet具有端到端学习的特点。因此,只需要给定模型任意输入图像,就可以同时得到其美学质量评价与情感信息识别结果。在这个模型中,任务自身相关的特征和任务间共享特征在网络的三路分支中分别提取,并经过特征融合单元进行融合和分离,形成新的特征图。紧接着,再经过多尺度池化综合单元的整合与归纳,网络将不同层次的特征分别用于提升图像美学质量评价和情感信息识别的准确率性能。另外,为支撑本文研究工作的顺利展开,针对当前科研界尚没有同时具有美学和情感标签的大规模图像数据集的现状,本研究还建立了当前第一个同时具有美学和情感标签的大规模图像数据集(Images with Tags of Aesthetics and Emotion,IAE),该数据集图像搜集于互联网图片搜索引擎Flickr和Instagram。本文利用众包技术标记数据,然后筛选可靠专家打分,使得该数据集具有数据分布合理、标签置信度高、类别均衡性强等优点。为验证本文所提出的AENet模型的性能,本文在所构建的大规模图像数据集IAE上开展了较为系统的实验:(1)与现有方法的对比实验结果表明,本文所提出的多任务模型在图像的美学质量评价和情感信息识别上的准确率性能可分别提高3%和4%,有效验证了将两者联合建模可同时提升两个任务性能的设想。对比实验由单任务和多任务两个部分构成,与单任务模型相比可以证明多任务思路的合理性和有效性,与多任务模型比较则可以证明本文AENet模型的创新性与优越性。(2)对AENet分别删除特征融合单元和多尺度局部池化单元,并与原有AENet的性能作对比,进行消融实验,验证了主要构件对AENet网络性能的贡献,使得网络架构能够更好地被其他学者进行可拆分地利用,并从侧面增强了实验结果的可靠性。(3)本文利用已经训练好的AE-Net模型分别在美学数据集AVA和CUHKPQ、情感数据集weakly-FI和ArtPhoto上进行了跨数据集的性能测试实验,实验结果表明了本文所提AENet模型具有较好的泛化能力,同时也从另一个角度证实了本文所构建的IAE数据集标签的置信度和可靠性。

其他文献

基于需求分析的本科拔尖创新人才英语课程模块的研究

近年来国家对于拔尖创新人才的培养越来越关注,《国家中长期教育改革和发展规划纲要(2010-2020年)》中明确要求:“遵循教育规律和人才成长规律,深化教育教学改革,创新教育教

学位

需求分析本科生拔尖创新人才英语课程模块

标准外伤大骨瓣并环池引流术治疗重型颅脑损伤一例报告

1 病例男，55岁、因车祸伤后意识不清3d，于2004年10月4日入院。入院后体格检查：昏迷，不睁眼，不发音，刺激肢体屈曲，GCS评分5分。双侧跟睑淤血，左外耳道有血性液体流出，光环试验阳性。左

期刊

重型颅脑损伤标准外伤大骨瓣引流术治疗环池GCS评分意识不清体格检查瞳孔直径脑挫裂伤

基于绘本教学的小学生英语高段阅读素养研究

提高中小学生的阅读能力,一直是教育改革以及当前学校教育的重要研究对象,但是近年来“阅读素养”这一观念逐渐代替了“阅读能力”。而绘本作为当今广受欢迎的一种补充教材的

学位

阅读素养英语绘本教学设计

高中数学人教版新旧教材比较研究

随着2019版教材在山东等地秋季入学时间陆续使用,如何把握此教材的变化及与旧教材之间的区别对于教师和学生是一个非常重要的问题,三角函数是高中知识体系中非常重要的组成部

学位

高中数学新旧教材三角函数比较研究

卢梭人民主权的理想图景与实现路径

卢梭的人民主权理论一方面需要从卢梭政治哲学的整个理论体系加以把握,另一方面还必须从《社会契约论》的内在论证逻辑中探寻。卢梭人民主权理论的起点是他在《论人类不平等

期刊

卢梭人民主权共和主义社会契约论共和国

一窍不通与愚不可及

一般认为,成语“一窍不通”出自《吕氏春秋·过理》:“纣性不仁,心不通,安于为恶,杀比干,故孔子言其一窍通则比干不见杀也。”这个词语似乎最早是用来骂商纣王的,其实不然。

期刊

宁武子

周作人论鲁迅“山灵的讽刺”

从周作人评价鲁迅《阿Q正传》所用＂山灵的讽刺＂这一概念入手,探讨其根源,指出周作人在定义鲁迅的写作特质时,除根据他们共同的阅读范围来确定鲁迅所受影响的来源外,主要依据了

期刊

灵的讽刺周作人鲁迅萨提儿反讽幽默

基于深度多任务学习的图像美感和情感联合感知研究

其他学术论文