基于深度多任务学习的图像美感和情感联合感知研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:huanying19870604
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年,随着深度学习技术的普遍运用,图像处理与分析的研究工作取得了巨大成功。在以车牌号码识别、人脸识别、单目标检测等为代表的图像分类、目标检测等应用领域,取得的进展可谓是突破性的。然而,在对图像更高层次的抽象理解上,仍面临着严峻的挑战。典型地,例如图像的美学质量评价(美、不美)和图像的情感信息识别(快乐、愤怒、恐惧、悲伤等),都是值得深入研究的问题。现阶段,两个问题都已有同行在研究,并取得了一定的进展。但是,迄今为止,无论图像的美学质量评价还是情感信息识别任务,在科研界都被视作单独的任务分别进行研究。直观上,图像所表达的情感信息与图像的美学质量评价结果可能存在一定的联系。例如,让人感觉心情愉悦的图像,有较大的可能性被认为是美的。让人恐惧、厌恶的图像,被认为是美的可能性相对较小。客观上,已经有神经美学专家证明人类在做出美学判断和情感认知的时候,大脑的应激反应区域相同,这可从一个侧面表明图像所表达的情感信息与图像的美学质量之间存在一定的联系。由此,本研究工作起源于一个自然的思路:图像的美学质量评价和情感信息识别两个任务是相互关联的,且共享某些高层次特征,因此将两个问题联合建模研究可能同时提升两个任务的性能。本文首次利用多任务学习的方法同时去解决图像的美学质量评价和情感信息识别问题,并且将它们建模于同一个深度卷积神经网络框架中。具体来说,本文提出了一种新型的美学-情感多任务学习卷积神经网络(Aesthetics-Emotion hybrid Network,AENet)。与传统深度学习网络一样,AENet具有端到端学习的特点。因此,只需要给定模型任意输入图像,就可以同时得到其美学质量评价与情感信息识别结果。在这个模型中,任务自身相关的特征和任务间共享特征在网络的三路分支中分别提取,并经过特征融合单元进行融合和分离,形成新的特征图。紧接着,再经过多尺度池化综合单元的整合与归纳,网络将不同层次的特征分别用于提升图像美学质量评价和情感信息识别的准确率性能。另外,为支撑本文研究工作的顺利展开,针对当前科研界尚没有同时具有美学和情感标签的大规模图像数据集的现状,本研究还建立了当前第一个同时具有美学和情感标签的大规模图像数据集(Images with Tags of Aesthetics and Emotion,IAE),该数据集图像搜集于互联网图片搜索引擎Flickr和Instagram。本文利用众包技术标记数据,然后筛选可靠专家打分,使得该数据集具有数据分布合理、标签置信度高、类别均衡性强等优点。为验证本文所提出的AENet模型的性能,本文在所构建的大规模图像数据集IAE上开展了较为系统的实验:(1)与现有方法的对比实验结果表明,本文所提出的多任务模型在图像的美学质量评价和情感信息识别上的准确率性能可分别提高3%和4%,有效验证了将两者联合建模可同时提升两个任务性能的设想。对比实验由单任务和多任务两个部分构成,与单任务模型相比可以证明多任务思路的合理性和有效性,与多任务模型比较则可以证明本文AENet模型的创新性与优越性。(2)对AENet分别删除特征融合单元和多尺度局部池化单元,并与原有AENet的性能作对比,进行消融实验,验证了主要构件对AENet网络性能的贡献,使得网络架构能够更好地被其他学者进行可拆分地利用,并从侧面增强了实验结果的可靠性。(3)本文利用已经训练好的AE-Net模型分别在美学数据集AVA和CUHKPQ、情感数据集weakly-FI和ArtPhoto上进行了跨数据集的性能测试实验,实验结果表明了本文所提AENet模型具有较好的泛化能力,同时也从另一个角度证实了本文所构建的IAE数据集标签的置信度和可靠性。
其他文献
近年来国家对于拔尖创新人才的培养越来越关注,《国家中长期教育改革和发展规划纲要(2010-2020年)》中明确要求:“遵循教育规律和人才成长规律,深化教育教学改革,创新教育教
1 病例 男,55岁、因车祸伤后意识不清3d,于2004年10月4日入院。入院后体格检查:昏迷,不睁眼,不发音,刺激肢体屈曲,GCS评分5分。双侧跟睑淤血,左外耳道有血性液体流出,光环试验阳性。左
提高中小学生的阅读能力,一直是教育改革以及当前学校教育的重要研究对象,但是近年来“阅读素养”这一观念逐渐代替了“阅读能力”。而绘本作为当今广受欢迎的一种补充教材的
随着2019版教材在山东等地秋季入学时间陆续使用,如何把握此教材的变化及与旧教材之间的区别对于教师和学生是一个非常重要的问题,三角函数是高中知识体系中非常重要的组成部
卢梭的人民主权理论一方面需要从卢梭政治哲学的整个理论体系加以把握,另一方面还必须从《社会契约论》的内在论证逻辑中探寻。卢梭人民主权理论的起点是他在《论人类不平等
一般认为,成语“一窍不通”出自《吕氏春秋·过理》:“纣性不仁,心不通,安于为恶,杀比干,故孔子言其一窍通则比干不见杀也。”这个词语似乎最早是用来骂商纣王的,其实不然。
期刊
从周作人评价鲁迅《阿Q正传》所用"山灵的讽刺"这一概念入手,探讨其根源,指出周作人在定义鲁迅的写作特质时,除根据他们共同的阅读范围来确定鲁迅所受影响的来源外,主要依据了