知识与数据共同驱动的面部行为分析与人脸卡通画合成

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:chchchop
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文的主要研究内容是利用领域相关的先验知识解决在数据标注不足时模型的训练问题,以及利用先验知识解决不同风格图像的匹配问题。对人脸面部行为分析和人脸卡通画合成两个问题进行研究,并将领域相关的先验知识用于模型的学习以提升模型的效果。本文的贡献包括如下几个方面:  1.基于双向有序多示例回归模型的人脸面部动作单元强度估计。提出利用弱标注视频数据训练单帧动作强度回归模型。每个视频段只需标注首尾帧的动作单元强度,这样可以减少标注成本。从一个新视角看待动作单元的强度估计,并将动作强度估计建模为一个多示例回归问题。与以往方法不同,不仅引入“相关性”的概念,即每帧图像有分别相对于首帧标注和尾帧标注的相关程度值,而且提出每个袋拥有两个袋标注的多示例回归模型。通过先验信息建立已标注图像和未标注图像之间的关系,并提供弱监督信息以辅助模型的学习,从而缓解模型对有限标注的过拟合。先验知识包括动作单元强度的平滑性、相关程度的有序性和相关程度的平滑性。  2.基于表征和回归模型联合学习的人脸面部动作单元强度估计。模型预测的准确度取决于图像的特征、图像标注和模型的参数。以往的强度估计方法分别进行特征学习和模型的学习。然而,学到的特征对于模型参数的学习可能并不是最优的。另外,监督学习需要较多的标注,且动作单元强度的标注需要较强的领域知识,标注困难且成本较高。提出一个统一的框架,不仅可以嵌入多种不同类型的先验知识,而且能在少量的标注的情况下联合学习图像特征和模型参数。先验知识包括特征的平滑性、强度的平滑性、强度的时序有序性和强度的非负性。先验知识可分为硬约束和软约束。硬约束作为优化问题的约束,软约束作为目标函数中的正则项。基于交替方向乘子法优化框架设计一种有效的优化算法求解建立的模型。  3.基于弱监督深度卷积神经网络的人脸面部动作单元强度估计。提出一种基于知识的弱监督深度学习方法用于动作强度估计。该方法只需要极少量的标注数据进行模型学习。视频数据中只需要标注强度的峰值和谷值的位置,以及它们的动作单元强度值。为了提供弱监督信息,提取多种类型的先验信息,包括特征的相对相似性、强度的时序有序性、人脸对称性和与无表情脸的差异性。基于五元组为各种先验知识设计可导的损失函数,以利用多帧图像间的更高阶的相关关系,而不是用单帧图像进行模型训练。  4.基于先验概率的面部动作单元分类器学习。提出一种使用先验概率来训练动作单元分类器的方法。该方法不需要任何动作单元的标注,只需要表情标注。表情标注相对于动作单元的标注更加容易获得。根据人脸解剖学和情感研究系统地提取与动作单元相关的先验概率,包括与表情相关和与表情无关的动作单元之间的关系。为不同类型的先验概率定义不同的损失函数,并建立标注和模型联合学习的模型。基于交替优化框架,提出优化算法迭代学习标注和模型参数。  5.数据与先验知识共同驱动的人脸卡通画合成。提出一个多种风格人脸卡通画的自动生成系统,包括人脸解析、卡通器官的选择和卡通人脸的合成。给定一张人脸图像,生成的卡通画不仅要保持与原人脸的相似性,而且具备美观性。由于真实人脸和卡通人脸在不同的空间,直接利用纹理等特征度量相似性会导致图像匹配结果较差。另外,卡通画的美观性难以直接量化。利用先验知识,即人对不同空间的图像相似性的认知和人对美观的认知,为上述问题提供一种解决方案。将先验知识以数据标注的方式嵌入到数据集中,从而将直接匹配困难的问题转化为容易进行的间接匹配,而且从标注的数据中学习一个分布用于描述卡通人脸的美观性。
其他文献
无线通讯技术进入工业行业的趋势已经无可置疑,诸多现场仪表已经慢慢开始无线化。在无线压力变送器中,无线短程通讯技术被引入到工业压力检测技术中,实现了工业现场压力采集仪表
能源是人类赖以生存和发展的物质基础。然而,随着全球能源形势日趋紧张,能源供需失衡的状况日趋严重。能源供需预测作为一类复杂系统,其复杂性主要体现在涌现性上,很难用传统方法
随着能源紧张和环境污染的日益加剧,太阳能凭借其独特的优势受到人们的高度重视,并网逆变器是太阳能发电系统中的关键设备,本文对基于单周控制的光伏并网逆变器进行了研究。
催化裂化装置是炼厂中最复杂、最重要的一个系统,主要由反应一再生系统、分馏系统和吸收稳定系统三部分组成。其中,分馏系统作为承上启下的关键环节,其分馏效果对石油产品的质量
随着机器人技术的发展,在配电线路中采用机器人代替人工进行更换跌落熔断器,拆、接引流线等作业已成为一种趋势。机器人工作在室外非结构化的环境下,采集的图像受天气、光照等因
随着全球化进程的加快,人际交往与信息交流中因为语言分歧带来的阻碍日益突出,克服语言障碍的问题就显得愈发重要,而利用计算机技术实现不同语言之间的自动化翻译,是解决这一问题
语音是人与机器最自然的交互方式之一,被普遍视为最有可能成为下一代信息和服务的入口。听觉信息处理是人工智能感知的重要组成部分,是目前最接近实用突破的研究方向,然而,在真实
自适应滤波器实际上是能够自动调节其本身的加权系数w,以最小均方为准则的最佳滤波器。它不要求预先知道信号与噪声的自相关系数,而且在信号与噪声的自相函数即使随时间做慢变
未知环境下的移动机器人自主导航控制是智能机器人技术领域的一个重要研究课题。本文主要从自主导航控制的体系结构、局部环境认知、基本行为设计与优化、行为协调机制、局部
本文通过对准同期并网条件进行理论分析,提出自动准同期跟踪控制方案,根据准同期相关原理确定了电量参数差值检测计算方法、装置设计的合闸信号判定方法。提出频率差和相角差并