【摘 要】
:
虚拟社交空间中的Avatar面部表情是传递人类情感和方便有效社交体验的关键技术,是计算机视觉和图形学领域的热点研究课题,是未来社交方式的重要演变,同时基于普通摄像头的人脸表情跟踪和动画技术在影视表演、游戏动画以及网络通信行业具有重要的意义。本文主要针对商业虚拟社交系统中缺乏可行的同步面部表情解决方案,实现了完整的基于面部表情跟踪和动画技术的虚拟社交系统,围绕人脸表情建模、表情编码技术、表情跟踪和动
论文部分内容阅读
虚拟社交空间中的Avatar面部表情是传递人类情感和方便有效社交体验的关键技术,是计算机视觉和图形学领域的热点研究课题,是未来社交方式的重要演变,同时基于普通摄像头的人脸表情跟踪和动画技术在影视表演、游戏动画以及网络通信行业具有重要的意义。本文主要针对商业虚拟社交系统中缺乏可行的同步面部表情解决方案,实现了完整的基于面部表情跟踪和动画技术的虚拟社交系统,围绕人脸表情建模、表情编码技术、表情跟踪和动画技术、声画同步等关键技术进行深入研究,并取得如下研究成果:(1)利用FACS(Facial Action Coding System)将复杂的人脸表情分解成相互正交的属性,利用多变量线性回归算法将所有人脸属性映射到人脸双线行模型中,分别为identity和expression属性,并借助Kinect捕获的深度数据图来调整中性面部表情网格模型,生成51个标准化的人脸表情模型。(2)采用级联姿态回归算法训练动态表情模型,从实时输入的2D视频中推断面部表情系数,利用监督下降法代替二维级联姿态回归方法,实时提取动态表情模型回归器中的面部特征点,从而在面部表情捕捉和表情动画效果中实现更好的鲁棒性和容错性。(3)提出多尺度自适应表情编码技术,利用时间戳和自适应调整的动态循环队列技术,实现表情动画和语音数据的实时声画同步,并利用Qo S反馈机制来监测复杂网络条件下的变化,来保障在各种复杂网络情况下实现面部表情的实时性和面部表情动画丰富性之间的平衡。我们提出的动态表情技术,无需任何匹配校准特定用户的预处理操作,实时捕捉用户面部表情并在虚拟角色Avatar上重演,相比于传统的基于级联姿态回归的动态表情技术,算法具有更好的鲁棒性和容错性,能被广泛部署于消费级应用。实验结果表明,我们所提出的面部表情跟踪和动画系统实用可行,能够精确地捕捉用户的面部表情信息,并抽象描述为能在不同虚拟角色上重演动画效果的表情系数,而多尺度自适应表情编码技术可以很好地应对复杂网络环境下的变化,在虚拟社交系统中产生高度真实的情感线索。
其他文献
家族企业是最为古老最为普遍一种组织形式,遍布整个世界,其在世界各国或地区的经济发展中起到了不可或缺的作用。家族企业之所以与普通的企业形式不同,就是因为家族企业中包含有家族的因素,即家族内的人财力等有形资源以及社会关系都无形资源,都会通过一定的方式影响到家族企业内的决策。因此对家族企业的研究,绝不能脱离开家族而单单对家族企业方面进行研究。而是要关注家族在家族企业中发挥的作用等。家族氛围是家族中很重要
列廷冈-勒青拉矿床位于冈底斯北缘Pb-Zn-Fe-Cu-Mo多金属成矿带东侧,是该带上一个独特的同时发育Pb、Zn、Fe、Cu、Mo五种元素矿化的典型矽卡岩型多金属矿床。矿床在空间上具有一定蚀变矿化分带特征,Fe-Cu-Mo矿体主要发育在与成矿岩体和蒙拉组二段灰岩接触带位置,呈半环状围绕成矿岩体分布,受接触构造控制,矿体形态呈透镜状、囊状、不规则状,发育的蚀变矿物为钙铝榴石和少量钙铁榴石、铁普通辉
科普文体是一种以通俗易懂的语言向非专业领域的读者普及科学知识的重要文体形式。而隐喻不仅是人类认识世界的一种认知方式,而且是一种生动形象的修辞手段。因此,隐喻是科普
本文基于翻译对等理论,以科普著作《世界真奇妙:大千世界,无奇不有》(What a Wonderful World:One Man’s Attempt to Explain the Big Stuff)第12、13、14章节的汉译为个案,
高校本科教学工作审核评估自评报告是了解高校在过去五年的工作成绩、发展现状与存在问题,以及应对问题所采取的具体措施的重要手段之一。在当今高等教育国际化的大背景下,国内外大学之间的交流与合作不断加强。高校本科教学工作审核评估自评报告的英译有助于外籍评估专家了解中国高校近年来的发展,并且通过评估与交流,加深对国内高校的了解,在推动高校国际交流与合作上发挥着重要作用。本文是基于《西南交通大学本科教学工作审
深度数据是自然场景的基础表征之一,也是机器理解自然场景的重要信息,在三维重建,机器人,自动驾驶和3DTV等领域被广泛的应用。然而,受限于深度相机的硬件工艺和自然场景的复杂多变,由深度相机所捕获到的深度图像分辨率较低,且含有噪音。这些低分辨率,含有噪音的低质量深度图像无法直接应用于相关领域,因此,如何利用图像上采样方法从低质量的原始深度图像中恢复出高质量的深度图像具有很强的现实意义。深度图像上采样的
图像模糊的种类繁多,成因来源广泛,本课题主要针对运动平台拍摄的视频图像进行去模糊算法的研究。文章首先介绍了图像去模糊的一些理论知识,分析了图像产生运动模糊的成因,并
随着国际贸易以及香港经济的快速发展,港币的安全流通和机读识别变得尤为重要。由于港币发行银行不唯一、发行周期短且面额较多,导致港币版本种类较多。且不同版本的识别特征、冠字号等差异性很大,会给港币的机读识别带来许多困难。并且港币使用过程中存在污迹、磨损、老化等因素影响图像质量,使现有机读识别算法面临很大挑战,误识率较高。针对上述问题,本文采用多光谱中的红外光谱,对港币进行清晰的红外成像,对港币的面额、
随着多媒体技术的发展,数字图像以其便于传输与保存逐渐融入人们的日常生活中,成为人类信息获取的重要来源,视频监控系统也得到了广泛的应用。监控图像一般会通过采集、压缩
本文主要研究一个重要的孤子方程即Boussinesq型方程的N次Darboux变换及其精确解。文章共分三部分。第一部分是引言,主要介绍了Darboux变换的基本理论。第二部分讨论联系Broe