粒子滤波算法在手语合成中的研究

来源 :东方教育 | 被引量 : 0次 | 上传用户：funfzitm

【摘要】

：

【作者】

：

卢荣

【出处】

：

东方教育

【发表日期】

：

2013年11期

【关键词】

：

手语合成1 虚拟人合成2 关键点3 粒子滤波算法4

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　【摘要】手语合成是为了有助于聋哑人和听力正常人自然交流以及计算机辅助教学。通过分析手语特点，通过粒子滤波算法手语手势进行跟踪，通过跟踪结果进行有效的判断，判断出视频中的手语词与手语词之间的过渡帧，从而推动了对手语动画合成的研究和实现。
　　【关键词】手语合成1；虚拟人合成2；关键点3；粒子滤波算法4
　　0引言：
　　作为听障人士社交所用的手语是一种人体运动语言，通过手型辅之以面部表情和姿势构成一个稳定的表达系统。手语合成[1]就是要将自然语言文本句子，通过机器自动翻译成聋人手语，并由计算机自动生成虚拟人动画来逼真的表示出来。手语动作的研究是作为手语合成的研究的前提，首先构造人体二维骨骼模型，在此基础上作出了聋哑人手语关键动作可能手势和不可能手势的跟踪判断，在可能手势情况下实现虚拟人连续手势的变换，逼真的完成手语动作表达。
　　1 手语合成的相关方法和技术
　　1.1人体轮廓模型
　　人体轮廓模型[2]是将人体用一组由关节所连接的平面区域块来表现。手语主要研究手及手臂并建立其运动控制模型，手及手臂之间包含肩、肘、腕、手指四大类的关节点。由控制点、线、体来显示人体运动，并显示出控制点模型，进而得出线型，直至二维人体模型。
　　1.2 手势跟踪
　　1.2.1 基本思想
　　虚拟人手语是由一些单位手语词拼接而成的动画，在相邻手语词以及同一个手语词中不同词根之间若不作处理会，手在相邻词根衔接处动作变化幅度大，因此我们需要在衔接处插补一定数量的关键帧。因此对采集的手语视频进行手语词的关键帧跟踪，由跟踪结果对关键帧进行判断，是保证手语合成的前提。
　　1.3 粒子滤波算法概述
　　粒子滤波[3]通过随机样本的概率的分布，是由贝叶斯滤波器演变，并结合蒙特卡罗方法得出的一种实时推理算法。
　　粒子滤波算法具有卡尔曼滤波所没有的算法收敛，且计算误差小，其通过非参数化的蒙特卡罗方法实现贝叶斯滤波，用非函数形式的样本形式进行先验和后验信息的概率表述。当样本点迅速增至无穷大的时候，后验概率密度的函数形式等价于蒙特卡罗模拟特性，滤波精度可达最优。其非高斯、非线性及多模的特点，可有效预测人体位置信息。在人体运动多关节点跟踪下，可用加权粒子滤波[4]来精简计算。
　　1.4 算法描述
　　基于粒子滤波算法的人体动关节点跟踪的流程如1.1图所示：
　　图1.1 基于人体轮廓模型实现人体关键点跟踪的流程图
　　（1）视频第一帧的初始化
　　视频的第一帧要进行手动标注人的肘、腕、手部中心点等坐标，对粒子采样的数量由实验而定。
　　（2）状态转移
　　状态转移即粒子传播的先验概率过程，其中xt为目标在t时刻的状态，wt-1是归一化噪声量，A和B是常数：
　　（1.1）
　　（3）系统观测
　　对当前预测模型中的每一个状态向量的外观模型与当前图像帧的相应区域进行相似性计算，并给每一个状态向量赋一个权值。
　　首先将相邻关节点中任意两个粒子所处的矩形区域的颜色直方图与手工标注的第一帧的模板区域颜色直方图进行匹配比较，通过相似度计量函数得出该关节点的权值Wki。
　　图1.2 观测点的生成
　　再将相邻关节点的粒子的距离与初始帧关节长度进行比较，并计算出权值Nki。对这两个权值进行加权计算，得到第k个关节点的粒子i在此时刻的权值：
　　（1.2）
　　最后把所有的粒子权值进行归一化操作：
　　（1.3）
　　（4）跟踪结果
　　相应关节点中所有粒子的加权均值为关节点的最终状态，即通過预测得到t时刻第k个关键点的坐标。
　　（1.4）
　　当完成当前帧的跟踪计算后，对当前帧的后验模型进行同样的采样，得到t+1时刻的先验模型。依次类推直至最后一帧，完成了整个视频的跟踪。
　　2 系统设计与实现
　　2.1手语合成系统的框架
　　系统的主体框架如下图所示
　　图2.1 手语合成系统的主体框架
　　3 手语合成的关键技术
　　手语合成系统主要由以下四点所确立：
　　（1）通过数据手套等硬件设备实时采集足够详细的手语动作信息。
　　（2）根据关节点跟踪的原始数据计算出人体上肢关节的位置和关节点在相对坐标系中的旋转角度。
　　（3）将关节角度数据按照不同的关节形成运动曲线，从中提取能够代表动作的关键帧数据。
　　（4）插入关键帧数据实现3D虚拟人动画的自动生成。
　　4 结语
　　基于的粒子滤波算法的手势跟踪是进行手语合成的前提，通过手势跟踪有效的判断手语词与手语词之间的转折，并进行关键帧的插补，从而使虚拟人的手语表达更加逼真，实现合成手势运动的均匀平滑过度。
　　参考文献：
　　[1]郑重雨.基于运动特征的手语动画关键帧调整和插值方法的研究[D].北京：北京工业大学，2009.
　　[2]孙怡，王恩亮，安宏杰等.基于2-D模型的人体运动跟踪[J]，中国图像图形学报，2002，7（7）：625-632
　　[3]胡士强，敬忠良.粒子滤波算法综述[J].控制与决策，2005，20（4）：362—371
　　[4]蒋恋华.基于粒子滤波的多目标跟踪算法的研究[D].武汉：武汉科技大学，2011

其他文献

水库除险加固设计中遇到的问题分析与思考

现阶段水利工程中的水库除险加固设计工作是能够延长水库质量与寿命的一项关键性的措施,为水库和水利工程所在地的经济有序发展做出了非常重要的贡献,因此在本文中的以下内容

期刊

水库除险加固使用寿命设计问题解决措施

妇产科失血性休克的抢救

【摘要】目的通过实例总结说明妇产科失血性休克的抢救策略与抢救工作管理。方法将本院2008年1月到2013年7月间发生的30起妇产科失血休克手术的抢救措施进行总结，分析抢救措施中的工作管理与时间管理。结果在针对妇产科失血休克的抢救之后，所有的患者都得到救治，无一例死亡案例发生。在30起案例中，有28例经过抢救后关于身体的体征表现正常，另有2例在经过抢救后生命体征未有明显的恢复，转三甲医院在重

期刊

失血性休克妇科抢救

浅析文学作品《The Great Gatsby》的现实意义--从“美国梦”与“中国梦”说起

本文通过研究文学作品《The Great Gatsby》的现实意义，对比分析了“美国梦”与“中国梦”的异同。一方面，揭示了“美国梦”必将破灭的现实，讴歌了“中国梦”的升华。另一方面，通

期刊

The Great Gatsby美国梦中国梦

从汉字浅析古代伦理文化

通过对一些汉字字形的分析，揭露了中国古代的家庭伦理文化以及女性在古代社会中地位的变化。

期刊

汉字家庭女性伦理文化

生态翻译学视角下《汤姆?索亚历险记》两个中译本之比较研究

《汤姆索亚历险记》是经典儿童文学代表作之一，本文从胡庚申教授的生态翻译学视角，对两位译者在处理译本时的不同选择适应度做了对比分析，旨在说明，在翻译儿童文学时，要多维适应翻

期刊

生态翻译学翻译生态环境的要素《汤姆?索亚历险记》

输出驱动与独立学院大学英语课堂教学模式改革

独立学院大学英语教学虽然也经历了十几年的磨砺，但无论在教学理念和教学模式上都有待商榷和探讨。输出驱动模式，从一个崭新的的视角，给教学一线的教师提供了一个课堂教学的改革

期刊

独立学院输出驱动教学改革

政法类高职院校特色校园文化建设研究

【摘要】校园文化对高校改革发展和学生全面成长成才有非常重要的作用。本文深入分析高职院校的校园文化建设，提出突出物质文化建设和实用主义、文化建设单一、文化底蕴不足、缺乏院校特色等诸多问题。并针对政法类高职院校的特殊性，提出完善“全方位”高职院校校园文化建设体系、构建深厚文化底蕴为基础的职业教育体系、根植学校发展挖掘特色校园文化等建设重点。　　【关键词】高职；政法；校园文化　　高校的校园文化是社会主义

期刊

高职政法校园文化

论琼剧服饰与宗教服饰的关系

本文首先从文化融合的视角对海南文化与宗教文化的水乳交融与异源同流进行了阐述与分析，并由文化的交融进而述及文化与服饰的关系问题，在兼论世界文化与服饰的基础之上着重论述

期刊

琼剧服饰宗教服饰海南斋戏关系

基于Canny算子的彩色图像边缘检测算法

【摘要】本文将Canny算子应用于彩色图像，针对单尺度滤波器的缺点，本文采用改进的多尺度滤波器对彩色图像进行平滑。通过实验证明，本文所采取的彩色图像边缘检测方法对噪声有很好的抑制作用，并且能够提取比较完整的图像边缘，是一种有效的检测方法。　　【关键词】彩色图像；Canny算子；多尺度高斯滤波器　　1、引言　　边缘检测是图像处理中最基础也是最重要的部分。其中有关灰度边缘检测的算子众多，有Sobel、

期刊

彩色图像Canny算子多尺度高斯滤波器

从社会地位视角谈《镜花缘》中谦敬语的使用

谦敬语作为礼貌用语，可以用来谦称自己、敬称他人。涉及社会地位的官职大小、辈分高低、年龄大小、性别等因素影响《镜花缘》中谦敬语的使用与选择。权势--同等关系理论对谦敬

期刊

社会地位权势--同等关系谦敬语制约表现

粒子滤波算法在手语合成中的研究

其他学术论文