论文部分内容阅读
                            
                            
                                视线追踪技术是采用机械、电子、光学和计算机等技术手段获取人的视觉注意方向的技术。广泛应用于人机交互、车辆辅助驾驶、军事、人因分析、疾病诊断等各个领域。视线追踪系统可以粗略地分为侵入式和非侵入式,又称穿戴式和遥测式。随着计算机技术、模式识别等相关技术领域的发展。利用数字视频分析的遥测式视线追踪技术得到了快速的发展。基于数字视频分析的视线追踪技术,通过摄像机摄取人脸图像,利用图像处理与分析方法提取人的眼部特征,获取与人的视线方向有关的参数。最后根据视线参数到视线方向或视线屏幕落点的模型获取空间视线方向或视线屏幕落点坐标。因此基于数字视频分析的视线追踪技术主要有两部分组成,即人眼特征检测及视线参数提取、和视线参数到视线方向模型建立。本文采用单摄像机构成视线追踪系统,对视线追踪的关键技术进行了研究。根据上述视线追踪技术的构成,本文对的研究工作分为四个部分:人脸和人眼定位、人眼特征参数检测、视线参数到视线屏幕落点的映射模型建立、头动状态下的视线落点补偿。本文还对视线追踪技术在车辆辅助驾驶中的应用进行了探讨。具体工作和创新点如下:在人脸和人眼定位阶段,首先采用基于肤色模型和Adaboost方法相结合的方法定位人脸。肤色模型在背景和目标区别明显的情况下,检测效果较好且检测速度快,对人脸姿态不敏感,但误检率较高;Adaboost方法针对正面人脸定位检测率高,而且误检率低,但不适于多姿态的人脸检测。本文结合两者的优点,通过将图像按一定角度旋转来检测各个角度的人脸,从而实现多姿态人脸定位并提高了检测速度。定位人脸后,在人脸区域,根据人脸五官分布的先验知识,可以确定人眼的潜在区域,然后在人眼的潜在区域范围内,再采用Adaboost方法定位人眼。定位人眼区域后,就得到了虹膜的扩展区域。接下来就在此区域进行人眼特征检测,进而提取人眼视线参数,即虹膜中心到眼角的矢量。得到图像视线参数以后,需要建立视线参数到视线屏幕落点的非线性映射模型。目前的映射模型一般是采用非线性多项式映射模型描述视线参数到视线屏幕落点之间的对应关系。映射模型的参数是通过在屏幕上设置标定点,对多项式模型参数进行标定得到的。与多项式模型不同,本文利用极限学习机(ELM)所具有的适合多分类、速度快和泛化能力强的特点,提出了一种基于ELM的视线追踪视线落点估计方法,将提取的视线特征参数作为输入,视线在屏幕上的落点作为输出,将非线性多项式作为激活函数,通过初始标定获取ELM训练数据,建立视线特征参数和视线屏幕落点之间的映射模型。实验结果表明,基于ELM的视线落点估计方法在标定点处无论视线落点精度还是稳定性均优于传统的非线性多项式拟合方法,特别适合于需要稳定判断视线落点的应用场合,为单摄像机视线追踪系统从视线参数到视线屏幕落点的映射提供了一种新思路。目前的视线追踪方法,特别是基于单摄像机的视线追踪系统,都是在头部静止的情况下,对视线参数到视线屏幕落点之间的映射模型进行标定,因此往往在头部静止且与计算机屏幕保持一定距离的情况下效果较好。但是当头部位置发生变化时,通过标定获得的视线落点映射模型将不再适用,不能准确估计视线方向。本文基于单摄像机无光源视线追踪系统,通过摄像机模型和坐标变换,提出了一种平移头动下的视线落点补偿方法,实验结果表明,本文方法效果很好,具有实际应用价值。这种视线落点的补偿方法也可以应用在其它类型的单摄像机视线追踪系统中。