基于级联结构的人脸检测若干方法研究

来源 :东南大学 | 被引量 : 1次 | 上传用户:svsehwx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸检测是人脸分析的首要阶段,目的是确认输入图像中是否存在人脸,若存在则输出人脸位置、大小等信息。在实际应用中,人脸在不可控情况下的成像可能会受到各种因素的影响,例如:遮挡较大、光照不均、姿态表情不一、像素低等,再加上背景的复杂性,这些都会对人脸检测的精度和速度带来较高的挑战,也使得人脸检测一直是机器视觉中的主要研究课题之一。  在2001年,Viola和Jones曾提出了一个经典的解决方案,使得在低计算复杂度下快速实时的检测正面人脸成为了可能,因此该框架后来依然被持续改进和大规模使用,但该类方法大多依赖经验积累,训练成本较大。随着卷积神经网络应用的深入,图像特征的表达能力得到提升,基于该网络的算法普遍可以取得较好的检测结果。本文主要基于经典算法中的级联设计思想,提出判别投影Haar-like特征,采用改进的级联结构训练Adaboost人脸分类器;同时基于级联结构的人脸检测算法,提出了一种卷积神经网络,在公开人脸数据集上对比了算法效果,具有一定性能优势。论文主要工作如下:  (1)总结目前人脸检测的发展现状,分析了现阶段人脸检测所面临的挑战,阐述了相关问题的解决方案,介绍了常用的人脸检测数据库,对生成候选框质量、重叠面积、召回率和精确率等评估指标进行了详细解释。  (2)从人脸检测系统设计的两个重要组成部分着手,详细研究并实现了几种经典的人脸特征提取和分类器框架。基于人脸的聚合通道特征,利用Fisher判别分析提出一种判别投影Haar-like特征,对图像的通道特征进行拓展,采用改进的级联结构Soft Cascade训练Adaboost分类器。训练过程中,利用通道特征空间中的人脸结构信息对正负样本分类训练,增强人脸特征的判别能力,在FDDB上与其他方法进行了结果对比,提高了原来的检测率。  (3)对基于卷积神经网络的人脸检测经典框架进行了详细研究,设计了一个卷积神经网络结构。该结构共分为两个阶段,第一个阶段利用低像素的候选窗口输入浅层卷积神经网络,快速排除大量背景窗口;第二个阶段将通过第一阶段的候选窗口,调整成两个较高像素的图像分别对应输入两个卷积神经网络分支,目标输出是否为人脸的概率和边界框回归向量。训练过程中,针对困难样本,进行在线训练,采用软-非极大值抑制算法对数据集进行多尺度测试,在PASCAL FACE和FDDB两个人脸数据集上与其他方法进行结果对比,具有较好的检测效果。
其他文献
体育高等职业院校青年教师专业能力强,具备吃苦耐劳精神,但是文化基础薄弱,思想政治意识较为淡薄。受社会价值观的多元化、外来不良思潮的影响,他们在思想认识上模糊,政治立
随着社会的发展和人们生活水平的不断提高,越来越多的人拥有私家车,许多人偏爱在节假日驾车远行。在陌生的环境中,引导驾驶者走上正确的道路,少走弯路就变得很重要。同时,随
随着高层建筑物的日益增多,电梯群在高层建筑和智能大厦中的作用越来越重要,电梯群控系统已经称为国内外研究的热点。本文的目的是根据电梯群控的理论和研究焦点,应用合适的
“真善语文”包括两层含义:第一层,小学生是小学语文的学习主体,富有人最原始、高贵的本色,即真善的品质特点.第二层,“真善语文”基于“三维目标”,体现新课改求真求善的核
阿尔茨海默病(AD)是一种神经退行性疾病,主要影响记忆、认知和行为.其主要病理特点是脑内细胞外β淀粉样蛋白(Aβ)聚集成老年斑(senile plaques,SPs)、细胞内Tau蛋白过度磷酸
中央提出,新闻报道要贴近群众、贴近实际、贴近生活,这是办好党报的根本出路。如何做到“三贴近”呢?笔者以为必须抓住四点,即找准读者的视点,关注社会的热点,发现会议的亮点
近年来,中小学校的心理健康教育有所发展,但是还存在很多问题.问题主要表现在两个方面:首先是心理健康教育课程方面的问题,主要是课程安排的时间少,学校不重视,基础设施配备
象棋既是一种博大精深、源远流长的文化艺术,又是一种大众喜闻乐见、适合普及的益智游戏。“棋道”即人道,象棋中“方”的规矩不变和“圆”的千变万化,蕴含着无穷的做人的道
初中思想品德学科由道德、心理、法律和国情四大模块构成,四大模块内容相互交叉、彼此渗透,道德教育贯穿其中.道德和法律相互促进,但两者又会分离甚至发生冲突和矛盾,这是不
他,曾是一名军人,在全军英模表彰大会上,受到过邓小平等党和国家领导人的亲切接见;他,是一名优秀的共产党员,在国家危难、忠孝不能两全之时,舍小家顾大家无私奉献;他,是一名