基于NMF和BP神经网络的人脸识别

来源 :商 | 被引量 : 0次 | 上传用户:wxj1234567
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:人脸自动识别是图像识别[1]领域的一个研究热点,有着广泛的应用前景。对于静态人脸识别问题,BP神经网络方法有较强的适应性和易于实现等优点。但采用BP神经网络进行人脸识别也存在学习时间长,识别率不高等缺点。本文根据BP神经网络的基本原理,自行设计了一个简单且易于实现的BP神经网络,该网络在训练样本数较为充足并且学习较为充分的条件下能获得较好的人脸识别效果。并在此基础上,通过对原样本数据进行NMF特征提取操作,再结合该BP网络用于人脸识别。该网络克服了单一BP神经网络学习时间长、识别效率低的缺点,获得了更加有效的识别效果。
  关键词:BP神经网络;NMF;人脸识别
  一、BP神经网络
  BP(Back Propagation)是一种按误差反向传播算法训练的多层前馈网络。它的学习规则是使用梯度下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。BP神经网络模型拓扑结构包括输入层、隐含层和输出层。本文BP神经网路根据样本数据维数大小,预先随机设定各网络层权值、阈值向量。根据输入的样本数据,计算输出层和隐含层的误差项,再根据误差项反向调节各层的网络权值和阈值。根据设定的迭代运算次数终止BP神经网络的学习。本文自行设计的BP神经网络也共分为3层,并根据单个样本数据的大小,设定BP网络输入层节点数。由于该BP网络只被用于判断4个不同的人脸,所以该网络的输出层节点数设为4个。
  下面具体介绍该BP网络识别人脸的实现过程。本试验使用的数据是来自CMU_PIE人脸数据库,取其中4个不同的人,每个人有170幅神情、光照、拍照角度等不同的人脸图像。将这不同的170幅人脸样本分成训练样本和测试样本,训练样本数和测试样本数均比较充裕。而BP神经网络正需要较为充足的样本数据进行训练才会获得不错的学习效果,同时也只有对较多的测试样本进行识别,这种识别结果才具有一定的说服力。其次是要对试验数据进行预处理,将不同的四个人脸图像添加标签,即给四个不同的人取名,方便后面的学习和最后的识别。取每人170幅人脸图像中的90幅作为训练数据,剩下的80幅作为测试数据。需要重点说明的是如何将这360个人脸矩阵输入到BP网络并依此迭代学习。首先我们要将所有样本数据按顺序读入到一个矩阵中,将每一个样本矩阵首尾相连,变成新矩阵B中的一行。经过这样的处理,则B矩阵中的每一行数据就代表一个原二维图像矩阵数据。然后选择矩阵B中前360行数据随机带入BP网络进行学习,360个数据完全学习完一次,即是BP网络迭代学习了1次。训练完之后可以使用该网络判别B矩阵的后320幅数据(测试样本)。根据一定的判别规则和事先的人脸命名来判断识别的正确与否,最后统计识别正确的人脸个数,得出网络的正确识别率。
  然而当样本数据维数较大时,直接使用BP网络对原数据训练测试时,使得运算量巨大,BP网络学习时间过长,识别效果也不能令人满意。所以我们在使用BP网络之前,先对原数据进行特征提取,提取得到较好的少量数据用于BP网络计算,不仅减少了训练时间,还提高了BP网络的识别率。特征提取要达到的目的就是通过映射的方法,将高维空间中的数据用更易于分类的低维空间中的数据来表示。
  二、NMF(Non-negative Matrix Factorization)
  非负矩阵分解(NMF)[2][3]是在矩阵中所有元素均为非负数约束条件之下的矩阵分解方法。经典的NMF算法是将一个大小为m·n的原样本矩阵V分解成一个大小为m·r的非负矩阵W和另一个大小为r·n的非负矩阵H的乘积,使得Vm·n·Wm·rHr·n。当r满足一定条件,可以使得分解后的矩阵小于原样本大小,从而达到降维的目的。最后再使用分解后得到的系数矩阵H来代替原矩阵V,带入BP网络计算就可以了。这里需要注意,两个非负矩阵Wm·r和Hr·n初始值由计算机随机赋值,分解降维后的特征数r和分解的乘性迭代次数n需要根据实验效果自行设定。一般来说迭代次数不需要设定太大,设定的值越大,迭代运算的时间则越长。同时降维后的特征数r也不应选择太接近原样本维数,否则不能达到降维目的。
  三、实验结果与分析
  本文使用的BP神经网络,迭代学习次数设为10,学习速率设为0.1。取680幅原样本中360幅作为训练样本,其余作为测试样本。这里还需注意一点,由于BP网络权值、阈值是计算机随机选取的,使得每次实验结果呈现出一定随机性。为了便于更好地反应网络识别效果的好坏,我们将每个网络各实验10次,并计算10次结果的平均值。通过10次识别率的平均值大小和10次中的最高、最低识别率来衡量网络的识别效果。单一的BP网络和NMF+BP网络10次识别结果如下:
  从实验结果可以看出,使用NMF方法预处理后,使得BP网络的正确识别率更高。当NMF分解迭代次数选择40,维数r选择173时,NMF+BP网络识别效果相对最好,网络平均正确识别率高达98.7%,最小一次识别率为96.6%,最高识别率达到100%。而单独使用BP网络的平均识别率只有93.3%,且第九次的正确识别率只有75.9%。由此可见,在进行BP网络训练识别前,先使用NMF方法处理原样本数据,将原样本大小压缩至173,这样既简化了计算,也简化了BP网络结构。同时还提高了学习速率和平均正确识别率,提升了网络的整体稳定性。
  四、结束语
  基于NMF和BP神经网络的人脸识别方法,相比较于单独的BP网络人脸识别方法,识别效果得到了较大提高。然而NMF分解算法的迭代次数和提取特征数的选取仍然是经过大量的组合选取实验得来的,缺乏科学性的选择方法。下一步研究应是以如何科学地选择提取特征数和分解迭代次数为目标,以获得更加简单高效的NMF+BP网络用于人脸识别。(作者单位:河南财经政法大学)
  参考文献:
  [1] 许录平. 数字图像处理[M]. 北京: 科学出版社. 2007.
  [2] Lee D D,Seung H S. Learning the parts of objects by non-negative matrix factorization. Nature,1999,401(6755):788–791.
  [3] 刘维湘,郑南宁,游屈波. 非负矩阵分解及其在模式识别中的应用[J].科学通报,2006.51(3):241-250.
其他文献
摘 要:随着当前形势下各部门对财务信息多样化需求的增加,信息化平台建设已经成为高校财务管理的趋势。本文就高校财务信息化平台建设进行了梳理和展望。  关键词:财务信息化;高校财务  一、 引言  当前高校财务发展的方向已经由会计电算化过渡到财务信息化,工作重点也由提高财务核算工作效率向提供优质多样化的财务信息转变,财务信息化平台建设已被提到重要的地位。财务信息化平台是面向各层次用户提供报账、查询、跨
在全球经济一体化的知识经济时代,大学及其教师为了获得更多可能的外部资金来源,通过整合高等教育和全球知识资本的方式,把跨国因素融进教学、研究和服务的活动,即跨国学术资
本文通过对荣华二采区10
冬小麦是乌什县的主要粮食作物,常年种植面积21~22万亩左右,2010~2014年的10年之间,全县冬小麦的平均亩产一直徘徊在420~427kg左右,总产8.8万吨~9.4万吨。当前,大力提升冬小
B/S/S 结构和ASP技术是目前开发Web动态交互网页的主流技术,应用该技术可以开发高效的服务器Web应用程序,具有很强的交互性.根据现代化校园的发展,本文采用ASP动态网页技术与
目的:探讨小儿肥胖症与小儿肺炎喘息症状的相关性。方法:选取我院2012年1月-2013年12月住院有喘息症状的肺炎患儿或者哮喘患儿共160例,其中80例肥胖患儿为为研究对象,设为观察组。
《新少年》,半月刊,上海开明书店出版。创刊于1936年1月10日,是以初中和小学高年级学生为对象,指导文化学习的定期刊物。出到第19期,因抗日战争爆发停刊。1945年7月,在重庆复
工作于美食领域的我,日常总是能接触到一些各式各样的食物。作为一个吃货,能够一边工作一边享受美食,真的是一件无比幸福的事。  我最大的爱好就是品尝美食,吃遍天下美味是我一直以来所努力奋斗的目标。接触得多了,自然而然对于美食的理解不再局限于它的味道和样子,更多关注的是美食背后所蕴含的一种文化、一种理念、一种态度。  不知从什么时候开始在都市中兴起了一股吃素食的热潮,对很多人来讲,素食不仅仅是一种健康的
期刊
目的:调查糖尿病患者足部保护知识了解现状,为患者选择和穿着合适鞋袜、预防足溃疡发生提供参考依据.方法:采取便利取样方法,自行设计的调查评价研究表对358例糖尿病患者的足
摘 要:“互联网+”与打车软件服务平台的应运而生,实现了各种数据信息的互通、给我们在出租车领域提供了很大的研究空间,但“打车难”的问题依然没有得到彻底解决。对此,本文从打车软件服务平台入手,利用MATLAB进行数据挖掘,综合经济学供求理论常识与各种外部客观社会因素,运用相对精确、有效的综合权值法建立合理的出租车“供求匹配”程度模型、并对北京20个区域进行全天候的宏观分析、微观分析以及相关系数分析。