应用于课堂场景的人脸匹配深度学习算法研究

来源 :东华大学 | 被引量 : 0次 | 上传用户:XU739603
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高校的学生课堂考勤严重挤占了课堂时间,考场身份核验增加了监考人员的工作量,且效率低下。随着人工智能技术的研究与技术应用领域的推广,不同领域遇到的问题都尝试着采用人工智能方法来解决,尤其在计算机视觉方向上,因为卷积神经网络具有强大的计算能力与非线性自主学习特征的特性,所以被广泛应用在现实场景的目标识别与验证工作中。因此,为了达到节省大量的人力、物力与提升工作效率的目的,本文采用深度学习方法解决课堂场景的人脸匹配问题。本文根据深度学习理论,设计了基于课堂场景数据的人脸图像分类算法,算法的设计思路主要从人脸图像预处理、人脸图像分类算法研究和实验分析三个部分阐述。首先,从教室采集大场景图像,使用人脸检测算法抓取人脸图像,将被捕获的图像分类,制作成实验图像数据集。针对现实场景的图像样本质量较差的问题,本文使用直方图均衡与锐化增强算法处理人脸图像,过滤环境因素带来的影响并且有效地突出图像中的人脸信息。为了使模型更专注在规范区域学习判别特征,进行了人脸对齐。其次,本文重点设计了人脸图像分类算法,本算法由分类模型与分类器Softmax组成,其中设计了三个模型结构:轻量级的卷积网络模型、基于Shortcut模块的网络模型与改进的孪生结构模型。考虑到实验数据为质量较差的现实场景样本,并且为了加大学习难度和得到更具判别性的人脸特征向量,本文重点改进了算法原本的Softmax,使用基于余弦间距的Softmax作为损失函数。通过实验测试,轻量卷积网络最灵活,基于Shortcut的网络在不同数据集上性能最稳定,改进后的孪生网络对比未改进的孪生网络提高了一定的精度,并且在小数据集上有一定优势;基于余弦距离的Softmax很大程度上促进了模型对低质量样本的学习。由实验结果分析得出,本文推荐基于Shortcut模块的网络模型与基于余弦距离的Softmax的组合算法,将该算法应用在现实场景环境复杂,采集样本不佳的情况下。最后,本文试验了不同模型和不同Softmax的组合算法方案,在训练过程中观察各算法的准确率和Loss趋势,分析各算法方案的优劣势与适用数据集的特点。为验证算法的泛化性能和被提取特征的判别性,本文将算法预测得到的128维人脸特征表达向量可视化,观察对象之间的差异,采用余弦相似度公式进行相似度计算。对于未训练身份样本,算法依然可以匹配准确,实验结果进一步验证了算法的有效性。
其他文献
基于NAND闪存的固态盘由于其性能优于机械磁盘而被广泛部署在存储系统中,但由于写放大以及闪存介质磨损等原因,减少写操作可提高固态盘的性能与可靠性。此外,统计表明常见的
海外代购作为一个新兴行业,以其快速、便利、品种丰富等特点逐渐被广大消费者所青睐,但同时也给海关监管提出了新的挑战。一方面由于海外代购业务发展速度过快,现有的法律法
作为近代中国经济、文化重镇的上海。凭借着得天独厚的地理位置、兼容并蓄的文化氛围、错综复杂的社会环境使得不少有识之士聚集于此,在政治、经济、文化等各方面为推动上海乃至中国的近代化、启迪民智做出了自己的贡献。世界社便是其中之一。初创于法国巴黎,随后扎根在中国的世界社(经过多次搬迁,最后选址于现武康路393号)是一个内容丰富、体系庞杂的社会组织,涵盖了经济、文化、研究、对外交流、教育、出版、医疗等各方面
伴随着中国特色社会主义市场经济的快速发展,人们从物质生活的改善中切实感受到了改革开放的所带来的巨大红利,对主流意识形态的认同也由原先的同质性的政治话语认同转化为异
同语式是存在许多语言中的一种有趣语言现象。在汉语口语交际和文学作品中,同语式表达也非常普遍。它的主语和宾语相同,看起来没有传递任何信息,但实际上它具有非常特殊的表达功能。在学术领域,同语式一直是一个备受争议的研究课题。本研究从构式语法的角度将现代汉语中的这类表达定义为汉语同语式。本论文的主要研究目的是:首先,找出汉语同语式的动机。其次,证明汉语同语式意义来源于构式,而不仅仅是构式中的词汇意义。第三
随着云计算时代的到来,中国已经实施建设了许多基于云计算的应用系统,比如公共领域的公有云服务平台、金融领域的云服务平台、政务领域的云服务平台以及商业领域的云服务平台等。云计算飞速发展的同时也带来了诸多云安全问题,其中,数据安全和隐私保护是云安全关注的首要问题,而云密码技术可以为各类云安全问题提供了一系列完整可靠的解决方案。当前,密码技术在云计算中的应用主要采用云密码资源池方案,实现密码资源的统一管理
随着科学技术的发展、各种智能设备的层出不穷和网络的开放,数字图像已经成为了十分普及的信息传播媒介,然而这也增加了数字图像被肆意篡改伪造的风险。为了以有效的手段对此类事情加以约束,数字图像的取证技术得以飞速发展。数字图像取证技术分类主动和被动两大类,本文研究的基于相机型号的来源鉴别属于被动取证中一个十分重要的分支。目前在数字图像来源鉴别研究的前提是要有足够的训练样本。当样本的先验信息不充分时,会对来
数据流是一种数据序列,它能够随时间增加而顺序、快速、大量、连续到达。近年来,随着互联网以及软硬件的发展越来越多的数据流产生在各行各业,使得数据流逐渐成为一种主流的数据形式。这些数据流中隐藏着许多有趣的知识和规律,如果挖掘出来并加以利用能够对人们的决策起到重要的指导和参考作用。但是不同于以往的静态数据,数据流具有无限性、时序性、演变性、高维性、时间局部性等特点,使得传统数据挖掘算法不能直接移植到数据
法兰密封型面是核主泵的关键承压承载边界,服役过程承受热/机械应力冲击、重水腐蚀等,易发生型面变形、表面剥落等失效情况。传统方法需人工携带接触式量具进入核辐射现场完成型面尺寸误差和表面缺陷检测,对人体有害且检测结果不稳定。针对该问题,本文围绕机器人三维光学测量系统搭建、无碰撞测量路径生成、测量数据处理算法、密封型面尺寸误差/表面缺陷计算等开展研究,主要内容包括:(1)研究机器人三维光学测量系统无碰撞
党的三大工作作风即理论联系实际作风、密切联系群众作风以及批评与自我批评作风。十八大以来,在作风建设中,习近平多次强调要抓好中华优秀传统文化这个“根”和“魂”,纠正党内不正之风。在当前实现中华民族伟大复兴的关键历史时期,深入研究和挖掘三大作风的优秀传统文化底蕴,有助于我们更好地认识和理解党的三大作风的思想精髓,实现党内风气好转,进而带动全社会风气的转变。文章主要采用文献研究法,对党的三大工作作风的发