基于资源受限设备的视频人脸检测与识别算法研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:Coolbear
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着物联网技术的发展,在物联网系统中的视频流量将会呈指数增长趋势。视频中包含的人脸信息,也会随之大大增加。利用边缘设备识别视频中的人脸信息,逐渐成为科技界的发展趋势。由于边缘设备的资源有限,如何在资源受限的设备中完成人脸检测与识别,是一个具有重要理论意义与工程应用价值的研究方向。针对视频的相邻帧中存在冗余信息的问题,本文提出了一种基于d Hash算法与图像分块技术结合的双阈值关键帧提取算法。该算法结合了d Hash算法与图像分块技术,通过双阈值的设置,能够提高d Hash算法的关键帧提取准确性。该算法在资源受限的设备中部署时,关键帧提取精度能够达到90%以上,且每一帧的处理时间小于10ms,达到了关键帧提取精度与速度的平衡。在提取的每一个关键帧中完成人脸检测与识别的过程。针对基于神经网络的人脸检测算法精度不够高、计算量过大、网络参数众多的问题,本文首先改进了基于CNN的MTCNN人脸检测框架,利用批量归一化、残差网络与SE网络的思想重建网络,提出了IMTCNN方案,在MTCNN方案的基础上进一步提高人脸检测的准确性。然后通过网络修整、改变输入维度的方法改造IMTCNN网络,提出了Mobile MTCNN方案。相比于IMTCNN,其三个子网络P-Net、R-Net与O-Net所需的浮点运算次数下降了14%、40%和70%,精度仅下降1.3%,并减少了20%以上的时间消耗。轻量级网络Mobile Net存在减少网络中卷积核数目时准确率下降严重的问题。为此,在人脸识别算法的研究中,本文利用分支网络结合残差网络与SE网络的思想,设计了Mobile-Inception结构与Mobile-Resnet结构,并利用卷积层代替池化层,重构了Mobile Net网络,提出IMobile Net-Small网络结构,其准确率比Mobile Net-0.5提高了0.9%,参数量仅为Mobile Net-0.5的40%,部署在资源受限的设备中时,所需时间减少1/3以上。本文利用RK3399开发板作为资源受限的设备,对基于d Hash与图像分块的双阈值关键帧提取算法、Mobile MTCNN人脸检测算法与基于IMobile Net-Small网络的人脸识别算法进行了测试,测试结果表明本文提出的算法能够适应视频中复杂的背景变化与光照变化,能在各种不同环境中达到预期效果。最后在会议场景中展示了关键人物注册、人脸检测、人脸识别、关键人物添加马赛克等功能。
其他文献
当今世界是一个日益全球化的世界,国家与国家之间的学术交流日益频繁。其中,音乐理论的传播也逐渐受到重视,在这种传播中,译者作为其中关键的一环扮演了至关重要的角色。本报告以题为Expression and Emotion in Music的音乐表演论文作为翻译实践的蓝本,依据Reiss的文本分类理论,对原文本进行了全面分析与探讨,将原文分为三种文本类型,针对不同的文本类型采用不同的翻译方法。针对术语,
这份回顾报告检视了作者在参与特定翻译项目期间的个人经历,主要关注译前编辑、机器翻译和译后编辑相结合的工作模式。本报告解释了项目要求和采用该工作模式的原因,讨论了译前和译后编辑的基本概念和指导原则,并列举实例阐释了本翻译项目过程中所开展的译前和译后编辑工作。本翻译项目过程中所开展的译前编辑工作包括:(1)提取术语供机器翻译引擎试译,核查机器翻译的术语译文是否正确,并纠正误译的术语;(2)为提高机器的
日本的妖怪文化在日本占有重要席位,深刻影响着日本人民的生活习俗;日本与中国一衣带水,两国相互影响,在民俗文化上有着许多共同之处,因而中国读者也对日本妖怪这一文化现象情有独钟,中国官方引进了诸多与妖怪有关的电影、动漫、书刊。美国作家Michael Dylan Foster致力于研究日本妖怪文化,先后出版了多本著作,《百鬼夜行:日本的妖怪与妖怪文化》(Pandemonium and Parade)就是
本报告牵涉的翻译项目,是南京航空航天大学与美国约翰·霍普金斯医院达成合作意向前,前期考察阶段的部分医学材料。笔者根据美方所提出的译文质量要求完成项目中有关心脏监护仪的医学材料英译中任务,并选取材料译文的两轮审校意见进行分析,旨在对医学翻译译文质量作出探索,并进一步提升笔者自我审校的能力。本报告首先介绍了与美国约翰·霍普金斯医院合作的医学翻译项目具体情况。随后简单回顾了国内外关于医学翻译和翻译过程中
随着经济全球化的日益深入,国际性招标活动也日趋频繁。招标文件是整个招标活动的基础和重点内容,而招标文件的翻译质量在很大程度上决定着项目招标能否成功进行。因此,对招标文件的翻译过程进行总结,能够为本领域的翻译实践提供借鉴和参考。在上海唐能翻译公司实习期间,笔者负责某公司《招标书》的英汉翻译。该翻译任务在充分结合源文特点,并以平行文本为参照的基础上完成。本报告选取其中10000字译文,就翻译中出现的重
技术文本的翻译可以促进技术文档的标准化,为科技产品的开发和推广提供支持。该类型文本的翻译实用性强,对于翻译方法和技巧的探讨也有借鉴作用。本报告分析了笔者在翻译目的论指导下进行的IP摄像机片上系统规格书英译汉实践,旨在讨论笔者在翻译过程中遇到的问题,并探讨相应的解决方案,以期为今后同类文本的翻译提供一些参考。本报告共分为五章:第一章简要介绍了此次翻译实践的背景;第二章介绍了翻译目的论以及国内外对英语
Android是目前全球最受欢迎的移动操作系统。有越来越多的攻击者为了获取非法利益,将Android应用重新打包后发布到应用市场,给用户的隐私和安全带来了巨大威胁。因此在过去一段时间里有很多的学者都致力于研究Android重打包应用的检测。但过去大多数研究都集中在代码相似性检测上,这些算法无法检测混淆或加密后的应用。最近提出的基于UI特征的重打包检测算法具有抗加固性。一些基于动态获取UI特征的检测
随着无线通信技术的发展,无线网络的安全性越发受到人们的关注,尤其是对接入设备的身份认证是保障通信系统安全的重要组成部分,传统的基于加解密算法和安全协议算法的无线通信安全体系都是建立在数据链路层及其以上的层级,人们开始关注从更底层的角度——物理层考虑身份认证,因此通信设备的物理层特性其唯一性以及难以伪造的特点对于无线通信的认证安全具有着重大意义,值得去深入研究。本文的研究对象是GSM移动设备发送的G
随着云计算技术的不断发展与广泛应用,虚拟化技术也变得愈加重要。相比于传统虚拟化技术,基于容器的虚拟化技术更加轻量、灵活,对系统性能造成的影响也更小,因此受到越来越多用户和厂商的青睐。Docker技术是容器技术的一种,目前在容器市场中占据着主导地位,已成为容器技术的事实标准,因此Docker平台的安全防护具有重要的研究意义和实用价值。在Docker平台中,容器的低隔离性及镜像的构建和分发都可能引入新
现今社会生活对网络的依赖程度持续加深,在有意无意间,个人数据都在被服务平台收集并使用,这固然带来了极大的便利,但同时这些用户数据中包含着大量敏感的隐私信息,一旦泄露必将面临遭到非法使用的严重后果,因此保护数据安全和维护用户隐私是当今一项重要的研究议题。最初对数据安全的研究主要集中在匿名化公开内容、去除其中敏感信息上,而后随着对隐私理解的加深,一些研究者将目光转向了对用户检索公开信息过程中的检索目标