论文部分内容阅读
随着科技的不断发展,人们的生活水平也日益提高,因此人们已不满足于近距离手动的操作身边的事物与机器,而希望通过一种更简单,更快捷的方式来实现人机交互。此外,由于社会的进步,人文关怀的需要,聋哑人与正常人的无障碍沟通也是一件亟待解决的事情,而手势识别又是手语翻译系统中极为关键的一环。基于上述原因,手势识别技术便应运而生了。传统手势识别方法存在准确率与实时性不能同时兼顾的问题,且受环境的影响较大。此外,这些方法对于小手势的检测能力也不强。针对上述问题,本文提出了一种基于DSSD的静态手势识别方法。主要工作如下:利用普通摄像头在不同的环境下采集了手势图片作为数据集,并使用数据增强的方法来扩充数据集。在DSSD网络模型的基础上,做了一些改进:针对自制的数据集以及公共手势数据集,采用K-means算法及手肘法对先验框的宽高比进行了重新选取从而提高了检测精度;改进了信道融合方式,利用concat操作来代替元素点积以提高检测速度;采用迁移学习,对比了不同基础网络AlexNet、VGG16、ResNet101对DSSD网络模型的影响,同时解决了数据量小所带来的检测精度低的问题。随后,通过实验验证了迁移学习对于小数据集所带来的改善作用并且选取了表现较好的ResNet101作为DSSD的基础网络。实验还表明了我们利用K-means算法及手肘法选取的宽高比确实能够提高检测精度以及改进的信道融合方式确实能够提高检测速度。此外,实验通过与基于Faster R-CNN、YOLO及SSD等算法的手势识别方法的对比,证明了本文方法相较于它们有着更高的识别精度。为了验证本文方法的稳定性,实验测试了其在不同环境下的识别表现,结果表明本文方法受环境干扰不明显,可完成多种环境下的检测任务。最后,通过对比实验证明了该方法对于小手势目标具有不错的检测能力,能够实现较远距离的手势识别。文章最后设计了一个基于DSSD的手势解锁系统,可以实现单手势密码及多手势密码的解锁功能。通过实验展示了该系统的界面以及其解锁性能,实验表明该系统具有操作简便、识别精度高、识别速度快等优点,并且还具有一定的抗干扰能力。