论文部分内容阅读
人机交互技术(Human Computer Interaction,HCI)是指用户可以使用简单的手势与设备交互,让计算机理解人类的行为,手势识别作为人机交互领域的一种重要方式,逐渐成为该领域的热点研究方向。雷达作为检测和定位的工具,相比于其他传感器,具有精度高且不易受干扰的优点。手势识别一般采集原始数据,然后提取每类手势的特征,最后通过特征建立模型分类。现有的手势识别主要具有以下特点:一、在计算手势相对雷达的径向运动参数后,并没有进一步关注手势横向的变化,使得表征手势的参数信息不足;二、由于手势是一个持续的过程,除了在每一瞬时提取的特征外,还有时间维度,使得参数量维度更大而特征提取困难;三、每类手势按照其时间顺序存在独特的特点,然而在每一瞬时的特征提取后,时序特征信息却没有得到应有的重视。基于此,本文开展了基于调频连续波(Frequency Modulated Continuous Wave,FMCW)雷达信号的手势识别算法研究,本论文的主要工作如下:第一,利用FMCW雷达的中频(Intermediate Frequency,IF)信号计算手势目标的距离、速度和角度参数。根据二维快速傅里叶变换(2D Fast Fourier Transform,2D-FFT)算法求取多帧距离-多普勒图(Range-Doppler Map,RDM)图像,然后使用多信号分类(Multiple Signal classification,MUSIC)算法求取角度,并通过多帧累积生成单帧角度时间图(Angle-Time Map,ATM)。第二,根据RDM和ATM中手势峰值的特点,计算图中每一列像素值的自适应梯度,并通过一阶指数平滑来完成RDM中的峰值干扰滤除,然后利用小波变换对RDM和ATM进行分解和重构实现图像增强(Image Enhancement,IE)。第三,搭建深度学习神经网络进行手势特征提取和分类。根据手势参数图特点,分别使用膨胀3D卷积(Inflated 3D ConvNet,I3D)和卷积神经网络(Convolutional Neural Networks,CNN)进行手势时空特征提取,然后对特征结果进行重组,再采用长短期记忆网络(Long Short-Term Memory,LSTM)分别提取手势运动的距离、速度和角度变化信息,最后通过提取到的特征进行分类。