论文部分内容阅读
随着计算机硬件的飞速发展与传感器技术的进步,高级驾驶辅助系统(ADAS)作为无人驾驶的先驱领域,近年来正在大力发展。同时,AlphaGo的一战成名,让深度学习尤其是卷积神经网络,再次成为人们研究的热点,因此自然地被应用于ADAS的目标识别系统。 在中国,非机动车尤其电动自行车的保有量和相关交通事故都在逐年攀升,而针对其所做的识别检测工作却少之又少。虽然自动识别的工作,例如人脸识别和指纹识别,在通用中央处理器上已经研究了很多年并取得了卓越的成果,但是在车载环境中,秒级的运算时间与处理速度完全无法满足实际的需求。因此本文面向ADAS,基于FPGA硬件平台研究并设计应用于非机动车识别的卷积神经网络加速器,使其能够在处理速度上有显著改善以适应车载环境的识别检测工作。 本文首先介绍了经典的人工神经网络与卷积神经网络的相关原理,以经典的LeNet-5为例描述了卷积神经网络的模型结构。然后介绍了具有历史性突破的AlexNet模型,详细说明了它的工作原理以及能够提升性能的创新机制,例如所采用的修正线性单元(ReLU)激活函数,具有结构简单、易于求导等特性,能够有效地提升训练速度。基于经典模型,本文提出了简易的更适应于硬件实现的Lightened AlexNet卷积神经网络,保留AlexNet中的几项优异机制,降低了网络的复杂度,采用自建数据库,亦取得了不错的识别效果。 本文通过研究卷积神经网络中的并行性,利用FPGA硬件的并行计算特性与计算资源,完成了并行加速模块的设计。本文详细介绍了卷积神经网络各个计算层的实现过程与硬件模块设计,包括卷积模块、池化模块、激活模块和全连接模块。在设计硬件电路系统时,针对SDRAM存储器做了详细的研究,设计了相应的SDRAM接口电路模块,用于存储原始图像与计算产生的中间数据。每个模块皆用verilog硬件设计语言设计RTL级电路,并利用Modelsim进行功能仿真与逻辑验证,然后用QuartusⅡ编译、综合,验证了整体电路的正确性与可行性。最终系统的功耗为1883.94mW,相比于CPU运行相同结构加速了约9倍。