论文部分内容阅读
随着图片数量的增加,在数据库中检索特定的图片面临着速度和精度两方面的挑战,由于深度学习技术更适合于处理大量数据,因此将其应用于图像检索领域逐渐成为研究的热点。目前基于深度学习的图像检索主要使用卷积神经网络来提取图片的高层抽象特征,特征提取的全面性和准确性决定了整个图像检索的精度。为了获得更高的精度,现有的研究一直着眼于网络结构的优化和层数的增加,但结构的优化需要凭借丰富的经验,而层数的增加则会导致计算量和计算延时的增加。 本文针对目前基于深度学习的图像检索存在的精度提升问题,提出了一种结合多个网络的方法。论文首先介绍了使用深度学习进行图像检索的现状,然后选择具有代表性的多种卷积神经网络组合方式完成实验框架搭建,并在CIFAR-10和CIFAR-100数据集上测试效果。实验结果表明,层数较少的同类结构卷积神经网络的组合可达到与深层网络相当的效果,但计算复杂度大大降低;层数较少的不同结构卷积神经网络的组合也可达到与深层网络相当的效果,尽管计算复杂度稍高,但计算延时更小。 根据实验分析的结果,论文选取了32层和44层ResNet的组合,此种组合方式可以获得与110层ResNet相当的效果,同时在可以达到相当精度的实验组合中其计算量最少。基于该组合完成了图像检索系统的设计,在CIFAR-10和CIFAR-100数据集上展示了检索效果。 论文在研究图像检索系统算法复杂度的同时,提出了一种卷积层硬件加速器结构,并在Xilinx型号为XC7Z020CLG484的FPGA上进行验证。验证结果表明,该结构功能正确,其吞吐率可以达到2.9Gbps,而功耗只有0.681W。为后续的图像检索系统进一步优化奠定了基础。