论文部分内容阅读
互联网的迅猛发展,服装电子商务涌现,如天猫、京东等,人们只需要一部手机就能轻松的买到想要的服装。图像分类逐渐成为计算机视觉中的重要研究课题,其具有很高的研究价值和应用价值。由于服装图像包含的细粒度分类多,视觉变化大,如形变、光照、拍摄视角、背景影响、镜头缩放尺度等,使得人工设计特征越来越难以满足图像分类的现实需求。传统的服装图像分类方法主要依据图像给予的文本描述进行分类。然而,随着服装图像数据量的增加,需要大量的人力物力对图片进行人工标注,由于每个人看待图像的角度不同,则做的图像标注也会不同,这时对服装图像分类的精度造成一定的影响。为了提高图像的分类性能,本文采用迁移学习的图像分类方法以及改进卷积神经网络两种方法对服装图像进行识别分类研究。(1)传统的服装分类方法主要是提取图像的颜色、纹理、边缘等特征,这些人工选取特征方法过程繁琐且分类精度较低。为了提高服装图像的分类性能和时效性,本文采用了一种基于迁移学习的卷积神经网络服装图像分类方法。将训练好的模型(VGG16、Res Net50、Inception_v3等)在服装图像数据集上进行迁移训练,保留预训练模型所有卷积层的参数,冻结前层网络参数并精调整个网络模型,使其能够适应服装图像的识别。实验结果表明,这些模型进行迁移学习后,在分类精度和时效性上得到有效提高。(2)针对目前服装识别分类算法对服装多类别分类的问题,深度残差网络可通过增加神经网络的深度获得了较高的识别精度被广泛的应用于各个领域。为提高服装图像识别精度问题,本文提出一种改进深度残差网络模型,该模型主要特点为:改进残差块中卷积层、调整批量归一化层与激活函数层中的排列顺序;引入注意力机制;调整网络卷积核结构。该网络结构在标准数据集Fashion-MNIST和香港中文大学多媒体实验室提供的多类别大型服装数据集(Deep Fashion)上进行测试,实验表明,所提出的网络模型在服装图像识别分类精度上优于传统的深度残差网络。