论文部分内容阅读
近年来,互联网和移动互联网的快速发展,网络中的图像数据展现出了爆炸式的增长。图像数据简单直观,并且包含丰富的信息,被人们广泛作为信息交流的载体。基于内容的图像识别能够从图像本身出发,先从图像中提取显著的特征,再根据特征的差异对图像进行识别,具有很好的识别效果。机器学习在人工智能中具有非常重要的位置,机器学习通过算法对数据进行学习,然后进行预测和决策,是实现人工智能的钥匙。机器学习的图像识别是基于图像内容的,机器学习从图像数据本身出发,从数据中提取底层的图像特征,然后通过机器学习的算法建立起底层特征和高层图像语义之间的联系,进而实现图像识别。图像识别是机器视觉的基础,图像内容千变万化,机器视觉就千差万别。对计算机来说,图像的底层特征和高层图像语义没有直接的联系,所以解决“语义鸿沟”就是图像识别的重点和难点问题。机器学习发展经过了浅层学习和深层学习两个阶段,专家和学者提出了很多的算法模型,在图像识别、语音识别和人工智能方面取得了较多成果。首先介绍了基于统计理论的支持向量机模型,支持向量机模型是根据人工提取的特征来训练分类器,通过分类器来达到图片识别的目标。对于底层特征的提取,介绍了颜色、形状和纹理特征的提取方法。对于支持向量机的原理,介绍了支持向量机线性分类的核函数和惩罚因子。对于分类器构建,介绍了二叉树分类器的不足和改进的方法。对于图像特征,介绍了单一特征的不足和将多种特征融合成为融合特征的方法。通过对比实验,论证了二叉树分类器的改进方法和将多种特征融合为融合特征的方法能够提高图像识别准确率。然后还介绍了模拟生物神经网络的人工神经网络模型,人工神经网络能够自主的从底层像素中提取特征来训练网络模型,通过输出层实现图像识别的目标。对于人工神经网络的原理,介绍了通过反向传播算法来训练网络模型。对于网络模型结构,研究了节点数和层数的设计。对于权重的初始化,介绍了初始化方法的不足和改进的方法。通过对比实验,论证了新设计的模型结构和权值初始化方法能够提高图像识别准确率。最后介绍了模拟生物视觉系统的卷积神经网络,能够处理二维的图像数据,非常适合图像识别。对于卷积神经网络的原理,介绍了卷积神经网络卷积层和池化层的连接算法。对于网络模型结构,介绍了卷积层和池化层的局部连接和权值共享,全连接层引入了 Dropout弃权的方法,支持向量机的线性分类器模型作为输出层,新设计的权值初始化方法。对于激活函数的选择,介绍了常用激活函数的不足并提出了融合S函数和R函数的融合函数。通过对比实验,论证了改进的网络模型和改进的激活函数能够提高图像识别准确率。