论文部分内容阅读
手写数字识别的应用领域非常广泛,应用领域涵盖邮政编码、银行票据、统计报表,以及其他形式的数据数据处理业务。手写数字识别是模式识别、机器学习等研究领域的热点和难点问题,在实际的应用中,手写数字识别仍然遭受巨大的挑战,鉴于手写数字本身的特点,比如数字信息量较小,数字写法差别较大,实时性要求高等特性,因此,手写数字识别的有效性和快速性都是研究的重点。本文对手写数字图像的特征提取进行研究,分析手写数字识别的难点,并找出了解决该难点的对应策略,重点研究和分析了HOG(梯度方向直方图)特征的原理,具体实现方法,提取过程以及性能分析,并在此基础上提出了PHOC(金字塔梯度方向直方图)描述算子,为每一张手写数字图像构建一个三层的HOG金字塔,在每一层中使用不同大小的块来对局部的方向梯度直方图信息进行统计,最终生成PHOG描述算子。PHOG描述算子凭借着对块大小的表征,能够对手写数字的局部表征以及形状信息进行更好的表征,更好的表示图像的梯度或者边缘方向分布信息,因此基于PHOG描述算子能够提取更加鲁棒的手写数字特征。此外,本文采用SVM作为分类器,选择了具体的SVM模型,确定核函数的类型,通过交叉验证和图搜索的方法,为SVM模型选择了最优的参数C和γ,最后对得到的PHOG描述算子向量进行分类,大大提供了识别的准确率和效率最后,本文将提出的算子在MNIST手写数字数据库上进行了实验,通过对比实验和最终的分析,验证了本文提出算法的有效性。