基于特征提取与分类的手写数字识别研究

被引量 : 3次 | 上传用户:wangtianxin1818
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手写数字识别(Handwritten Numeral Recognition)是一个经典的模式识别领域的问题,因其典型性和广泛应用性而具有重大的理论研究价值和应用前景。手写数字识别研究的目标是:利用计算机通过某些算法准确高效地辨认手写体阿拉伯数字。它是手写字符识别的一个热门方向,是光学字符识别技术的一个重要分支。目前的手写数字识别技术主要分为两个步骤,分别是获取图像特征和对特征向量进行分类。基于这个思路,本文首先介绍了提取图像描述子的若干方法,包括SIFT,PCA和HOG方法。SIFT局部特征描述子在进行匹配时可以适应图像间的旋转,平移,仿射变换以及光照变化等多种情况的干扰,匹配能力较强。PCA是指主成分分析,这种方法可以有效找到数据中的最重要元素和结构,对原数据降维,去除冗余和噪音,展现出复杂数据背后的简单结构。HOG描述子是基于局部目标的表现和形状可以被梯度或边缘方向密度分布很好地描述的思想而提出的,它可以计算局部图像梯度的方向信息的统计值,一般作为目标检测的特征描述器。然后在空间金字塔匹配(SPM)的基础上,本文分析了稀疏编码和局部受限线性编码。稀疏编码的统计模型符合视觉神经中的最大化选择原则,已经成功被应用于模拟初级视觉皮层的简单细胞的属性。其主要实现步骤是通过对图像的局部特征进行稀疏表示和局部最大化选择。局部受限线性编码基于局部性的重要作用,通过结合描述子局部性限制,来对目标描述子进行重新表示,得到用于分类的特征向量。论文采用了SVM方法对编码后的特征向量进行分类。SVM是基于统计学理论的VC维理论以及结构风险最小化原则的方法,普遍适用于解决小样本,高维以及非线性的模式识别问题,且展示出相当的优势。近年SVM已经被成功地应用多个领域,例如信号处理和图像识别。实验部分按局部描述子提取,编码和特征向量分类的步骤实现手写数字图像的识别,并通过组合各环节中不同的方法来分析和对比实验效果。最后在训练样本数较小,使用线性SVM的情况下,得出SIFT描述子结合稀疏编码可以获得各组合中最好的效果。
其他文献
贾樟柯作为中国第六代导演群体中的代表人物,运用剧情片与纪录片交叉拍摄的方式构建了独特叙事模式的同时补充了我们个人对于历史的记忆,并且更为真实客观地展示了中国现代化进
本研究基于人类发展生态学的基本理论,对国外三种较有代表性的幼儿园课程模式即蒙台梭利教育法、瑞吉欧教育方案和高宽课程模式中的环境创设进行了比较,进而分析了这三种课程
<正>《3~6岁儿童学习与发展指南》(以下简称《指南》)的颁布,标志着我国学前教育进入了一个新的发展阶段。在思考这个阶段的幼儿园语言教育时,我们每一个幼教工作者都必须明确
<正>作为早期儿童语言学习与发展的一个重要核心经验,前阅读核心经验是幼儿在终身学习中成为一个成功的阅读者所必备的。一个有着良好阅读能力的幼儿,会表现出对阅读的浓厚兴
幼儿园早期阅读教育是我国学前教育领域的一个热门话题。本研究将有关汉语儿童早期阅读能力发展规律的研究成果应用于幼儿园教育实践,据此提出了在中国文化背景下通过幼儿园
孟京辉,作为新中国90年代新崛起的青年戏剧导演,作为中国先锋实验戏剧的代表人物之一,自从步入导演生涯以来,经过十多年来在戏剧领域不断的追求与探索,执导了20多台戏剧。他不但得
1998年,一部由迪斯尼公司耗巨资制作并隆重推出的动画片《花木兰》是中国古代传统文化与美国电影创作特点结合的产物,可谓是“中西合璧”的佳品。时隔十年,2008年,梦工厂制作
<正>三、记录与统计在课程生成发展过程中,“记录”和“统计”是能够起到重要作用的指导策略。记录可以记载幼儿的探究历程,统计方法的运用则可以帮助幼儿学习分类,提高综合
激光全息检测技术具有很高的精确性和灵敏度,且对被检测试样的表面形状无特殊要求等优点,也是包覆层药柱粘接质量指定的检测方法。然而目前激光全息检测包覆层脱粘缺陷只做到了