基于统计方法的脱机手写字符识别研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:zgkjzh1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
脱机手写字符识别,尤其自由手写汉字识别,是模式识别领域中最具有挑战性的问题之一,至今仍然没有很好地解决。为此,本文基于统计方法,从特征形成和分类器设计两个方面开展了研究。主要的创新性内容如下: (一)本文在总结几种重要特征形成方法的基础上,根据信号处理及模式识别的相关理论,分析了“模糊分块”提高特征可分性的原因,并提出了改进的特征——“低通采样方向线素特征”。实验证明该特征具有更好的可分性。 (二)为更好地拟合手写字符特征的类条件概率密度的非高斯分布,本文首次在字符识别中引入了“正交混合高斯模型”(OGMM)。据此,可以更精确地描述实际特征的类条件概率分布。实验证明,基于OGMM的分类器比基于高斯分布的分类器在字符识别中表现出更好的分类性能。 (三)为进一步获得更高性能的OGMM分类器,本文在OGMM参数估计中引入了“最小错误率鉴别学习”算法(MCE),提出并实现了基于MCE鉴别学习的OGMM(OGMM+MCE)。按照MCE鉴别学习算法,通过调整OGMM的参数,显著地减少了经验错误率。 (四)OGMM的阶数,即OGMM中高斯分量的个数,无法通过EM算法或MCE鉴别学习算法得到。由于OGMM的阶数控制着分类器的复杂度和推广能力,因此本文根据“结构风险最小化”原则,提出了一种确定模型阶数的方法。该方法可以得到合适的阶数,有效地防止“过拟合”和“欠拟合”。 (五)针对汉字识别模式类别多和运算量大的特点,为保证OGMM+MCE能够有效地应用于手写汉字识别,对原MCE算法进行了一系列必要的修正,使之在手写汉字识别的粗、细分类器中均得到了应用。 最后,通过在手写数字NIST库和MNIST库的实验和评估,表明利用本文OGMM+MCE算法设计的手写数字识别分类器,其性能己达到世界先进水平。在手写汉字THUHC库的实验结果表明,OGMM+MCE在手写汉字识别粗、细分类器中的应用均取得成功(本实验室多种识别方法中至今最好的结果)。
其他文献
社会经济的飞速发展促进了金融投资向多样化发展的步伐,企业如果要在金融市场上取得可观的效益,就必须在投资策略上下功夫,要学会与时俱进创新,做好金融投资管理策略,为今后
摘要:曾经有一位著名的心理学家对“反馈效应”进行心理实验,通过实验结果能够总结出:在教学过程中及时对学习和活动结果进行评价,能够有效提高教学效率,并且即时反馈比远时反馈所产生的效应更大,教学反馈是教学过程中必须要具备的环节,如果教师能够有目的的进行教学反馈,那么将会取得很好的教学效果。在新课程标准背景下,我国初中数学教学模式已经有了很大的突破,这些教学模式大大提高了初中数学课堂教学效率,这就要求教
随着新时代的到来,社会各领域发生重大变革,行政事业单位在工作模式上也需要进一步调整,将资产管理与预算管理有机结合起来,这对于行政事业单位的健康发展是非常重要的.本文
WNT信号通路的名称来源于鼠乳腺瘤基因INT-1和果蝇的同源基因WINGLESS,将两个基因组合称为WNT。WNT信号通路在肿瘤发生中有重要意义,它调节细胞生长,迁移和分化,由于它在众多人类
土壤动物是陆地生态系统的重要组成部分之一,是生态系统中重要的消费者和特殊的分解者,在生态系统中具有不可替代的作用。扎龙国家自然保护区是重要的湿地景观,在该区域内,选
条形码由于其技术简单、方式灵活、信息采集速度快等优点,在物流、交通及零售行业中得到了广泛应用。目前工厂环境下,大多还是人工定位方式进行扫码分拣,不仅造成了人力资源的浪
经济全球化既带来了机遇也带来了众多的挑战,在我国的经济改革不断加深的局面下,我国对外贸易也变得越来越密切,同时也多了许多风险变数,这也从侧面佐证了一个观点,经济全球
该论文基于对空时码技术和turbo迭代译码的深刻理解,致力干将turbo迭代译码技术应用到空时码中,采用简单的成员码简化系统设计,以较低的译码复杂度达到高编码分集增益,并且力
企业净有效汇率的改变会对企业利润产生不同的影响,本文从净有效汇率变动、有效汇率变动对企业利润的影响和企业净有效汇率变动对不同企业利润影响展开探讨.
[目的]:  呼吸运动是放疗过程中面临的主要挑战,通过往肿瘤内或肿瘤附近植入标记点的跟踪方法虽然可以有效的避免呼吸运动的影响,减少射线对周围正常组织的损伤,达到精确放疗的