基于字型特征的脱机手写体汉字多分类识别的研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:gl5458
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
脱机手写体汉字字符集具有数量大、结构复杂、相似字多和无规则变形严重等特点,使得脱机手写体汉字识别成为字符识别领域中最大的难题和最终的目标之一。而人类视觉感知是一个鲁棒性很强的、能抵御实际中各种变形和噪声干扰的具有良好容错性的文字识别系统。近年来,围绕仿人脱机手写体汉字图像识别的研究在很多方面已取得了重要进展,但在特征使用和识别方法上如何提高机器仿人识别手写体汉字图像的灵活性仍是值得研究的方法之一。 本文在对目前广泛采用的一些识别方法与前人工作进行了认真的学习和总结的基础上,做了一定的研究和实验工作,得出了一些有用的结论。 本文的主要工作如下: 1.手写体汉字图像的多模态识别。提出了一种图像汉字字型结构和部件繁简度的分类方法,给出了字型结构度类型的编码、汉字字型结构分解算法以及汉字部件繁简分类特征算法,实现了手写体汉字的字型结构度和部件繁简度的分类和提取,实验结果表明是可行的。 2.基于字型结构特征的仿人汉字识别系统设计。该系统采用决策控制级和模式识别级二级并行式结构,决策控制级根据辨识出的汉字模态选择最佳的识别策略和参数,模式识别级依据识别策略进行多分类匹配识别,有效地提高大类别汉字的识别率,提高汉字识别系统的实用性。 3.手写体汉字细分类识别法的原理介绍和特点分析。从统计和结构模式识别法出发,对实验室前期的研究成果-小波网格法、基于双权值椭圆神经元的仿生模式识别法、八形编码法和基于过程神经元笔段提取法的原理进行了分析,根据每种特征各自特点,选择最佳的识别策略和参数,实现多分类匹配识别。 4.二层三段式识别系统的应用。选取SCUT-IRAC手写体汉字库中的手写体汉字图像,以VC++和MATLAB6.5编程语言为实现手段,对多种类型手写体汉字图像(简单单部件、复杂单部件、左中右结构、左上下结构等)进行了验证实验。 本文研究表明:基于手写体汉字字型分解的多模式识别系统能够有效的对待识别汉字图像进行粗分类判断、最佳识别方案决策及多分类匹配识别。实验结果表明,该方法能够模仿人类对手写体汉字的繁简度和结构度的整体性和可分解性识别过程。
其他文献
作为企业计划层与现场控制层之间的“信息桥梁”,MES(Manufacturing Execution System,制造执行系统)对解决企业管理系统与基础自动化系统之间的“信息断层”问题具有重要的
由于指纹的唯一性、不变性的特点,指纹识别技术成为最可靠、最成熟的生物识别技术,并越来越广泛地应用到各种领域。目前自动指纹识别系统大多是基于PC平台的,但随着时代的发
近空间可变翼飞行器可在近空间区域飞行,它可通过改变机翼外形从而改善飞行器的性能,使飞行器更好的满足任务需求,因此对近空间可变翼飞行器的研究是航空航天领域及控制领域研究
煤矿主通风机作为其通风系统的关键环节之一,具有“矿井肺腑”之称。如何及时发现故障征兆,准确判断风机运行状态,并对出现的故障进行准确的分析,已成为煤矿主通风机故障诊断
变异测试是一种有效的软件测试方法,但高昂的测试代价,使其可行性和应用范围受到很大限制。消息传递并行程序是一类应用广泛的并行程序。为了保证该类程序的可靠性,有必要对
本文在分析国内外氧化锆氧量分析仪表发展现状的基础上,综合应用新型微处理器、计算机软硬件及现场总线技术,开发了基于CAN总线的智能氧化锆氧量分析仪表。为增强系统开放性、可靠性和通讯功能,首次将CAN总线技术应用到氧化锆氧量分析仪表系统中。系统采用模块化设计方法,采用新型的单片机C8051F040作为系统中央控制器,使系统扩展的外围电路及接口电路数量少,系统的可靠性及稳定性提高,系统功能扩展及软硬件升