西夏文字识别研究

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:xinshouji1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文是在作者主持国家自然科学基金项目《基于汉字字形西夏文字信息处理》(No.69863002)课题基础上,对手写西夏字识别进行了系统的研究.该文所完成的主要工作和创新点如下:1.对西夏字的字量、字形、字义等属性进行了系统的分析,为西夏文字的信息处理 研究作了基本的理论铺垫.对西夏字I/O处理的数学模型进行研究,有助于西 夏文字信息处理系统数学模型的建立,有益于讨论西夏字I/O模块的结构、效 率和性能,并能进一步研究它们的规范化和标准化问题.2.对西夏字字形进行了结构分析、统计分析,还对其字形树结构进行了详细描述. 就西夏文字、汉字的混合编辑排版系统进行了深入的研究.提出的西夏文字四角号码输入方法的实施方案,解决了西夏字的键盘输入技术.同时还解决了西夏字字形的存储、显示和打印等问题,研制的夏汉混合编辑系统可用于西夏字、汉字的混合编辑、排版和印刷.3.对手写西夏字识别预处理进行了系统的探讨,其中包括二值化、西夏字的细化及平滑处理、版面的倾斜校正、西夏字的规范化处理以及西夏字文本的切分算法等问题.4.对西夏字的统计特征和结构特征进行了详细的研究和系统分析,提出了西夏字特征解决办法.5.将神经网络技术和传统的模式识别技术相结合,在第一级识别,系统采用了粗外围特征、粗网格特征、笔划密度特征和投影Walsh特征,对6000个西夏字进行了特征提取,取得了87.77﹪的识别率;在第二级识别,系统又设计了网格象素分布特征、轮廓方向特征、方向距离分布特征等三种互补的特征对相似的西夏字进行了再识别,取得了88.27﹪的识别率,提高了整体识别率.两级集成识别中提取到的特征中既包含有统计信息,又包含有西夏字的结构信息,各特征相互独立,具有一定的互补性.实验证明:走多种特征互补组合及多方案集成的道路,是提高识别率,使像汉字、西夏字这样的复杂文字识别走向实用化的有效途径.对笔划复杂的西夏字识别,不但要采用多种特征组合,还要避免特征维数过高,要采用适当的降维技术,即提高识别率也不影响神经网络收敛速度.
其他文献
该文共分五章,介绍依托项目中一套伺服系统的硬件结构、控制算法和仿真结果.其主要目的是推出一种高性能的实时伺服控制器,它结合了三模态控制和动态模糊神经网络控制,从而提
作为下一代互联网核心协议,IPv6的普遍应用和推广将是不争的事实.正因为如此,IPv6网络可管理性研究正变的迫在眉睫.该文从网络管理的一般性概念出发,介绍和分析了经典的网络
该文主要介绍了两种目标识别与跟踪技术:相关跟踪技术和特征匹配技术.基呆上关跟踪技术在图像灰度直方图的基础上寻找目标的最佳跟踪匹配点,跟踪灵敏高,定位精度好,硬件实现比
该项研究包括三个主要部分.第一部分介绍了运用新一代可编程控制器构建小型集散控制系统的方法.研究了回路控制和数据通信原理,实现一台上位机管理多台PLC,一台PLC控制多个回
论文主要研究遗传算法改进及其在控制系统中的应用.论文首先提出了三种改进遗传算法,包括:基于禁忌模式的自适应禁忌遗传算法、基于递阶理论的自适应递阶遗传算法和基于免疫
如今,以32位嵌入式微处理器为核心的应用系统越来越广泛,因为它的高速度和较大的内存单元可以满足苛刻要求的场合。然而这类产品由于它的成本高、资料少、开发工具少,使得它的普
该文主要是研究近红外漫反射光谱分析方法在发射药多组分过程检测中的应用,并利用不同的方法包括改进的方法对所取得的数据进行处理,建立了其定量分析模型.文中首先总结了中
论文首先分析了当前已有的各种二维、三维图像分割方法,总结了目前各类分割方法的优点和缺点以及针对三维图像分割的适应性.然后根据近二十年来国际上该领域的最新发展动态,
被动型铷原子频标是商业化最为成功的原子频标之一,其体积小、功耗低、成本低廉被广泛应用于精确授时、导航、定位、通信等领域。原子频标的光量子检测包含了光抽运、光检测、
学位