数字图像中文字检测抽取与退化字符识别

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:ttt11121
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
字符识别的研究近年来取得重要进展,目前字符识别方法可以很好地处理背景干净、清晰的字符图像,但对于复杂背景下的、低质量图象的退化字符识别并未获得满意的解决方法。日前有两大问题成为字符识别研究的难点和应用的瓶颈:一是复杂背景下的字符识别,这就需要图像中文字自动检测和文字提取系统将文字从复杂背景中检测提取出来,送入OCR系统进行识别;二是低质量图象的退化字符识别问题,字符图像中存在的字迹模糊、笔画粘连、断裂、分辨率低等退化情况,都大大增加了字符识别难度,这就需要从理论和方法技术上给与有效的解决办法。本文围绕着图像中文字检测和低质量退化字符识别问题开展了相关的研究工作,主要的研究工作包括:   1.在综合集成方法论的指导下,提出了基于多种特征集成型图像中文字检测方法,并建立了相应的图像中文字自动检测系统。根据文字的多种特征,将多种特征融合集成,提出基于多种特征集成型的文字检测方法,适应各种复杂图像中的文字检测,从而提高图像中文字检测系统性能,这里用到了颜色特征、边缘特征、纹理特征及文字本身的一些特征;并且根据文字特征和计算的复杂度,设计多级文字检测器,将多级文字检测器有效地集成连接,每级文字检测器根据上级检测结果选择适合的特征,并用相关处理方法进行检测,逐级修正和精确检测结果,有效地防止漏检、误检现象的发生,提高系统性能,增强系统的稳定性。   2.针对低质量退化字符识别问题,提出了一种字符图像分辨率质量判别方法,并建立了相应的字符图像分辨率判定系统。对不同分辨率图像质量的字符图像,提出了灰度分布特征,基于这种灰度分布特征对各个图像质量级别的字符图像进行分辨率图像质量判定。这种方法计算简单,无需通过与清晰图像作对比,只需通过对训练样本分辨率图像质量学习,就可有效地对输入字符图像分辨率的质量进行判断。   3.本文将字符图像分辨率质量判定方法应用在多分辨率退化字符识别上,提出了多分辨率自适应退化字符识别方法,并建立相应多分辨率退化字符识别系统。本文将图像质量信息融进字符识别过程,采用集成型模式识别技术,构建多个分类器集成的网络弥补单个分类器识别率低、稳定性差的缺陷,提出了自适应识别分类算法,使识别率达到一个比较高的水平,初步解决低分辨率图像中退化字符识别的若干理论和技术问题。本文以智能理论和综合集成的构思为基础,开展多分辨率退化字符识别技术的研究工作,在国内是创新的,在国际是前沿的。这项工作的开展只是探索性的一小步,目前还处于研究的探索阶段。
其他文献
永磁同步电机(PMSM)由于其本身独特的优点,在数控机床,机器人等航天及工农业领域应用都非常广泛。所以,研究并制造出高性能,高可靠性的永磁同步电机交流伺服系统有十分重要的现实
学位
随着移动通信技术与市场的不断发展,移动数据通信已经成为数据通信发展的新方向。GPRS是在现有的GSM网络的基础上增加一些硬件设备和进行软件升级而形成的一个新的网络逻辑实
嵌入式实时系统是特定的计算机应用,它不仅必须满足各种逻辑关系,还必须满足指定的时间限制。除了高的可靠性和正确性要求,嵌入式实时系统大多都是异质的,特定的,设计具有这些特点
在信息技术与计算机科学迅速发展的今天,人们追求个性化,娱乐化,简单快捷的技术应用。声音转换或声音个性化技术就是这样一种能给人们带来全新体验的技术,它是当前语音技术研究的
永磁同步伺服电动机具有高速度、高效率和高可靠性等优点,同时还具有低噪音和低成本以及长寿命等特点。近年来,随着新材料的发展,永磁同步电动机得到了迅速发展,并得到了广泛
随着计算机的发展,数控技术也日新月异。基于PC的开放式数控系统可以充分利用PC机丰富的软硬件资源和适于PC机的各种先进技术,已经成为数控技术的发展趋势和潮流。 本课题
金融票据识别系统是当前文档分析与识别系统中的一个热点问题,包含票据分类、图像处理、字符切分与识别、以及文档图像压缩等一系列过程。本文对金融票据识别系统的多个方面进
石油加工过程具有参数多、随机干扰严重、非线性强、滞后大及时变性强等特点,难以建立精确的数学模型,而关键的油品质量及成份等参数无法在线监测,是一类典型的复杂工业过程。本
近年来,随着全球经济和信息技术的不断发展,安全问题日益突出,越来越多的领域需要可靠的身份识别。生物特征识别技术为此提供了一种解决方案,而指纹识别技术是其中的最佳选择之一