中英文混排名片识别系统研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:stenvenxin123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
名片作为个人信息方便简洁的常用载体,使用越来越普及,而名片的大量使用也造成了其信息管理上的麻烦。大量的名片信息如果通过人工录入的方式采集,不仅费时费力,而且也很难保证名片信息的完整性和准确性,所以名片信息的自动录入具有很高的实际应用价值。本文拟在完善一个中英文混排名片识别系统方面做一些研究和探索,主要研究名片的版面分析和中英文混排与不同字号字符混排环境下字符的切分以及信息分类的问题,同时改进和优化了现有的算法,以求整个名片识别系统更完善和高效。本文主要工作如下:(1)综合分析现有的图像预处理方法(重点是图像的二值化和倾斜校正),针对名片识别的应用,比较和总结了各种方法的优缺点并提出自己的方案。(2)分析比较现有的名片版面分析算法,提出了一种基于连通元和二分投影的混合型版面分析算法,较好地解决了复杂版面的划分和版块属性判定的问题。(3)现有的字符切分方法在中英文混排和不同字号字符混排情况下难以进行准确的切分。在分析了现有算法的原理和缺陷的基础上,提出了改进的基于全局特征抽取的中英文混排字符切分的方法,首先进行中英语言区域的判定和分离,然后针对不同的语言区域使用不同的切分算法,较好的解决了字符粘连和误分割等问题,有效提高了字符分割的准确率。(4)提出一种具有反馈机制的名片信息分类方法。在传统的基于语义理解的信息分类方法上加入版面分析的结果作为辅助决策因子,并将得到的分类结果反馈于版面分析和字符识别的环节,提高识别率的同时,增强了系统的自动纠错能力。实验证明,本文给出的方法能较好地解决中英文混排名片的识别问题。
其他文献
高光谱遥感图像包含同一空间位置较大数量的连续窄波段图像,是由二维空间信息和一维光谱信息组成的三维数据,在环境监测、地质调查等领域有着广泛的应用。噪声在高光谱图像获取的过程中不可避免地被引入,降低了图像质量并影响着之后图像处理应用的性能。因此,高光谱图像去噪是非常重要的图像预处理工作。最近,基于低秩近似和稀疏表达的高光谱图像去噪方法吸引了很多的关注。在高光谱图像中,全波段图像块(包含同一局部区域不同
三维无线传感器网络(Wireless Sensor Network, WSN)技术的瓶颈问题是能耗问题,而拓扑控制作为无线传感器网络的MAC层和网络层的运行平台,对无线传感器网络的能耗起着非常重
随着GPS设备的不断普及,基于位置的服务逐渐走进我们的日常生活。反向k最近邻(Reverse k Nearest Neighbor, RkNN)查询作为基于位置服务的支持技术之一,已经成为当前的一个研究
智能监视技术的广泛应用是为了防止异常行为的发生,而行人是这些异常行为的主要发起者。因受到衣着、光照、姿态等多方面因素的影响,行人检测是目标检测中的一个难点;同时,在目前
随着互联网的迅速发展和计算机应用普及,人们对IT产品的可信需求越来越高,其中软件安全性显得尤为重要。然而对于软件安全的研究多数集中在软件的实现过程中,致使软件需求阶
以网络为重要组成部分的计算机应用走到了一个空前繁荣的时代,各种新的应用环境、应用需求纷纷出现,在一些如搜索引擎、社交网络等大规模应用中,数据每天都在以极高的速度增长。
近年来,计算机技术和网络技术的飞速发展,为语音、视频等数据量大的多媒体信息的传播提供了广阔的平台。多媒体信息因其特有的形象、直观和生动等优点,使得人们对它的应用越来越
计算机网络技术的飞速发展,使得人们的生活发生了天翻地覆的变化,人们的生活越来越离不开网络的帮助。在这一过程中,网络的安全问题,尤其是入侵检测,始终是专家学者们关注的焦点。
日益增长的软硬件系统规模和系统可靠性需求对软件开发测试提出了更高的要求。其中故障注入是衡量系统容错能力和抗干扰能力的一种重要的测试手段,在系统中引入故障值或信号
随着物联网技术的崛起,条形码技术也在我们的生活中得到了越来越广泛的应用,大到物流运输、仓储管理,小到手机支付、数据下载,条码技术正与我们的生活日益息息相关,而实现复