【摘 要】
:
字体设计技术的成熟与互联网的发展促进了字体的创新和传播。相应的字体识别技术在版面恢复、文档理解和字体版权保护等领域也越来越受到重视。传统的字体识别只关注少数几种
论文部分内容阅读
字体设计技术的成熟与互联网的发展促进了字体的创新和传播。相应的字体识别技术在版面恢复、文档理解和字体版权保护等领域也越来越受到重视。传统的字体识别只关注少数几种常用字体的识别,大量新字体的广泛使用带来了在较大规模的字体集上进行字体识别的需求。目前主流的汉字字体识别技术依据的是文本图像的纹理特征,只有个别方法利用汉字笔画的结构特征。 本文提出了一种基于笔端相似性的汉字字体识别方法来解决在较大规模的字体集上对单个汉字进行字体识别的问题。为了实现这一方法,本文解决了笔端结构的自动提取、笔端结构的相似性度量以及字体信息的紧致表示等难点问题。其中,笔端提取算法充分利用了形状的骨架信息来提取汉字字符中与字体信息紧密相关的笔画端部结构:将骨架的端点作为笔端的起点、将骨架分支作为包含笔端的主要结构、骨架点的半径用来确定截断位置以及使用中轴变换的逆变换来恢复笔端形状;笔端的相似性度量方法结合基于轮廓的描述子与基于骨架的描述子共同描述笔端形状,并用向量空间中的距离度量来定义笔端之间的相似度;在这个相似性度量的基础上,字体信息表示为特征笔端的集合,待识别汉字的笔端类别由距离最近的特征笔端所属类别决定,而最终待识别汉字的字体由提取出的笔端投票决定。实验证明,本文的笔端提取算法提取的笔端与人类视觉感知到的笔端结构相近,并且具有区分不同字体的能力,基于这种笔端的字体识别方法不但在常用字体集合上的识别效果优于现有的同类方法,而且在扩展后的大字体集合上仍然能够达到较高的识别率。
其他文献
计算机的流体模拟已在计算机图形领域受到广泛的重视。基于光滑粒子动力学(SPH,Smoothed Particle Hydrodynamics)的实时可交互流体模拟的研究在动画游戏、虚拟现实等诸多领
在网络应用软件开发中,界面开发是一个重要环节,因为界面与最终用户直接相关。随着互联网快速发展,开发平台数量逐渐增多,不同平台的应用软件界面因为平台之间的差异往往需要
骨架作为一种简单有效的形状描述方法,已被广泛应用于计算机动画、图像压缩与检索、文字识别、电路板检测、机器人路径规划、以及科学与生物医学图像分析等领域。如何快速地
开源软件迅速发展,产生了大量优秀的软件制品,这些软件制品不仅被广泛应用到各个开源项目中,在商业领域也有越来越多的应用。一方面,开源软件所积累的大量软件制品为人们提供
随着航空航天技术的不断发展,航拍图像在军事侦查、地形绘制等方面取得了广泛的应用,由于航拍图像拍摄高度很高,图像上的一点误差对应到地面上可以造成几十米甚至上百米的误
无线传感器网络是当今计算机科学领域的研究热点之一,吸引了众多的工业界和学术界的研究者。无线传感器网络已经成为环境条件监测的主要手段之一,为连接真实世界与虚拟世界提
云计算是一种新兴的计算模型,它的出现为教育信息化提供了新思路,对建立灵活的资源共享平台,解决我国高校计算机实验室建设中存在的资金重复投入大、资源利用率低、维护难度高等
软件缺陷预测对软件测试开发有着非常重要的指导意义。在本文的研究中,我们首先提出了一种新的软件缺陷预测框架,该框架融合测试和预测步骤,使用人工免疫网络算法(artificial
植物的生长开放在自然界中是一个美丽的现象。花朵的开放,叶片的舒展等经常是以一种错综复杂的方式表现出来的,包括叶片的弯曲,伸展和各种扭曲变形。叶片通常是薄片结构并且