论文部分内容阅读
随着计算机技术的进步,近年来人机交互技术开始向着使得交互更加自然、高效的方向发展。最近几年出现的语音识别、手势识别等交互方式,让人们摆脱了传统交互设备的约束。空中手写作为一种新型的人机交互方式,使得书写方式不再依赖于传统的纸笔或触摸板。手写汉字识别属于超多类模式识别问题,经过多年的研究手写汉字识别技术已日臻成熟。而空中手写汉字由于类内字形的变化更大,因此在识别上有更大的难度,目前对于空中书写汉字的识别研究处于起步阶段。本文针对空中手写汉字识别问题进行研究,并取得了如下的研究成果: 1.实现了一种空中手写汉字的数据采集系统。该系统基于Leap Motion三维传感设备进行空中书写轨迹的捕捉。本文基于该系统构建出空中手写汉字字符数据集IAHCC-UCAS2014。该数据集涵盖了所有GB2312-80标准中共3755个一级汉字类别。通过对数据的整理和验证,保证了数据集的有效性。 2.实现了联机手写汉字识别的基本模型中涉及到的典型方法,并将这些方法在空中手写数据集上进行评估,实验结果表明空中手写汉字识别问题相对传统联机手写汉字识别具有程度的挑战性。本文同时提出了一种特征融合的方法,通过将方向相关的特征进行串行融合,获得了更具有区分性的融合特征。 3.提出了一种适用于空中手写汉字的样本联机生成方法,该方法用于根据原训练样本产生大量的虚拟样本。该方法在书写轨迹级别对原训练样本进行扭曲操作,实验结果显示该方法能够有效地达到丰富训练集的目的。 4.提出了一种根据相似汉字类别信息进行区分性识别的层次分类器。该分类器主要针对空中手写汉字识别中相似汉字区分的难点,利用了原型学习和自适应的鉴别局部排列两种基于相似字信息的区分性方法以改进现有分类器。实验结果表明该分类器在首字识别精度上有着一定的提升效果。