基于Leap Motion的空中手写汉字识别方法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:cynosure
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的进步,近年来人机交互技术开始向着使得交互更加自然、高效的方向发展。最近几年出现的语音识别、手势识别等交互方式,让人们摆脱了传统交互设备的约束。空中手写作为一种新型的人机交互方式,使得书写方式不再依赖于传统的纸笔或触摸板。手写汉字识别属于超多类模式识别问题,经过多年的研究手写汉字识别技术已日臻成熟。而空中手写汉字由于类内字形的变化更大,因此在识别上有更大的难度,目前对于空中书写汉字的识别研究处于起步阶段。本文针对空中手写汉字识别问题进行研究,并取得了如下的研究成果:  1.实现了一种空中手写汉字的数据采集系统。该系统基于Leap Motion三维传感设备进行空中书写轨迹的捕捉。本文基于该系统构建出空中手写汉字字符数据集IAHCC-UCAS2014。该数据集涵盖了所有GB2312-80标准中共3755个一级汉字类别。通过对数据的整理和验证,保证了数据集的有效性。  2.实现了联机手写汉字识别的基本模型中涉及到的典型方法,并将这些方法在空中手写数据集上进行评估,实验结果表明空中手写汉字识别问题相对传统联机手写汉字识别具有程度的挑战性。本文同时提出了一种特征融合的方法,通过将方向相关的特征进行串行融合,获得了更具有区分性的融合特征。  3.提出了一种适用于空中手写汉字的样本联机生成方法,该方法用于根据原训练样本产生大量的虚拟样本。该方法在书写轨迹级别对原训练样本进行扭曲操作,实验结果显示该方法能够有效地达到丰富训练集的目的。  4.提出了一种根据相似汉字类别信息进行区分性识别的层次分类器。该分类器主要针对空中手写汉字识别中相似汉字区分的难点,利用了原型学习和自适应的鉴别局部排列两种基于相似字信息的区分性方法以改进现有分类器。实验结果表明该分类器在首字识别精度上有着一定的提升效果。
其他文献
在计算机体系结构研究中,对内存系统的研究是非常重要的一部分,而访存trace的采集分析一直是必不可少的一环。HMTT就是一套基于硬件监听方式对访存行为进行监控分析的工具,相比
多核处理器的发展使得并行编程越来越流行。但是并行程序执行行为的不确定性,使得它们中存在错误难以测试和调试,这给程序员的工作带来巨大的困难和挑战。而且,隐藏在并行程序中
随着网络环境的日益完善和人们对分布式系统要求的逐步提高,作为分布式人工智能重要的研究领域,多Agent系统(Multi-Agent System)逐渐成为当前的研究热点。而多Agent系统协商
动物性食品中药物残留是近年来食品安全问题中最突出的问题之一,是困扰世界范围的难题。尽管国家加大了监管力度,但禽兽水产品致使中毒现象屡次发生,缺乏灵敏、准确、稳定、经济
二氧化碳浓度升高已导致全球气温明显上升,并带来其它一系列的环境变化,已引起了人类的高度重视。以区域甚至全球为中心的碳循环观测网络迅速发展起来,积累了大量的观测数据。采
近年来,海量小文件读访问时延大成为并行网络文件系统(pNFS)的主要问题。其原因有两点:一是元数据访问频率高、耗时开销大;二是IO粒度小、磁盘吞吐量低。针对上述问题,本文以pNFS
近年来,多核体系结构已成为处理器前沿研究的热点。比起单核处理器体系结构,多核处理器体系结构的仿真和验证技术将面临更大的问题和挑战。随着设计规模的不断扩大,两种传统的功
基于Gibbs抽样的贝叶斯模型选择结合先验信息,可以得到良好的估计与预测效果,从而受到各领域研究的重视。本文通过分析Gibbs抽样和Metropolis—Hastings算法构造转移核的本质,探
随着互联网的飞速发展,数据呈爆发式增长,企业为了节约成本、提高资源利用率,纷纷在数据中心部署云计算平台。相比于传统的部署方式,云计算对计算、存储以及网络资源进行统一分配
众所周知,数据挖掘是一个从海量数据中发现并提取隐藏的、前所未知的、有价值的信息或知识,然后利用这些信息或知识做出重要的商业决策的过程。因此,分析数据库、数据集市和数据
学位