基于多种上下文信息的联机手写中文文本识别方法及系统实现

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:jo0909
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在移动互联网时代,智能手机越来越普及,手写输入方式也得到更多用户的关注。与此同时,手写输入法等相关应用也对手写文本识别技术提出了更高的要求。鉴于此,本文对手写中文文本识别方法进行研究,并针对现有技术的不足提出相应的改进措施。本文主要工作如下:1)本文收集并整理了一个手写中文单字数据库:SCUT-onHCCTest DB。该数据库书写风格多样,且包含了9798个类别(包括196个符号和785个生僻字)共45万个样本,其分为简体中文集、繁体中文集、简繁混合中文集、生僻字集和符号集等5个子集。该数据库可用于手写中文识别、手写文本切分算法等多方面的研究。2)在重叠、文本行手写模式下进行单字输入,单字可能被过切分算法误切成多个片段,最终导致识别率的下降。为此,本文提出二元类别无关几何模型来改善这种情况。实验表明,在重叠、文本行手写输入模式下,二元类别无关几何模型使得单字被误切分的概率分别由11.51%、27.68%下降到3.89%、4.40%;单字首候选正确识别率分别由90.07%、81.27%提升到93.63%、93.88%,其对应的相对错误率比例(RERR)分别达到65.61%、88.68%。实验也表明,二元类别无关几何模型优于线密度模型。3)针对传统基于文件查表方式的联想词和N-gram语言模型的局限性,本文构建了基于长短时记忆递归神经网络(Long-Short Term Memory Recurrent Neural Network,LSTM)的语言模型。通过改进,模型在SogouCA语料库上取得25.32的混乱度。实验表明,LSTM语言模型在联想词方面优于传统的方法,同时也能提升手写文本识别系统的整体性能。4)本文提出了无约束手写输入模式,实现单字、重叠、文本行手写输入三个模式的统一。其核心为两级切分网络的实现。实验结果也验证了本文方案的可行性。最后,本文将该方案应用到SCUT gPen手写输入法和慧笔手写输入法上,每天为超过8万用户提供服务。
其他文献
随着煤、石油、天然气和其他化石燃料的大量消耗,能源短缺问题显得日益突出。因化石燃料的消耗而产生的环境污染问题已经引起全世界的关注。节能减排在推动能源可持续发展方
物联网概念自提出至今,其概念内涵在不断发生变化。目前,普遍认为物联网基本功能是实现万物相连。从物联网的基本定义可知,物联网中的物联网设备多种多样,物联网所感知的环境
目的:探索动态对比增强磁共振成像(DCE-MRI)技术结合以整个肿瘤体积为基础的直方图(Histogram)分析方法在脑胶质瘤分级中的应用价值。材料与方法:回顾性分析50例经过DCE-MRI
最优解一直是人们在工程项目中追求的目标,但随着人们研究的问题越来越复杂,规模越来越大,约束条件也越来越多,求解最优解变得愈发困难,如动态规划,组合优化随着问题规模的增
合成孔径雷达(Synthetic Aperture Radar,SAR)是一种高分辨率成像雷达,它具有全天候、全环境的工作能力。基于高分辨率SAR图像的目标识别技术在军事侦察、矿藏勘探、环境监测
随着三峡库区蓄水量增加,水体的自净能力降低,库区水环境状况正呈逐步恶化的趋势,库区水环境安全问题已经引起了国内外广泛关注。目前,现有的监测设备、方法和手段已经不能满
一般既定场景的仿真不能展示实时的网络态势,无法提供实时评估,如战时网络性能评估等等。这样的不足对战场网络的评估非常的不利。因此动态网络仿真成为了一个研究热点。但是
为满足未来航空地空通信系统持续膨胀的航空旅客通信需求,开展新一代民航地空宽带数据链路的相关研究势在必行。基于OFDM(Orthogonal Frequency Division Multiplexing,正交
背景众所周知,癌症患者日益增多,各种治疗手段层出不穷,目前化学治疗仍然是一种常用的手段。蒽环类抗肿瘤抗生素是目前应用和研究都较多的一类药物,而多柔比星(doxorubicin,Do
目的:比较多模式镇痛背景下鸡尾酒疗法与神经阻滞在全膝置换术后疼痛控制、膝关节被动活动度、术后引流量以及术后住院时间等方面的差异,评价两种镇痛方法在人工全膝置换中的