基于精细眼动追踪的场景文本识别系统研究

来源 :中国科学院大学(中国科学院西安光学精密机械研究所) | 被引量 : 0次 | 上传用户:gaoxiang19931030
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本信息广泛存在于路标、招牌、海报等自然场景中,这些文本是理解图像内容和提供信息的重要线索,所以对场景文本进行抽象识别已经成为一个新兴的研究热点。传统的利用相机进行场景文本识别的方法存在较大的局限性,使用起来不够便捷。而近年来眼动追踪技术的广泛应用使许多复杂的工作得到了简化,所以本文将眼动追踪技术与场景文本识别技术相结合,实现了一个基于眼动追踪的场景文本识别系统。在本文实现的基于眼动追踪的场景文本识别系统中,通过眼动追踪技术对使用者的凝视位置进行估计,同时利用文本检测模型对使用者视野中的场景文本区域进行检测,当使用者的凝视位置在文本区域内时,对相关区域内的文本进行识别,获取相关信息并反馈给使用者。针对现有的头戴式眼动追踪系统无法进行精细凝视位置估计的问题,以及采集的前景图像不够精细,导致对场景中的文本检测与识别准确率不高的问题,本文设计并实现了一个头戴式双目眼动追踪系统。该系统通过两个视场大小不同的前景相机捕获前景图像,大视场相机捕获整个前景,小视场相机捕获特定区域精细图像,再通过近眼红外相机检测出使用者的瞳孔位置信息,然后根据凝视映射模型,将瞳孔位置映射到前景图像中得到凝视位置,最后通过两个前景相机进行视野匹配,从而实现精细凝视位置估计与感兴趣区域图像的精细采集。实验评估结果表明,改进的双目眼动追踪系统相比于原始单目眼动追踪系统,准确度提升了22.7%,精度提升了18.4%,对场景中的文本区域图像的采集也更加精细。本文使用改进过的EAST模型和CRNN模型,经过自然场景图像训练后,分别对前景图像中的文本进行检测与识别,当使用者凝视前景中的文本区域时,将实时获得该区域的文本信息反馈。同时,本文采用相关滤波类的经典目标跟踪算法KCF算法对前景中检测到的移动的文本目标进行跟踪,同时针对KCF无法对尺度变化较大的目标进行准确跟踪的问题进行改进,提出了自适应的目标跟踪改进算法。实验结果表明,系统中使用的EAST文本检测模型,综合指标(F-Score)值为0.81;CRNN文本识别模型识别正确率为73%。改进后的自适用目标跟踪算法平均位置跟踪误差降低了23.9%,重叠率提升了46%。
其他文献
针对大型系统软件即服务层(Software-as-a-Service,Saa S)采用单体架构方案时开发难度高、耦合度高,以及可扩展性差和可维护性差的问题,设计了一种由工作流引擎驱动业务流程
本文主要从两类偏微分方程解的渐近性态研究有界区域上自治Cahn-Hilliard方程的指数吸引子问题.同时通过验证其存在吸收集证明了Cahn-Hilliard方程的指数吸引子的存在性.最后
21世纪是信息时代,科技的高速发展,计算机技术与网络技术引领了新的科技革命。诸如互联网电子教材、智能手机、数字电视等为典型代表的新兴媒体推陈出新。新媒体渗透到各行业各领域当中,我们已进入了新媒体时代。其中新媒体在教育行业也得到了广泛的应用。当前我国在教育教学方法上取得了很多成就,在传统教学理念基础上不断进行着新的发展尝试与改革。《国家中长期改革和发展纲要(2010-2020)》中指出“全力推动信息
CRISPR/Cas9是新近开发的一种基因编辑技术,由两部分组成,非特性的核酸酶Cas9蛋白和一个小片段导向RNA。鉴于CRISPR/Cas9系统结构简单,容易操作以及较高的基因组切割效率,已
硬脂酰辅酶A去饱和酶1(Stearoyl-Co A desaturase1,SCD1)是一种脂肪生成酶,是调节脂肪代谢的潜在靶点。SCD1可将脂肪酸从头合成途径产生的棕榈酸和硬脂酸去饱和生成棕榈油酸和油酸,通过调节不饱和脂肪酸的含量参与脂肪代谢。根据已有报道,SCD1基因可以同时受多个miRNAs的调节。但这些研究主要集中在人、鼠、鱼和猪等物种中,在绵羊中鲜有报道。因此,本研究旨在预测并验证与SC
近年来,随着“无人车间”、“智慧工厂”等概念的兴起,AGV被广泛的应用于周转配送、制造生产、智能安防等多个领域。本研究课题以浙江某企业智慧工厂的摩轮轮毂浇铸车间创新
目的:探讨外周血异型淋巴细胞的形态和比例特点及TB淋巴细胞亚群测定与成人非霍奇金淋巴瘤(NHL)之间的关系。方法:选取河北北方学院附属第一医院2017年9月-2018年9月收治的32例初诊的成人非霍奇金淋巴瘤患者资料(所有非霍奇金淋巴瘤患者均经过淋巴结病理确诊),其中男21例,女11例;年龄28~87岁,平均(60.59±11.98)。同期选择77例成人淋巴结炎患者的资料,其中男33例,女40例;
目的:对比不同方法构建累及主动脉弓部的主动脉夹层动物模型的有效性及安全性,探索构建主动脉弓部夹层(AAD)动物模型的最佳方法。对比AAD动物模型与真实世界人类AAD腔内血流动力学参数的相似性,评估该动物模型作为研究人类AAD实验平台的可行性。方法:(1)选用本地健康杂种犬共24条,24-30月龄,体重20-26Kg,随机纳入实验组(A)及对照组(B、C、D),每组6条。A组采用“经静脉切开针高压水
净水厂排泥水约占总处理水量的2%~8%,主要指沉淀池排泥水、滤池反冲洗水及混合排泥水。净水厂排泥水中污染物复杂,若将其直接排放,不仅浪费水资源,而且会对环境造成污染,因此,对排泥水的合理回用是水资源可持续发展的最终方向。本文以南方某净水厂的排泥水为研究对象,从物理、化学、生物三方面探究其水质特性,并通过烧杯试验和生产性试验对回用后的水质进行安全性分析与评价,在此基础上,针对风险较高的水样,进一步采
初中生数学认识信念潜移默化的影响着学生的学习,影响程度越来越大,可见,数学认识信念是影响学生在学习数学过程中不可忽视的因素。随着教育的不断发展进步,数学课程改革的逐渐深入,教师在课堂教学中对于学生数学认识信念的培养与建立极其关注,一个正确的数学认识信念有助于学生的数学能力水平的提高。这一领域也引起当今国内外学者的重视,国内外对于学生数学认识信念的研究主要探讨数学认识信念系统的构成及其与学生的学业成