基于深度学习的较规则文本区域检测

来源 :长安大学 | 被引量 : 0次 | 上传用户:ll730520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于深度学习的文本区域检测的目标是从自然场景图像中定位并框取文本区域。图像中包含丰富的信息,文本属于其中的重要信息之一,准确地检测文本区域可以辅助计算机理解图像。获取图像中的文本信息并加以利用已经得到广泛应用,例如,视频、网页、字幕、截图、快递单、票据类、卡证类等对象上文本区域的检测和识别。图像中背景简单、任意方向的线性文本区域的检测已经比较成熟,线性文本区域可以采用四边形进行定位和框取。但背景复杂、非线性文本区域的检测还存在较大的局限性,其一,处于背景复杂的文本区域,难以分离出背景和文本区域,其二,四边形难以准确的框取形状为扇形或者弯曲的文本区域。无论是图像中规则的文本区域还是不规则的文本区域,本质上都需要检测并提取出高质量的文本区域像素点集。针对上述问题,本文进行了如下的改进:1.为了从图像中获取高质量的文本区域像素点集,本文将网络模型分为三个分支,第一分支使用去除全连接层的VGG模型组成全卷积网络(FCN)作为基础网络提取文本区域局部特征。第二分支在模型中补充全局信息,通过加入压缩激活模块(Squeezeand-Excitation Block,SE)学习了通道间关系,将学习的每一个通道上的全局信息补充添加到模型中。第三分支利用全卷积网络中不同尺度的Feature Maps构成特征金字塔,对不同尺度的Feature Map进行特征融合(Feature Fusion,FF),降低模型对于不同大小的文本区域的敏感度。针对模型中高层卷积块提取语义信息的上采样操作造成信息的丢失问题,本文使用三次卷积插值(Cubic Convolution)对Feature Map进行尺寸调整,在特征图合并过程中保证文本信息的完整性。最后对网络模型检测出的点集进行NMS筛选出得分超过阈值的点集作为模型最终的文本区域点集。2.利用模型中获得的像素点集进行自然场景中文本区域的框取,本文提出了基于四边形的线性文本框取算法和基于自适应点集数目(Number of Adaptive Point Sets)的多边形的文本框取方法。首先,计算文本区域内像素点距离文本框中左右边界的长度值,判断该值是否在浮动范围之内,将属于浮动范围内的像素点集坐标值进行加权平均可计算出文本区域的4个角点坐标。其次,任意方向的线性文本区域使用四边形即可较准确的框取出文本区域,针对不规则的文本区域,需要在左右边界的中间添加自适应数目的文本区域边界点,根据文本的弯曲程度,计算所需要的像素点数量,如果弯曲过大需要的点集数目较多,如果弯曲程度较缓,则增加较小的点集。最终,根据整理出的像素点集,依次连线进行文本区域的框取。本文提出FCN+FF+23SE文本检测模型可以应用在任意尺寸大小的图像当中,可以完成线性文本区域、较规则的扇形文本区域和弯曲文本区域的检测,在多个数据集上的精确度、召回率和速度等方面相较于其他模型都有所提升。
其他文献
目的 研究肿瘤标志物癌胚抗原(CEA)、糖链抗原(CA199)、鳞状细胞相关抗原(SCC)、细胞角蛋白19片段相关抗原(CYFRA21-1)单项检测及联合检测对食管癌的诊断意义.方法 选取2019年10月至2021年2月于河南科技大学第一附属医院确诊为食管癌的患者共75例,同期于我院体检的健康人群70例.采用电化学发光免疫分析法检测两组血清CEA、CA199、SCC、CYFRA21-1表达水平,食管癌组不同分期4种血清肿瘤标志物表达水平,食管癌组在不同分化程度中4种血清肿瘤标志物表达水平以及食管癌组4种血
目的 探究左舒必利联合抑酸药物在治疗胃反流性食管炎中的效果及对患者胃蛋白酶的影响.方法 将82例胃反流性食管炎患者依据随机数字表法分为观察组和对照组各41例,对照组接受抑酸药物治疗,观察组在对照组基础上加用左舒必利进行治疗,均治疗4周,对比两组治疗有效率、治疗前后食管动力学指标、胃蛋白酶(PG)指标、炎症因子水平,并对治疗前、治疗2周及治疗4周GerdQ评分进行对比,最后评估治疗不良反应发生率.结果 ①观察组治疗有效率95.12%,高于对照组的78.05%(P<0.05);②治疗后观察组食管括约肌压力较对
随着西部大开发战略的实施以及“一带一路”建设的迫切需要,西部山岭地区的开发建设日渐紧迫,西北黄土高原地区山高谷深,大地构造背景及地形地貌复杂,地质灾害频发。该地区在建设过程中不可避免的要修建大量的隧道和管线工程,隧道及管线的建设不可避免要穿越活动断裂区域。当隧道或管线工程穿过活动断裂时,上下盘错动将会导致管道(线)承受一定的挤压或拉扯作用,致使隧洞的线性构造发生变形而产生灾难性的破坏。而管道(线)
随着桥梁事业的大力发展,我国更加注重对桥梁的养护管理。桥梁裂缝作为桥梁最常见的病害和桥梁健康监测的重要组成部分,受到养护部门的重点关注。目前桥梁裂缝的检测主要靠人工巡检,这种方法存在危险性高,主观性高,可靠性差,检测效率低的问题。随着数字图像处理技术和深度学习的发展,采用这样的技术和方法实现桥梁裂缝的智能化检测,对提高裂缝检测精度和效率具有重要意义。由于桥梁表面环境容易受到光照、污渍、斑块、麻面、
软土主要分布在我国东南沿海地区,面积广泛,鉴于软土的工程特性,其沉降问题一直是持续研究的热点问题。因影响软土地基沉降变形的因素较多,且存在耦合效应,导致软基沉降计算方法较多,并有各自的优缺点。自适应应力及自适应剪应力是长安大学刘保健教授提出的新理念,已在黄土及红黏土等重塑土中进行了相关试验分析,在重塑土变形的分析与计算中具有很大优越性,但在原状土中尚未进行尝试。基于此,本文通过单轴侧限固结压缩试验