票据字符识别平台研究与实现

来源 :中国科学院大学(中国科学院长春光学精密机械与物理研究所) | 被引量 : 0次 | 上传用户:youi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
字符识别在现实场景中有着广泛的应用需求和研究意义。身份证的字符识别,银行票据的字符信息提取及录入,无不要求字符识别系统能够快速准确地将图像中的字符信息提取出来。本文以市场交易中常见的票据作为研究对象,探索票据图文识别的研究方法。通过成像设备获取的票据图像往往因为拍摄条件较差容易受到噪声干扰,获取到的图像也容易发生倾斜。首先,本文通过分析噪声的成因,采用去噪算法对图像进行还原操作。其次,为了将图像中冗余的信息去除,选择将图像进行二值化操作,二值化之后的图像从3通道彩色图变成灰度图,降低原始图像通道颜色的信息冗余。现有的目标检测算法在文本平直的情况下才能获得较好的检测结果。为了提高图像信息提取精度,本文对图像进行了倾斜校正。最后本文对票据图像进行版面分析,对票据不同的区域进行了分割研究,以便于对票据的关键信息进行提取。本文在文本检测算法中采用基于YOLO-v3的目标检测算法,在原始的YOLO-v3算法中融入空间注意力模块与通道注意力模块,加入空间注意力机制能使图像主体获得更高的权重,背景等内容将会获得较小的权重。通过加入通道注意力机制赋予各通道不同的权重,使信息量大的通道获得更大权重,更有利于图像文字特征的提取。同时,针对票据的图像特征,文本采用多尺度金字塔图像作为模型的输入,可以将图像的局部特征用简单的形式在不同的尺度上描述,进而提高模型的特征提取能力。本文对原始特征提取网络中的激活函数进行了改进,采用ELU作为激活函数。增加了Darknet-53卷积集合层的层数,由原始的3层卷积增加至4层卷积,提高卷积网络的特征提取能力。为了提高文本检测的速度,对YOLO-v3模型进行剪枝,将模型大小由原来的250M减小至43.9M,大大减少了模型的参数量,提高了检测速度。在文本识别模型中,对原始的长短期记忆网络进行改进,增加输入门到输出门的连接,并且将遗忘门和输入门合并成一个单一的更新门,由原本的长短期记忆网络遗忘门和输入门分别决定哪些信息该遗忘,哪些信息该记忆该保留变为遗忘门和输入门共同进行决策,以使输入状态更好地控制每一内存单元输出的信息。实验表明,本文对长短期记忆网络的改进模型提升了文本检测与识别精度。最后,文本将检测与识别算法流程串联起来,实现了一个票据图文端到端的识别系统。结果表明本文的方法在实际应用中是可行的。
其他文献
半夏为常用有毒中药,临床应用广泛,但半夏药材质量控制至今未见有科学、规范、客观量化的可控标准,本文对半夏药材的质量标准研究进展进行归纳总结,以期为半夏药材质量标准的
依据问卷调查、实地考察、座谈等方式所得资料,本文对武汉城市圈旅游资源结构、现有旅游形象与旅游形象竞争进行了分析,认为武汉城市圈旅游形象应定位于:荆楚文化与三国文化之域,中国近代历史大舞台,人文山水荟萃地,会议、商务与教育中心,休闲度假与购物的天堂。本文认为武汉城市圈塑造良好旅游形象还应通过资源开发与设施建设、完善识别符号、改善接待条件、规范服务行为等形象建设策略改善旅游形象,并通过各种信息传播渠道
随着能源消耗的日益增加,生态环境的不断恶化,气候变化问题急剧升温,可持续发展道路面临前所未有的挑战,基于此,低碳城市创建在国际上受到越来越多的关注。湖南作为"两型社会"建设试验区,开展低碳城市创建工作,紧跟国际发展趋势,符合国家战略要求,是推进"两型"社会体制机制改革的重要内容,是探索传统城市化向高效低碳经济模式全面转型的重要举措。洞察国际社会低碳城市的发展动向;明晰湖南低碳城市建设的现实基础;明