基于深度学习的发票识别系统

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:kwatog
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,发票报销依旧以人工报销为主,并且工作效率低,流程长,耗时多,易出错。与此同时,经济的增长也促使了票据和报销工作的日益增多。所以实现发票智能识别势在必行。针对这一课题,本文主要从发票分类和文字识别两方面来阐述如何实现发票智能识别。首先,本文对现有的文字识别和深度学习的现状进行简述,并在叙述了深度神经网络之后,搭建了AlexNet网络,进行发票数据集的训练,以实现发票分类的目的。而AlexNet网络和随机森林这两种架构都分别用于测试。其次,本文采用了完成发票中有效信息的定位以及对倾斜图像的校正的方法。基于图像增强的二次分割法用于实现发票有效信息定位与截取。第一步,对图像进行图像增强,便于后续的机打字符与印刷字符的分割,即第一次分割;第二步则是采用反色,开运算,最大矩形边界等图像处理方法进行信息截取,即第二次分割。而切斜检测和校正算法则用于检测大写金额字符的倾斜角,并校正图像。最后,本文搭建了深度卷积神经网络和残差网络架构,分别进行大写金额字符分类的训练及测试,最终实现大写金额数字的识别。在这个过程中还需对预处理后的大写金额采用投影变换将单行的大写金额切割为单个字符,即数据集的制作。在发票分类中,AlexNet网络和随机森林的分类准确率分别为92%和94%。在大写金额的识别中,深度卷积神经网络和残差网络的识别准确率分别为97%和99%。本文中的智能识别方法不仅可以应用于发票报销中,还可以应用于档案数字化等其他领域。
其他文献
不断改进重大主题报道一直是主流媒体无法回避的课题,当前,在做好媒体融合这篇大文章的同时,主流媒体必须根据受众主体地位显著提升的现实,在内容生产方面不断提升。《还看今
过氧化氢是许多氧化酶反应的副产物,也是一种重要的工业物质。为构建一种新的无酶电化学生物传感器并用于过氧化氢的检测,本文合成了还原型氧化石墨烯(rGO)-硫堇(Thi)复合材料并
下黄竹园金矿是老湾金矿成矿带的重要组成部分,文章通过对地层各组段和主要岩石类型中微量元素地球化学参数特征,以及异常元素空间分布、异常浓度分带、分带序列、元素对比值
本文针对平面度误差评定的特点,提出了将进化策略应用于平面度误差评定中的算法。该算法基于实数编码,采用(μ+λ)选择策略和高斯变异算子,即父代种群参与竞争,算法简单、鲁棒性
利用差示扫描量热(DSC)、热重(TG)和慢速烤燃试验,对比HTPB推进剂热分解和慢速烤燃结果,分析了HTPE推进剂的热分解特性与慢速烤燃行为的关系。结果表明,HTPE推进剂比HTPB推进