论文部分内容阅读
目前,发票报销依旧以人工报销为主,并且工作效率低,流程长,耗时多,易出错。与此同时,经济的增长也促使了票据和报销工作的日益增多。所以实现发票智能识别势在必行。针对这一课题,本文主要从发票分类和文字识别两方面来阐述如何实现发票智能识别。首先,本文对现有的文字识别和深度学习的现状进行简述,并在叙述了深度神经网络之后,搭建了AlexNet网络,进行发票数据集的训练,以实现发票分类的目的。而AlexNet网络和随机森林这两种架构都分别用于测试。其次,本文采用了完成发票中有效信息的定位以及对倾斜图像的校正的方法。基于图像增强的二次分割法用于实现发票有效信息定位与截取。第一步,对图像进行图像增强,便于后续的机打字符与印刷字符的分割,即第一次分割;第二步则是采用反色,开运算,最大矩形边界等图像处理方法进行信息截取,即第二次分割。而切斜检测和校正算法则用于检测大写金额字符的倾斜角,并校正图像。最后,本文搭建了深度卷积神经网络和残差网络架构,分别进行大写金额字符分类的训练及测试,最终实现大写金额数字的识别。在这个过程中还需对预处理后的大写金额采用投影变换将单行的大写金额切割为单个字符,即数据集的制作。在发票分类中,AlexNet网络和随机森林的分类准确率分别为92%和94%。在大写金额的识别中,深度卷积神经网络和残差网络的识别准确率分别为97%和99%。本文中的智能识别方法不仅可以应用于发票报销中,还可以应用于档案数字化等其他领域。