【摘 要】
:
目前,我国在许多商业和政府机构、通讯、医院、保险行业中,票据处理是个繁重的劳动。长期以来,票据管理工作因管理手段落后,各类票据的打印、整理、装订和归档需要花费大量的
论文部分内容阅读
目前,我国在许多商业和政府机构、通讯、医院、保险行业中,票据处理是个繁重的劳动。长期以来,票据管理工作因管理手段落后,各类票据的打印、整理、装订和归档需要花费大量的人力和物力。同时各类票据凭证的事后监督与归档的分离也浪费了大量的人力和物力。为了解决票据处理带来的繁重劳动,充分发挥计算机的作用,本文以商业发票为原形,运用图像处理、模式识别方法,实现了一个完整的发票自动处理系统。对每一个流程模块进行了详细的讨论,并给出具体的解决方案。 首先对发票版面进行分析学习,确定其定域和变域及其相对位置、表格的尺寸、和兴趣区域等特征,形成不同种类发票的不同模版。根据发票的定位、发票的学习分析和模板的匹配,可以精确的定位出兴趣区域。 使用改进的Hough变换算法来对发票进行定位。在定位的同时,可利用Hough变换获得发票的倾斜角度,对倾斜角度过大的发票进行倾斜校正,有效地解决了发票倾斜对数字识别的影响。 着重研究了发票表格图像中手写体数字的无损脱框提取、对连笔数字的分割方法。运用数学形态学原理,对提取数字进行还原补偿和噪声处理。结合OPTA细化算法和Hilditch细化算法,使细化结果更加平滑规整。提取手写体数字的宏观统计特征和微观结构特征,并通过计算,去除伪特征。 根据不同特征,不同分类器的互补性,运用多分类器组合的方法,并结合了置信度理论,提出各类别置信度概念,反映了分类器把样本分为不同类别的可信度,根据分类器各类别置信度进行动态组合,充分发挥每个分类器在各自分类性能上的长处,提高了组合后的分类器识别率。 通过对发票中多点信息的分析比较,对识别结果进行正确性检测,有效的降低了识别结果的错误率。
其他文献
随着硬盘成本的降低和容量的增大,用户开始在个人计算机中存放大量文件。虽然大部分操作系统提供了文件搜索工具,但是它们单一、固定的功能难以满足用户对个人计算机中丰富信息
服务组合作为面向服务的计算(Service-Oriented Computing,SOC)和面向服务的体系架构(Service-Oriented Architecture,SOA)中的关键技术,一直以来都是服务计算领域倍受关注的焦
目前,随着互联网络的飞速发展,分布式拒绝服务(DDOS)攻击的危害日益严重,已达到泛滥的程度,DDOS攻击已成为互联网上最具威胁的恶意攻击之一。因此,DDOS攻击的检测和防御是当前安全
随着软件设计结构和代码的复杂化,在软件开发过程中,调试技术越来越重要。调试器,特别是源代码级调试器是目前最方便的调试方式,它可以提供程序源代码、栈、反汇编代码、断点、寄
Web服务具有松散耦合,互操行性强和平台无关等特点,是面向服务体系架构SOA的主要实现方式。基于XML的SOAP协议是Web服务的核心协议之一,它是独立于特定编程语言和平台的可扩展消
本文研究目的是在计算机和手持工具之间或者计算机之间实现数据信息同步时,对数据进行保护。为了验证此目的,运用两台计算机,其中一台配置成SyncML服务器,另一台配置成SyncML客户
随着计算机技术的不断发展,Web已成为人们获取信息的一个重要途径。由于信息技术的高速发展,Internet上的信息资源呈指数膨胀,面对海量数据人们不得不花费大量的时间去搜索、浏
概率主题建模是发现数据中隐藏的主题结构的一类方法。在概率主题建模中引入数据本身具有的标注信息,将无监督概率主题建模拓展成为监督概率主题建模,是概率主题建模的一个重要
本文介绍了一种新型时间自动机模型——有限精度时间自动机。它介于离散时间自动机和连续时间自动机之间,可以描述异步系统并进行相关性质的验证。所谓“有限精度”,是指有限精
数据中心能耗控制与应用服务质量(QoS)优化是当前云计算产业面临的关键问题。在保障应用QoS的前提下,优化整个数据中心资源组合与分配方式,将不同资源需求的应用程序环境(AEs)