文档图象理解的研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:hijklmn123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文档理解的研究内容十分广泛,其研究领域主要涉及图象处理、图象分析、计算机视觉、模式识别等诸多领域.随着信息系统的广泛应用?它的研究逐渐引起国内外研究者的注意.该文深入研究了文档理解的基本理论和基本方法,针对文档理解提出了一些有益的思想和方法.针对文档版面的图文分割研究小组提出了以下方法:利用小波分析的多分辨率特性,对文档图象进行多分辨率分析;实现在不同层次对文档图象纹理理特性进行抽取;利用神经网络分类方法,对文档图象的纹理牧场生进行分类;通过定义有关偏移矩阵,提出了模糊综合软判决分类思想,进而最终实现对文档图象的最终软判决图文分割.所提出的方法与传统投影图文分割方法相比较具有以下优点;针对复杂非规则版面的文档图象,传统投影分割算法难以准确分割,而该算法能准确加以分割;传统图文分割方法中往往需要许多先验条件知识,应用往往受以一定的限制,研究小组的算法不需要许多先验知识,具有良好的有效性;对文档图象的变形和噪声的影响,该算法具有良好的鲁棒性.文档图象的倾斜校正方法的研究一直是OCR研究的一部分,在文档理解的研究中,文档图象倾斜校正研究同样具有重要的意义.传统的校正方法主要是投影法和基于Hough变换的校正方法,但是由于实际文档种类的丰富性和版面的复杂性,现有的算法很难满足实际的校正需求.该文提一种基于文档图象纹理方向分析倾斜校正算法,该方法主要利用了在文档图象中,文本所表现出的纹理方向,就是文档的实际方向,通过研究文档纹理的主要方向,获取倾斜方向,最后实现文档图象的校正.该方法在服现有校正算法的缺点,主要表现在:提高了倾角的校正范围;针对文本不占优的文档图象,同样能实现校正;版面复杂和丰富的文档,实际校正效果较为理想;算法的实际效率较高.实验研究表明,该方法具有良了的实用性,有效性和鲁棒性,而这种性能对于校正算法的实际应用是及其关键的.此外,针对版面分析的二叉树算法,提出了其版面分析的改进算法,提高了算法的效率.并给出了版面分析中的有关描述规则,进而,针对中文科学文献的版面结构的分析,提出一种一般版面版面描述模型,对版面分析和理解系统的自动化处理作了有益的探讨和研究.总之,正如傅京孙先生认为汉字识别在模式识别研究的独特地位一样,文档理解的研究是图象理解研究的一个特殊领域,具有重要的理论和实际意义.该文在大量文档图象的图文分割和校正实验基础上,验证了所提出思想和算法的正确性和有效性.
其他文献
黄芩为唇形科黄芩属植物。其根为常用大宗药材,具有杀菌、抗炎、抗过敏、降血压、降血脂和抑制癌细胞生长等多种功效。黄酮类化合物一黄芩苷、汉黄芩苷以及它们的苷元(黄芩素
中国是煤炭生产大国,提高煤矿生产企业的经济效益,对于国发生产具有重大意义.原煤的块主是影响原煤价格的主要因素之一,控制采出煤的块率一直是困扰煤炭生产企业的一个问题.
该论文即是关于直接序列扩频数据通信系统设计方面的研究.该系统设计以微型计算机作为数据终端,以高性能的16位单片处理器80C196KB为控制核心,以新型超大规模集成电路Z87200
该论文首先介绍了宽带无线接入的基本概念及当前国际上的发展状况,接着讨论了宽带无线接入的体系结构和基本接入形式,提出了宽带无线接入的整体目标概念,并在此基础上,明确了
学位
该文分析了中国宽带综合信息接入网的现状和目前急待解决的技术问题,提出了一种新的全业务综合信息接入网方案-IFTTB,并阐释了在成都市电信宽带综合信息接入网建设方面的研究
Bcl-2家族蛋白是线粒体凋亡通路的关键调节分子,其中仅含有BH3结构域的促凋亡成员BclGs(Bcl-Gonadshortform)在人的睾丸中特异性高表达,BclGs过表达可以BH3结构域依赖的方式诱
作为传统的自动诊断系统硬件部分的心电放大器往结构复杂,元器件众多而且体积庞大,该文的研究内容之一是运用多路开关技术简化同步十二导联心电放大系统的电路结构,以减小体
本文对汾河临汾段湿地植被数量生态学进行了研究。文章在野外调查的基础上,根据植物区系分析,汾河临汾段湿地植物共有111种,隶属于36科80属。在各类植物区系地理成分中,北温带分
分形理论自创立以来,在自然科学、哲学和社会科学等领域发展很快,具有非常广泛的应用,将分形理论应用在人脸识别中是一种新的思路和方法。分形方法对旋转、尺度变换、平移以