论文部分内容阅读
文档理解的研究内容十分广泛,其研究领域主要涉及图象处理、图象分析、计算机视觉、模式识别等诸多领域.随着信息系统的广泛应用?它的研究逐渐引起国内外研究者的注意.该文深入研究了文档理解的基本理论和基本方法,针对文档理解提出了一些有益的思想和方法.针对文档版面的图文分割研究小组提出了以下方法:利用小波分析的多分辨率特性,对文档图象进行多分辨率分析;实现在不同层次对文档图象纹理理特性进行抽取;利用神经网络分类方法,对文档图象的纹理牧场生进行分类;通过定义有关偏移矩阵,提出了模糊综合软判决分类思想,进而最终实现对文档图象的最终软判决图文分割.所提出的方法与传统投影图文分割方法相比较具有以下优点;针对复杂非规则版面的文档图象,传统投影分割算法难以准确分割,而该算法能准确加以分割;传统图文分割方法中往往需要许多先验条件知识,应用往往受以一定的限制,研究小组的算法不需要许多先验知识,具有良好的有效性;对文档图象的变形和噪声的影响,该算法具有良好的鲁棒性.文档图象的倾斜校正方法的研究一直是OCR研究的一部分,在文档理解的研究中,文档图象倾斜校正研究同样具有重要的意义.传统的校正方法主要是投影法和基于Hough变换的校正方法,但是由于实际文档种类的丰富性和版面的复杂性,现有的算法很难满足实际的校正需求.该文提一种基于文档图象纹理方向分析倾斜校正算法,该方法主要利用了在文档图象中,文本所表现出的纹理方向,就是文档的实际方向,通过研究文档纹理的主要方向,获取倾斜方向,最后实现文档图象的校正.该方法在服现有校正算法的缺点,主要表现在:提高了倾角的校正范围;针对文本不占优的文档图象,同样能实现校正;版面复杂和丰富的文档,实际校正效果较为理想;算法的实际效率较高.实验研究表明,该方法具有良了的实用性,有效性和鲁棒性,而这种性能对于校正算法的实际应用是及其关键的.此外,针对版面分析的二叉树算法,提出了其版面分析的改进算法,提高了算法的效率.并给出了版面分析中的有关描述规则,进而,针对中文科学文献的版面结构的分析,提出一种一般版面版面描述模型,对版面分析和理解系统的自动化处理作了有益的探讨和研究.总之,正如傅京孙先生认为汉字识别在模式识别研究的独特地位一样,文档理解的研究是图象理解研究的一个特殊领域,具有重要的理论和实际意义.该文在大量文档图象的图文分割和校正实验基础上,验证了所提出思想和算法的正确性和有效性.