论文部分内容阅读
人工神经网络发展到今天,已有五十多年的历史,在一代又一代学者的不懈努力下,不但理论基础逐渐充实、成熟,而且在信号处理、计算机视觉、模式识别、专家系统、工业控制与气象预测等许多领域有了广泛的应用。神经网络模式识别方法是近几年兴起的模式识别领域的一个新的研究方向。神经网络模式识别系统的研究,无论对神经网络理论的发展,还是对模式识别技术的实际应用,都有特别重要意义。 BP网络是当前应用最广泛的一种人工神经网络。已被人们广泛地应用于神经网络模式识别(特别是图像及字符的识别)问题。 Kohonen提出的自组织特征映射(Self-Organizing Feature Map)神经网络(SOFM)因具有较强的拓扑组织能力和抗干扰能力,也广泛地应用于神经网络模式识别领域。 本文的工作主要是以下两个方面,分别侧重于有关神经网络的数学理论及实际应用。 1.广义逆矩阵在如神经网络计算等方面有广泛的应用。但在国内文献中尚未见到对此概念的清晰而简明的表述。在文献[3]中,以线性变换广义逆的形式讨论了广义逆矩阵问题,用到的工具主要是张量概念及记号等抽象代数方法。这些工具比较生僻难懂,而且不便于直接应用。 本文用矩阵及R~n中向量内积这样一些简单而实用的数学工具,给出广义逆矩阵概念的一个统一而又简洁的描述。我们首先定义广义左逆(§2,1)及广义右逆(§2.2),然后在此基础上定义广义逆(§2.3)。在§2.4中指出如何用特征元素表示广义逆矩阵。广义逆矩阵的一些性质在§2.5给出。最后,我们在§2.6讨论广义逆矩阵在神经网络计算中的一些应用。 2.神经网络被广泛用于模式识别问题,特别是用于各种字符的识别(OCR)。然而,一方面,目前的很多研究工作都是在假设已经对字符等符号正确分割的前提下进行的,是针对单个字符的,而且对初始条件有着严格的要求:另一方面,专门针对数学公式的分割与识别的研究工作也较少。而这两方面恰恰是神经网络模式识别要达到实际应用阶段所必经的两个关键步骤。 中文摘要 本文基于BP神经网络和Kohonen的自组织特征映射网络(SOFM)两种网络和矩方法,设计出一个数学公式的分割与识别系统,完成从接收扫描而来的数据,经过图象的预处理。字符的分割,字符的识别到字符的重组等4个阶段的任务,实现数学公式处理的自动化。 在第三章,对扫描文档的进行前期处理并在此基础上进行分割识别系统中的关键一环——数学符号的分割。针对数学符号的复杂性,采用三种不同的分割方法,对原图自上而下,自左而右的遍历,不断进行边缘检测和分割。 与其他学者的一些工作相比,本文侧重于特定的符号集——数学符号,并在相对大的样本集合上进行分类(共1:34类样本),因此在第四章采用了多级神经网络。在模式的特征提取上,采用描述区域形状特征的矩不变量与具有强大的分类能力的BP网络相结合的方式,具有一定的抗干扰能力。而且,本文的处理是从扫描的输入开始,一直处理到最后电子文档的形成,因而具有更高的实际应用价值。 由于特征提取技术的局限性及算法的不成熟,本文的系统模型距离成熟的实用阶段还有很长的一段,有待子进一步的改进提高。但是我们的实验结果表明,神经网络可以成功地用于数学公式的识别问题。