论文部分内容阅读
在海量数据环境中研究模式识别(或分类)问题时,常面临具有如下特点的数据:表示该数据的特征空间维数高,样本数量大而且所涉及的类别数目多。为了解决这类数据的分类问题,在分类器的设计上,不仅要引入不同的分析与计算方法,特别是计算智能的方法,还要考虑它们之间合理的综合与集成。本文以神经网络和模糊数学两种计算智能方法为主要手段,研究和探讨大规模模式识别分类器的集成设计问题。并以脱机手写汉字识别问题作为应用的背景,因为基于脱机手写汉字识别是未来计算机智能接口不可缺少的重要组成部分,同时又由于手写汉字识别本身的复杂性,决定这类问题所涉及的分类边界十分复杂,因而成为研究大规模模式识别问题的典型代表之一。主要的研究工作如下:
(1)分析目前国内外神经网络与模糊数学两种计算智能用于模式识别的应用现状及其发展,研究和探讨两者在解决大规模模式识别问题的集成作用,说明大规模模式识别分类器设计中引入计算智能的必要。
(2)以张铃教授提出的自上而下的前馈神经网络设计覆盖方法为基础,研究和探讨模糊数学在神经分类器球面邻域交叉覆盖模糊化的处理方法,设计一种基于球面邻域覆盖的模糊分类器,并以脱机手写汉字识别问题验证分类器的性能。实验结果表明模糊覆盖方法对于解决大规模问题是很有潜力的。
(3)基于学习矢量量化算法LVQ在模式识别领域应用的广泛性,利用其最近邻分类准则,研究模糊数学引入以及实现局部化的处理,减小每个训练样本在参与距离计算时参考点数目,从而在不影响识别率的情况下缩短算法的训练时间。与传统的LVQ算法相比,在训练时间方面有一定程度的改进。
(4)针对大规模模式识别问题用单一的分类器很难得到理想的结果,本文进一步基于系统集成的思想,提出模糊粗分类的方法,并在此基础上构造了一个三级模糊集成分类器,3755个汉字一级字库的脱机手写识别实验表明集成分类器对识别问题性能改善,显示该分类器是解决大规模模式识别问题的一种有效方法。