论文部分内容阅读
模式识别是研究如何在数据中对模式进行分类.它可以定义为经由不相关的细节背景提取出数据特征对输入数据进行分类的过程.本篇论文中提出了一个新的字符切割算法.算法依靠垂直投影直方图和特定的规则.这些规则依靠每一个阿拉伯字符的结构特征.切割算法得到的精确度达到了98.60%.本文的研究主要集中在印刷体阿拉伯字符,因为相同的字体不同的大小两个模式之间的变形是不重要的,所以训练模式的数量不用很大.字符分割算法的结果是所有的边都对准:上,下,左和右.这意味第一行是从分割图像的顶端直到最后一个黑像素,在其他的方向也一样.由于这些因素我们每个字符只用2种字体每种字体选用10个样本进行区分.这些样本中的每一个都代表一种字体的大小,包括12、16、20、22和24号字.实验中采用后向传播学习算法的多层感知器.输入层包含225个神经单元,这个数字是由所给模式的宽度和高度计算出来的.实验中,我们把给定的模式由实际的大小归一化为15*15像素.每一个像素都被认为是输入层的输入神经元.实验表明这个技术达到了很高的识别率98%.大部分的识别错误都是由分割错误导致的.为了减少(2.3节详解)BP算法所用来识别100个类别的学习时间,本文总共用16个BP神经元(BPNN).这16个BPNN被分为4组.根据阿拉伯字符的形状每一组包含4个BPNN.第一个被用来分离形状,第二个用来为开始形状,第三个是为中间形状,最后一个是为木尾形状.获得结果之后发现MLP的识别率要比HMM精确.这是因为MLP被用于识别的阿拉伯字符数量只有100个类别,这个技术依靠字符分割算法.同时HMM技术依赖于文本中词的数量.无论以何种方式增加词典中词的数量,HMM技术仍然更适合用作特殊的目的,例如银行数据库或者ID识别.未来的工作方向将侧重于增强的分割算法.