论文部分内容阅读
笔划代表着汉字的内部特征,笔划穿越次数是对笔划进行全穿透,但是,全穿透在粗分时区分汉字的能力不是太强,增加了二级识别的工作量。本文除了提取笔划全穿透外还提取笔划半穿透,并把半穿透的次数进行重新组合形成新的特征值。把全穿透和半穿透结合起来作为汉字的特征值,对汉字进行粗分,粗分不能区分的汉字,采用四个角的能量值密度特征对汉字进行细分。实验结果表明了该方法的有效性,与单独使用全穿透方法相比,本文提出的方法在粗分时区分汉字的能力大大增强,减少了二级识别的工作量。