论文部分内容阅读
汉字风格的特征表达一直是研究者所关注的重点。不同于传统的汉字分层模型,本文在笔画层面提出了一种新的笔画段模型。该模型将笔画分为端部、拐角部、中段三种笔画段的组合。算法可以根据训练笔画图像对笔画段的形状进行切分、学习与存储,在不同场景的应用下可以将已知的笔画段进行拼接和重组。 个性化汉字数字墨水算法是笔画段模型的一个典型应用。在系统学习时,用户可以根据指定风格的少量训练字运用笔画段模型生成该风格的笔画段数据库;在进行书写时,用户可以选择已学习的任意一种风格,算法会根据用户输入的骨架生成带有指定风格的笔画形状。实验证明渲染结果在保留用户骨架风格的基础上能够很好地体现出指定的汉字风格。 完整笔画提取是笔画段模型的另一个应用。传统笔画提取方法对笔画形状,尤其是端部形状没有进行补全,只做了简单的切分。运用笔画段模型,算法可以在执行笔画提取时学习其他同类笔画的端部并生成数据库,之后对不完整的端部枚举数据库中的同类笔画段,选择最优的拼接形状作为对笔画形状的补全。算法对方正楷体与汉仪楷体GB2312字库进行了完整字库的实验,在补全完整笔画形状的同时也有着较高的准确率,验证了算法的有效性。