文档介绍:一种动态的汉字笔段提取方法摘要:提出了一种笔段提取新方法,充分利用了撇笔段和捺笔段的轮廓规律,在提取笔段过程中动态改变寻找方向,使提取正确率进一步提高。实验证明了算法的有效性,与传统笔段提取算法相比,%%以上,为汉字识别创造了更有利的条件。关键词:汉字识别;笔段提取;字符点阵??中图分类号:TP391文献标志码:A文章编号:1001-3695(2008)07-1998-03??DynamicstrokeextractionalgorithmforChinesecharacters??SHIWei,FUYan,CHENAn??long,ZHOUJun??lin?ぃ?UniversityofElectronicScience&TechnologyofChina,Chengdu610054,China)??Abstract:AnewalgorithmwasdesignedforChinesestrokeextraction,%%.??Keywords:Chinesecharacterrecognition;strokeextraction;characterdot??matrix?お?方块汉字已有数千年的历史,也是世界上使用人数最多的文字,对中华民族灿烂文化的形成和发展有不可磨灭的功勋。在当今的信息时代,让计算机自动识别汉字意义尤为重大。近些年,我国工对汉字的处理相继做了不少卓有成效的研究工作,但识别的正确率仍不能满足现实的需求[1]。??汉字识别的方法分为结构方法和统计方法,结构方法的优点是对类别规模大、结构复杂、相似模式多的汉字识别效果较好,所以得到了广泛的关注和研究。采用结构方法识别汉字的关键一步是提取基元,基元提取的正确率直接影响了汉字识别的正确率。结构方法中选择的基元可以是部件、笔划、笔段。其中笔段是底层基元,部件和笔划可以由笔段组合而成。目前,汉字笔段提取方法有细化法、轮廓信息法、数学形态法、小波分析法、行程长度法和段化法等。细化法可能造成图像畸变,难有很高的正确率,且比较费时;小波分析法还不够成熟,目前还没有高效的算法;轮廓信息法、数学形态法和行程长度法对字体和字型的适应性较弱[2]。??段化法是基于点阵图像行列连通像素提取笔段,与上述方法相比有自身的优点,对汉字的字体和字型变化的适应能力较强。但传统的段化法在提取基元的正确率还有待提高,本文提出了一种动态笔段提取算法,主要目的是进一步提高提取基元的正确率,充分利用汉字笔段外围轮廓的一阶微分,发现其边界特征,在寻找撇笔段和捺笔段时动态调整查找优先级,而不是简单地在45°、135°方向上查找[3]。这与传统的方法相比有明显的优越性,使提取结果更切合实际。??1基本定义??本文提出的算法是以点阵图像行(列)连通像素之间的关系为基础,为便于叙述动态