文档介绍：收稿日期:2010-02-20基金项目:河南省教育厅自然科学基金(2009C520006;平顶山学院高层次人才科研启动经费(2008016作者简介:马飞(1980-,男,山东省鱼台人,平顶山学院软件学院讲师,硕士,主要研究方向:模式识别、,武楠2,程荣花1(,河南平顶山467000;,山东272300摘要:在手写体字符识别研究中,,,采用面积滤波对数字图像预处理消除离散点,使用进行了手写体数字识别研究与实现,分类器识别正确率为关键词:;.:A 文章编号:1673-1670(201002-0100-031引言手写体数字识别在过去的几十年里一直是模式识别领域的研究热点,在手写较多的领域如邮政编码、统计报表、财务报表、、学者提出了很多识别算法,但是很多只是停留在实验室中,由于书写风格的不同造成了各种字符变形,:一是统计特征,通常包括点矩、特征区域等;二是结构特征,通常包括圈、端点、拐角点、笔画、轮廓等[123].现有的识别方法很多,例如基于模板匹配或结构特征的方法、使用模糊推理的方法、基于矩和变换的方法、(粘带等操作出现离散的孤立点,:[step1]循环:扫描整个书写区;[step2]计算:根据8邻域像素点计算各连通区域的像素点数目,作为面积值s;[step3]判断:若面积值s≤Threshold(指定阈值,则使用背景色重绘当前离散点区;[step4]继续:跳转到step2;[step5]输出:滤波处理完成后,,得到了相对较为规整的数字图像,减少了干扰点源,, 含噪声点的图像图2 滤波后图3 区域定位图4 特征分割滤波处理完成后,,由于书写数字大部分情况都不能充满数字区, ,实现了一种弹性的归一化,不必用专门放大或缩小的方法作归一化,,,笔者采用5×5的模板[4]:水平方向上的间距为dh=(h2-h1/5(1垂直方向上的间距为dv=(v2-v1/5(2由于整个数字区域的水平距离、垂直距离很多时候不是5的倍数,会造成最后一列和最后一行的数据不能完全包括在内,,将前4×4d,,dh≤w<2的范围,dv≤h<2・××5=25维特征值,特征值的选取为每一个小区域中数字像素数与整个小区域面积之比,若大于给定的阈值Th=,便将此维特征记为1,,Fisher判别是一种有效的模式分类算法[5-6].它求出一个最佳分类向量,将原来高维的模式样本特征投影到最佳分类向量空间以达到减少特征维数的目的,:为得到最佳分类向量,需要计算各类别样品均值、样品类内离散度矩阵、总类间离散度矩阵、,将训练样品集进行投影到待求的直线方向上,然后求出边界点,最后将待测样品特征向已求出的直线方向投影,计算与训练样品投影点的边界距离关系,,而问题中要解决0~9中的10个数字的分类识别问题,所以需要构建10×(10-1/2=:[step1]均值:计算各类的样品均值:miNiΣX∈ωiX i=0,1(3其中Ni是对应ωi类中的样品个数,X为样品特征向量.[step2]离散度矩阵:对样品计算类内离散度矩阵SiSi=ΣX∈ωi(X-mi(X-miT i=0,1(4各样品的总类内离散度矩阵Sω:Sω=ΣSi i=0,1(5dd0-m101(6]:Fisher判别的目的是找一个W,:JF(W=a