1 / 14
文档名称:

文字识别.ppt

格式:ppt   大小:681KB   页数:14页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

文字识别.ppt

上传人:文库新人 2019/10/21 文件大小:681 KB

下载得到文件列表

文字识别.ppt

文档介绍

文档介绍:文字识别简介文字识别一般包括文字信息的采集、信息的分析与处理、信息的分类判别等几个部分。信息采集将纸面上的文字灰度变换成电信号,输入到计算机中去。信息采集由文字识别机中的送纸机构和光电变换装置来实现,有飞点扫描、摄像机、光敏元件和激光扫描等光电变换装置。信息分析和处理对变换后的电信号消除各种由于印刷质量、纸质(均匀性、污点等)或书写工具等因素所造成的噪音和干扰,进行大小、偏转、浓淡、粗细等各种正规化处理。信息的分类判别对去掉噪声并正规化后的文字信息进行分类判别,以输出识别结果。识别方法①模板匹配法将输入的文字与给定的各类别标准文字(模板)进行相关匹配,计算输入文字与各模板之间的相似性程度,取相似度最大的类别作为识别结果。这种方法的缺点是当被识别类别数增加时,标准文字模板的数量也随之增加。这一方面会增加机器的存储容量,另一方面也会降低识别的正确率,所以这种方式适用于识别固定字型的印刷体文字。这种方法的优点是用整个文字进行相似度计算,所以对文字的缺损、边缘噪声等具有较强的适应能力。②几何特征抽取法抽取文字的一些几何特征,如文字的端点、分叉点、凹凸部分以及水平、垂直、倾斜等各方向的线段、闭合环路等,根据这些特征的位置和相互关系进行逻辑组合判断,获得识别结果。这种识别方式由于利用结构信息,也适用于手写体文字那样变型较大的文字。模板匹配的流程建立标准模板库文字识别文字分割特征提取相似度比较模板比较和识别方法遇到未知字符则更新模板库标准模板库确定标准图像待识别图像的比较分辨率100×120文字读入与分割(1)读入图像并转换为灰度图将灰度图进行二值化文字读入与分割(2)对列求和,若为0则可以作为分割线横向求和,去除上下的黑边文字读入与分割(3)执行了分割对分割后图片使用matlab内置的imresize函数进行标准化模板比较和识别将输入图像与标准模板异或操作每个像素点的分量相加结果越小则匹配相似度越高模板库的更新异或结果均得到较大值时经过一定实验得到了一个经验值4000如果和所有模板的结果都超过4000,则认为匹配失败,需要更新