1 / 121
文档名称:

第11章 数字识别系统.doc

格式:doc   大小:933KB   页数:121页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

第11章 数字识别系统.doc

上传人:cjc201601 2020/8/5 文件大小:933 KB

下载得到文件列表

第11章 数字识别系统.doc

相关文档

文档介绍

文档介绍:,它通过对图片的一系列处理,最后识别得出图片中显示的数字。系统既可以单独使用,也可以把它作为一个识别系统的软件核心应用到车牌识别等系统中去。(1)输入图片中可以含有多个数字;(2)数字的识别准确率大于90%;(3)每张图片的处理时间(识别时间)不能大于1秒;(4)对图片噪声具有较强的适应性;(5)系统要能长时间无故障运行;(6)系统的操作要求简单。:比如灰度化、二值化、图像内容自动调整、去离散点、图像的缩放、细化、曲线平滑、曲线去枝桠操作等,最后还使用了神经网络对提取到的数字信息进行分析判断。,主要进行的都是图像处理,在这个过程当中要进行大量的数据处理,所以处理器和内存要求比较高,CPU要求主频在600hz以上(含600hz),内存在128兆以上(含128兆)。、Windows2000或者WindowsXP的机子上。程序调试时,需要使用MicrosoftVisualC++(SP6)。【\Chap11\】目录下。。,先分解成两个大块,就是图像预处理模块和数字识别模块。其中图像像预处理块在对图像进行了一系列变换后把最后提取到的数字字符提交给数字识别模块,然后进行识别并给处结果。在这里用到了很多先进的图像预处理技术及神经网络技术。-1所示。图11-1系统总流程图其中图像预处理的流程如图11-2所示。图11-2图像预处理流程图神经网络数字识别的具体流程如图11-3所示。图11-。在图像预处理的过程当中,我们采用了许多图像处理的技术,最后把每个数字的特征提取出来。这些技术包括图像数据读取、图像的灰度化、二值化、图像的调整、离散噪声点的去除、字符的切分、图像的缩放、字符的细化、字符的平滑、图像的求梯度等图像处理技术,最后是数字字符特征的提取。其结果再利用神经网络(这里我们选用BP网络)进行字符识别。利用神经网络进行字符识别的过程主要包括网络的训练、数据的读取、字符的判定、结果的输出。下面按照程序执行的顺序介绍整个程序并逐一分析每一步的关键代码。最后简要讲述一下程序的使用方法、注意事项以及本章小结。、保存与屏幕显示等基本函数要进行图像分析和处理首先就要得到图像的数据,这些数据包括图像的宽、高、每个象素点的颜色值。因为每种文件都有它自己的存放格式,下面简单介绍BMP文件的存放格式。本程序采用的输入图像即为bmp位图。BMP(bitmap的缩写)文件格式是Windows本身可以直接提供读取支持的位图文件格式。,,rle的意思是行程长度编码(runlengthencoding)。这样的文件意味着其使用的数据压缩方法是BMP格式文件支持的两种rle方法中的一种。BMP文件可用每象素1、4、8、16或24位来编码颜色信息,这个位数称作图像的颜色深度,它决定了图像所含的最大颜色数。一幅1-bpp(位每象素,bitperpixel)的图像只能有两种颜色。而一幅24-bpp的图像可以有超过16兆种不同的颜色。一个典型BMP文件的结构。以256色也就是8-bpp为例,文件被分成四个主要的部分:一个位图文件头,一个位图信息头,一个颜色表(又称为色表)和位图数据本身。位图文件头位图文件头包含关于这个文件的信息。如从哪里开始是位图数据的定位信息、文件大小等等。以下是位图文件头结构的定义:typedefstructtagBITMAPFILEHEADER{//bmfhWORD  bfType;DWORD bfSize;WORD  bfReserved1;WORD  bfReserved2;DWORD bfOffBits;}BITMAPFILEHEADER;其中的bfType值应该是“BM”(0x4d42),标志该文件是位图文件。bfSize的值是位图文件的大小。位图信息头位图信息头包含了单个像素所用字节数以及描述颜色的格式,此外还包括位图的宽度、高度、目标设备的位平面数、图像的压缩格式。以下是位图信息头结构的定义:typedefstructtagBITMAPINFOH