1 / 7
文档名称:

基于BP算法的数字字符识别技术的研究.doc

格式:doc   大小:32KB   页数:7页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于BP算法的数字字符识别技术的研究.doc

上传人:s1188831 2019/12/25 文件大小:32 KB

下载得到文件列表

基于BP算法的数字字符识别技术的研究.doc

相关文档

文档介绍

文档介绍:基于BP算法的数字字符识别技术的研究                         摘 要本文描述了数字字符识别的过程和步骤。采用带有动量项和自适应学****率的反向传播算法的人工神经网络来训练、识别理想信号和含有噪声信号的数字字符。通过比较测试结果得出对同一网络使用理想信号又使用带有噪声的信号对网络进行训练可使系统具有更强的容错性。   关键词神经网络;BP算法;有噪声的数字字符识别 1 引言   数字识别技术是图像处理领域中的一个重要研究方向。是计算机应用领域中的热点之一。它又分为在线手写体识别和离线手写体识别。前者系统通过记录手写数字的抬笔、落笔、笔迹上各像素的空间位置,以及各笔段之间的时间关系等信息,对这些信息进行处理,在处理过程中,系统以一定的规则提取信息特征,再由识别模块将信息特征与识别库的特征进行比较、加以识别,最后转化为计算机所使用的文字代码。后者相对于前者没有笔划信息,因此难度更大、应用更广泛,如银行票据、工商报表、财务报表、统计报表等各种表格系统,是目前研究的一个重点,也是一个难点。本文将介绍如何用神经网络反向传播算法(BP算法)实现离线手写体数字的识别。2 BP算法实现手写数字的简单流程   利用BP算法实现数字识别的简单流程为“预处理“和“BP字符识别”具体如图1所示。图1 BP数字识别   数字识别的前提工作是将视觉图像转化为可由计算机处理的二值图像,即用给定阈值法把图像中的像素根据一定标准化为两种颜色。但二值化的图像在很多情况下字体模糊,或出现杂乱散布的白点或黑点,给识别造成一定的困难,可采用梯度锐化的方法对图像进行锐化,使模糊的图像变的清晰,同时可以对噪声起到一定的去除作用。   由于识别时只能根据每个数字字符的特征进行判断,所以对锐化后的二值图像还需分割成单个的字符,对字符进行细化。常用的脱壳算法,即从字符的边界逐层移去黑点,直到寻找到一个集合,此集合与其边界相重合(即厚度为1或2)。为了对任意字符的特征提取,还需要对数字字符进行规范化处理,即把字符的尺寸变换成统一大小,字符位置(旋转、平移)纠正。不少人认为把每个字符图像规一化为5×9像素二值图像是最理想的,因为图像的尺寸越小,识别速度就越高,网络训练也越快。而实际上,相对于要识别的字符图像,5×9像素图太小了。规一化后,图像信息丢失了很多,这时进行图像识别,准确率不高。实验证明,将字符图像规一化为10×18像素二值图像是现实中比较理想的。从被分割处理完毕的字符中,提取最能体现这个字符特点的特征向量,代入BP网络之中,对网络进行训练。然后提取出待识别的的样本中的特征向量代入到训练好的BP网络中,就可以对字符进行识别。常用的特征向量的提取方法有逐像素提取法、骨架特征提取法、垂直方向数据统计提取法等。本实验采用的是逐像素提取法。3 BP神经网络结构与描述   BP网络是一种单向传播的多层前向网络。网络除输入输出节点外,还有一层或多层的隐层节点,同层节点中没有任何耦合。输入信号从输入层节点依次传过各隐层节点,然后传到输出节点。每一层节点的输出只影响下一层节点的输出。其节点单元特性(传递函数)通常为Sigmnid型   BP算法的基本思想是:对于一个输入样本,经过权值、阈值和激活函数运算后,得到一个输出,然后让它与期望的样本进行比较,若有偏差,则从