文档介绍:特征提取和特征选择在手写数字识别中的应用摘要手写数字识别的应用领域非常广泛。大部分领域都要求手写识别有较高的正确率和较低的误识率。同时,大批量数据处理对速度又有相当的要求,这就对识别系统提出了更高的要求,许多理论上完美但是速度过低的方法是行不通的。因此研究简单高效的手写数字识别系统依然是一个重要的研究方向。本文提出了一种基于特征提取、特征选择和神经网络的手写数字识别系统。通过特征提取和特征选择对原始数据进行处理,再将处理后的数据输入到神经网络中,经过反复训练得到了识别正确率较高的系统。为了提高识别正确率和识别速度,主要做了以下几项工作:⒄攵訩算子特征和卣鳎ü。经分析表明,每种特征所能降到的最大维数是一定的,这一维数足以表征每一个样本,同时又保证了使用的样本数最少。⒎治隽薆惴ù撤治龇椒ǖ娜毕荩岢隽艘恢諦惴的矩阵分析方法,它不但有利于整体明晰的看到影响突触权值修正的因素,而且还有利于算法的改进和编码实现。⑻岢隽艘恢只谖蟛詈薷牡腂慕惴ǎ笛楸砻魉在提高算法鲁棒性的同时还提高了样本的识别正确率。⑹迪至嘶谔卣魈崛⑻卣餮≡窈虰窬绲氖中词识别系统。实验表明,输入数据经过特征提取和特征选择处理后,可以使整个手写数字识别系统的训练时间明显缩短,而且识别正确率与原来相当。关键词:手写数字识别特征提取特征选择算法神经网络
知识水坝***@pologoogle为您整理
畁甅·瓵,..瑆.,,,:瓸琣甀瓵
知识水坝***@pologoogle为您整理
篐現瓵甀,,
本人签名:犀蓼苎互。日期:掣霉乒扣舀日期:立业£』壁唬本人签名:么望一丞日期:塑堕:喝本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所保密论文注释:本学位论文属于保密在一年解密后适用本授权书。非保密独创性虼葱滦声明成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或做的任何贡献均己在论文中作了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切相关责任。关于论文使用授权的说明学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。C艿难宦畚脑诮饷芎笞袷卮斯娑论文注释:本学位论文不属于保密范围,导师签名适用本授权书。’’一,。
第一章引言手写数字识别的研究背景手写数字识别研究的现实意义虺芆龇种В芯康亩韵笫牵绾卫玫缱用各个国家和民族的文字书写或印刷的文本信息,目前在印刷体和联机手写方面的“三金”工程在很大程度上要依赖数据信息的输入,如果能通过手写数字识别手写数字识另是光学字符识别技术计算机自动辨认人手写在纸张上的阿拉伯数字。数字的类别只有十种,笔划又简单,其识别似乎不是很困难。但事实上,一些测试结果表明,数字的正确识别率并不如印刷体汉字识别正确率高,甚至也不如联机手写体汉字识别率高,而只仅仅优于脱机手写体汉字识别。主要原因是:⒆中蜗嗖畈淮螅沟米既非帜承┦窒嗟崩眩⑹炙淙恢挥惺郑冶驶虻ィ皇中捶ㄇР钔虮穑澜各个国家各个地区的人都用,其书写上带有明显的区域特性,很难完全实现兼顾世界各种写法的极高识别率的通用性数字识别系统。⒃谑导视τ弥校允值プ质侗鹫仿实囊G蟊任淖忠?量痰枚唷U馐因为,数字没有上下文关系,每个单字的识别都事关重要,而且数字识别经常涉及到财会、金融领域,其严格性更是不言而喻的。因此,用户的要求不是单纯的高正确率,更重要的是极低的、千分之一甚至万分之一以下的误识率。此外,大批量数据处理对系统速度又有相当的要求,许多理论上很完美但速度过低的方法是行不通的【。因此,研究高性能的手写数字识别算法是一个相当有挑战性的任务。神经网络具有学习能力、泛化能力和快速并行实现的特点,可以用于解决以上问题。由岢龅亩嗖闱袄∩窬缒P汀捎诓捎梦蟛罘创ǖ腂学习算法,被称为网络。因其高度非线性映射能力,网络的应用极广。字符识别处理的信息可以分为两大类:一类是文字信息,处理的主要对象是的技术已经趋于成熟,并推出了很多应用系统;另一类是数据信息,主要是阿拉伯数字以及少量特殊字符组成的各种编号和统计数据,如:邮政编码、统计报表、银行票据等。处理这类信息的核心技术是手写数字识别。这几年来我国大力推广北京邮电大学硕上研究生学位论文特征提取和特征选择在手写数识别中的应用
手写数字识别研究的理论价值技术实现信息的自动录入,无疑会促进这一事业的进展