文档介绍:中国科学院自动化研究所
硕士学位论文
基于HMM的脱机自由手写英文单词识别系统
姓名:梁佳玉
申请学位级别:硕士
专业:模式识别与智能系统
指导教师:刘迎建
20040101
摘要传递等等各方面都有着广阔的应用前景,因而吸引了很多的学者投文根据水平穿透数目动态确定滑动窗的宽度,不仅避免了宽度的经验取值,也在一定程度上克服了书写风格的差异造成⒈疚牡南低巢捎昧郊妒侗鸺友橹さ哪J剑谝患对诶肏识别的同时,由惴ɑ厮莸玫角叭龊蜓〉淖罴逊割。并将结果送到第二级,与惴ㄉ傻牟慰嫉憬衅手写英文单词识别,目前仍是文字识别领域的研究热点。不仅对砺郾旧恚故荋应用方面都有很大的促进作用。而且,脱机英文单词的识别无论在金融领域、邮政领域,还是信息的转化、本文首先介绍了近年来谕鸦中从⑽牡ゴ适侗鹬械挠用,然后在此基础上,设计并实现了一个脱机自由手写英文单词的识别系统。该系统基于⒉捎昧郊妒侗鸺友橹し绞健R韵戮是本文的主要工作:⒃谠ご斫锥危辛送枷竦亩祷⑷ピ肷⑶阈毙U以及参考线的提取等等。在参考线提取过程中,本文除了利用直方图外,还将它与垂直方向上水平穿透数的变化结合起来,可以相对准确的找到参考线;⒈疚氖褂昧肆阶樘卣鳎髯樘卣鞫纪ü暗姆绞教崛由于宽度固定的滑动窗对书写风格的依赖性很强,因此,本⒃贖识别阶段,本文采用模糊分割方式,单词模型由字母模型线性连接而成。由于字母本身的宽度不同,本文字母模型的状态数也不完全相同;配验证。然后将两次识别的结果集成,得到最终的输出;为了验证系统的有效性,本文在和教籽究矶煞进行脱机自由入其中。的影响;利用
上分别进行了测试,对多书写者和同一书写者这两种典型情况,结果都比较令人满意。关键词:中吹ゴ适侗穑琇摘要
.⋯·,猙瑆.—瑆,,,.:瑃,.,瓵瑆,..,
瓵琇琌甌....:.瑃瑃
虢三知笠芝:翮虢颦⒘ⅲ关于论文使用授权的说明伊中‘.独创性声明本人完全了解中国科学院自动化研究所有关保留、使用学位论文的规定,即:中国科学院自动化研究所有投保留送交论文的复印件,允许论文被查阅和借阅;可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。C艿穆畚脑诮饷芎笥ψ袷卮斯娑本人声明所成交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确地说明并表示了谢意。签名日期
第一章绪论模式与模式识别的运转并实现诸多功能,为何它们不能像人类一样,具有自主而广要想计算机去模拟人类的行为,那么首先就要实现人类简单的音,甚至是一张人脸等等,人类都能够迅速对其进行辨识并加以描述。这里所说的辨识。实际上就是一个模式识别的过程。模式识别就是将其归类。上面所列举的就是待识别的事物。通过模式识别,机器与外界以及机器之间的智能交流成为一种可能,由此计成为一门学科。目前,这一技术已在语音识别、图像识别、文字识别等等领域得到广泛、成功的应用:计算机自诞生以来,已经历了多年的风雨,从完成简单的运算功能,到现今的能够实现大型而复杂任务的系统,在每一个发展阶段,无不处处体现着人类高超的智慧和丰富的想象力。然而,人类仍在向着更深更远探索,既然简单电子器件的组合已经能够高速阔的想象呢4耍诙嗟难д咄度氲郊扑慊悄芑庖涣煊蛑欣矗并取得了相当多的理论与实际的成果。感官功能,比如视觉。一个指纹,或是一个手写单词,或是一段声算机的智能程度大大加强了。于是,世纪年代,模式识别发展模式识别有三类基本方法,即统计模式识别、句法峁模田凄式识射系统鹩基本构成第~章绪论
、手写体识别,数字、英文识别等等。其中,脱机自由手写英文单词识别以其风格各异、书写工具不同、动态信息有限、以及字符间的交错等较大的复杂性,成为凶罹咛粽叫缘难芯靠特征提取和选择以及分类器设计。预处理的主要目的是消除手写单用于脱机手写英文单词识别的特征有很多种,主要有:式识别和利用神经网络的识别。本文主要讨论统计模式识别方法。图卜允玖艘桓龌谕臣品椒ǖ哪J绞侗鹣低车目蛲肌它主要由霾糠肿槌桑菏莼袢。ご恚卣魈崛『脱≡瘢以及分类决策。数据获取是将输入对象通过测量、采样、量化,转化为计算机可处理的矩阵或向量的过程:预处理的目的是去除噪声,消除变形,加强有用信息,并对退化现象进行复原;原始图像或波形的数据量是非常大的,为了有效的实现分类识别,就要对其进行变换,得到最能反映分类本质的特征,这就是特征提取和选择的过程;分类决策就是在特征空间中用统计方法把被识别对象归为某一类别。基本做法是在样本训练基础上确定某个判决规则,使按这种年,在计算