文档介绍:山东大学硕十学位论文
冠石
摘
近年来,随着计算机的迅速发展,模式识别技术不断取得新的进展,大大改善
了人机之间的信息交互能力。计算机文字识别是模式识别的一个重要分支,它包括
数字字符识别、西方文字字符识别、东方文字字符识别。数字字符识别和英文字符
识别研究最充分,识别方法比较成熟,识别率也比较高而东方文字字符识别比较
困难,其中汉字字符识别是文字识别中最困难的部分。
汉字识别是用计算机自动辨识印刷在纸上或人写在纸上的汉字,学科上属于模
式识别和人工智能的范畴。汉字识别涉及到模式识别、图像处理、人工智能、形式
语言与自动机、模糊数学、组合数学、信息论、中文信息处理等学科,也涉及到语
言文字学、心理学、仿生学等,是一门综合性技术。
计算机文字识别是使汉字和其它字符高速自动输入计算机,解决了汉字信息处
理系统中手动输入效率低这一关键问题的理想途径,是办公自动化不可缺少的文字
自动输入手段,是智能计算机智能接口的重要组成部分。同时联机手写汉字识别是
一种很方便的汉字输入方式,而且字符图像经识别后形成的代码,在信息量上减少
了百分之九十九以上,对信息压缩和传输有重要意义。
汉字识别是一种难度非常大的模式识别。这是因为从客观上讲,汉字是一种
特殊的模式集合,其模式种类很多,结构非常复杂,有的模式又十分相似,加上印
刷质量与干扰的影响,以及人们在书写时的随意性使字形不够规范等原因,都使得
汉字字符的识别十分困难。
从技术上讲,虽然关于模式识别的研究有较长的历史,但至今仍没有适用于分
析和描述各种模式的严谨的理论。目前的模式识别,与其说是一门科学,还不如说
是一门技术,有的人甚至认为它是一门艺术。在研究某些模式识别问题时,有的方
法比较巧妙,或者某种识别方法比较符合被识别的模式集合的情况,因而得到较好
的效果。但是即使是较好的方法,由于不容易顾及所有方面的问题,所得结果往往
也不是全局最佳
本文在总结学术上已有关于计算机文字识别成果的基础上,描述了计算机文字
山东大学硕士学位论文
识别的基本过程,介绍了几种常用的数字字符识别方法和汉字字符识别方法,对己
有字符识别方法的改进主要有
提出了一种新的数字字符识别方法,即基于整体特征的数字字符识别方法,
使数字字符识别对字符的书写风格依赖性减小,能够识别书写不规范的数字
字符。
对现有的关键背景点法数字字符识别进行了改进,使原本几乎只能够用于印
刷体数字字符识别的方法能够用于识别手写体数字字符。
提出了一种专用于字符识别的细化算法,使得细化骨架不受字符边缘修饰的
影响,形变很小,同时速度很快。
提出了一种从脱机字符点阵图像中恢复动态信息,将脱机识别问题转变为联
机识别问题的方法
关键词数字识别汉字识别模式识别文字识别细化算法
山东大学硕士学位论文
,
,叩
呻
,
,
,
,
,
即
, ,
,,,
,,
,,
,
,
,
,
山东大学硕士学位论文
,
,,
,,
,
,
,
,
,
,,,
,
,,,,,
,
,
,
,,,
,
,
,,
,
,
,
,
山东大学硕十学位论文
,
、
,,
原创性声明
本人郑重声明所呈交的学位论文,是本人在导师的指导下,独
立进行研究所取得的成果。除文中己经注明引用的内容外,本论文不
包含任何其他个人或集体己经发表或撰写过的科研成果。对本文的研
究作出重要贡献的个人和集体,均已在文中以明确方式标明。本人完
全意识到本声明的法律责任由本人承担。
论文作。名拼才。期。、二、,。
关于学位论文使用授权的声明
本人完全了解山东大学有关保留、使用学位论文的规定,同意学
校保留或向国家有关部门或机构送交论文的复印件和电子版,允许论
文被查阅和借阅本人授权山东大学可以将本学位论文的全部或部分
内容编入有关数据库进行检索,可以采用影印、缩印或其他复制手段
保存论文和汇编本学位论文。
保密论文在解密后应遵守此规定
论文作者签名二蓬脸导日期邺从二曰,。
山东大学硕士学位论文
第一章文字识别研究的历史回顾和现状
随着模式识别和人工智能研究的发展,在英文、数字字符识别的基础上,六十
年代人们开始对汉字识别进行的研究,七十年代出现了初步成果。最近二十多年,
全国都进行了大量的研究工作,并己经取得了不少成果。
以当