文档介绍:论文摘要怕于书写不规范,造成部分不同字符书写形状相似,不同字符模式间本文所研究的问题是作者于—年参加《第一次全国农业普查丛丞蕴进行了研究。对脱机至曼馇熬室主显宜逼廛迟型簋洼视点来理解识别机制。脱机室签迟剔时表格数据的一次性输入的独特性,捎谑中醋址巫吹母杀渫蚧跋炝耸侗鹇实奈榷ǎ鸦中醋址题和出现的新情况而提出的。疚适应性和学习能力的算法是非常必要的。,。本文首次提出的面向表格构造数字字母识别算法及系统的思想是基于受人类辨别能力和分辩过程的启发而首次提出的。试图从新的角度、新的极相似于人类的阕读方式,因此提出了多字符相关识别的可能性。在该思想的基础上,根据计算机字符识别本身的特点,结合模糊逻辑理论,进~的边界重叠,不恰当的边界划分是引起误识的一个重要因素。传统识别方《模糊比较字符识别法》把当前处理的某张表格内所有的字符的集合看成一个具有个人风格的字符集。其特点是:在当前表格内①个人书写的相同字符较稳定,形状相近。②尽管部分字符书写不规范,但不会有歧义,字符之间相对参照可区分。这表明每个字符内部不仅包含有特有的自我特征信息,而且还包含有具个人风格的、相对可区别信息,字符间边界清晰。调查表光电录入系统》的开发和后期的技术服务过程中,所发现的一些问识别一直是煊蛑醒芯康囊桓鋈鹊愫湍训恪O匀唬罢乙恢志哂辛己步提出了面向表格构造的《模糊比较字符识别法》。用于具有个人书写风格的表格上手写字符的识别。它是一种具有自适应能力和学习功能的字符识别方法。法采用固定边界,显然不能包窖各种不同书写风格,~重庆大学博士学位论文’~摘要’、/.
僳一级在应用了神经网络的基础上,采用了首次提出的能提高识剐信丁2芬弧弧显然,在这样一个特定的范围内,针对个人书写的特点,构造识别率较高的算法是可能的。面向表格的方法同时充分利用了这两种信息,并采用了直接分类和相对比较分类相结台的策略:首先对书写较规范的字符赢接进行识别;然后对书写变形较大的字符,建立其候选表:并利用已识别本文提出的动态建立个人字典,是自适应算法的核心,它旨在利用个人书写字符的相对稳定性和字符间的相关信息,通过针对不同人的书写,本文提出了一个二级分类系统,它具有自适应能力和在线学习功能。第二级采用已被识别出的部分字符数据建立动态字典。然后,利用它人工确认的字符,系统实时自动学习其数据,并把它作为一个实例加入动态字典。可获得确认一个,识别一批的效果。降低了拒识数,提高了系统识别速度较快的优点。可使传统方法的识别率从.%提高到.%,识别速度提高出的较规范字符的数据动态建立其字典;最后把输入字符与字典中的样本进行比较,并由最大原则进行评判。这样,通过相对比较,。其特点是不明显影响识别效率的前提下,通过抽检字符必要特征,可以对已识别的结果进行一次过滤,发现误识别字符,提高己识别字符的可靠性。对变形较大而信度不高的字符进行分类,首次以动态字典的方式实现了自系统同时也具有在线学习功能。把由于信度不高被系统拒识而需要由的效率。实验证实,与先前的各种方法相比,本方法具有对各种书写自适应和并分类。/‘一、飞,识别率。适应识别。卜。。重庆大学博士学位论文摘要争’⋯~’Ⅱ/,、\
蒫衝枷舀师锄廿,畁畆∞蟟鞋。砌掾腸,.痵。;
丑喇癷雙‰,緎晦他∞.%,..Ⅱ.珻
第一章绪论字符识别发展概述引言年是际醴⒄故飞暇哂刑乇鹨庖宓囊荒辍N夜晒Φ亟辛手写字符数据自动录入工程,全国共有千多万张表格,共嘁个数据渭铰糽,在不到半年的时间就被高质量高速度地录入计算人类这种制造一种机器来阅读手写和印刷材料的想法要追溯到世纪的机械识别问题是很容易的。然而,随着研究的深入后发现:由于有无穷变化的字符的形状和风格,正确识别字符是十分豳难的,不管字符是手写互影响研究的科学家所作的标准化和实用化工作之中。当大量的曜来自厂家、用户、科学的、技术的、专业的团体和政府机构的专家和代表靠的、不可缺少的设备了。其中,标准化的打字机字体和手写印刷体在此第一次全国农业普查,这是迄今为止我国也是世界范围内最大规模的一次机。它充分地表明:手写体数字识别技术已从理论、实验到大规模应用并迈进了一个新的时代。年代。起初,人类从其本身能很容易阅读这一点判断,认为要解决字符或是印刷体。尽管如此,人们还是对髁耸抵市缘难芯亢涂7ⅲ⒃技术报告、文章、专利、档案、工业小册子和说明书方面都有丰富的积累。年代最重大晒窃谀切┯梢恍┐邮禄堤匦院透咧柿渴葜湎己被全世界各国的标准委员会和国际组织7⒀兄疲庑┳橹怯组成的。结果,对将大量数据输入到计算机来说,驯涑梢恢直冉峡重庆大学博士学位论文第一章
现在,字符识别技术已逐步成