文档介绍:邱锡良:OCR 识别系统设计与研究·1·
OCR 识别系统设计与研究
(工程技术学院光电工程系电子科学与技术邱锡良)
(学号:2001301075)
内容摘要:光学字符识别技术(简称 OCR)是计算机自动、高速地辨别图片上的文字,并
将其转化为可编辑文本的一项实用技术。它是新一代计算机智能接口的一个重要组成部分,也是
模式识别领域的一个重要分支。它涉及到图像处理、人工智能、形式语言、自动化及统计决策理
论等学科。本文阐述了当今 OCR 识别的状况以及介绍一种较为简单且又与常用模版匹配不同的
识别方法,并将其应用于一个实例:数字与字母的识别。文中将详细介绍其过程以及具体的实现、
方案的改进。程序采用 VC++ 编写,具有友好的 GUI 界面。
关键字:光学字符识别技术、模版匹配、数字识别、字母识别、VC++
教师点评:邱锡良同学研究了各种 OCR 技术在号码识别中的优缺点,并结合各种方法的优
点提出了采用基于区域特征的模板匹配方法进行识别,这种方法不仅实现相对简单,而且对于特
定的号码识别应用中效果很好。他还用 VC++设计和实现了整个 OCR 识别系统,系统最后达到
了很好的识别率,具有较高的实用性。(点评教师:刘承香,副教授)
一、绪论
OCR 识别的由来
随着计算机技术的推广应用,人类越来越多地依赖计算机获得各种信息,大量的信息处理
工作也都转移到计算机上进行。现代社会绝大部分的信息是以图书形式进行保存和传播的,这使
得要以计算机处理大量的信息就需要更长的时间,影响着计算机处理的效率。因此,需要有一种
能够将信息高速、自动的输入到计算机的方法。目前出现的文字输入的方法,如五笔输入法等,
其输入速度还是不高。所以,能够实现文字信息高速、自动输入的只能使计算机自动识别技术,
即光学字符识别技术。
模式识别研究方法简介
图像识别是对处理后的图像进行分类,确定类别名称。它可在分割的基础上选择需要提取
的特征,并对某些参数进行测量,再提取这些特征,最后根据测量结果作分类。对图像识别环节
来说,输入的是图像,输出的是类别和图像的结构分析,而结构分析的结果则是对图像的描述,
也是对图像重要信息的理解和解释。这里要注意的是,图像分割不一定完全在图像处理时进行,
对有些问题,要一面进行分割,一面进行识别。所以说,图像处理和图像识别是相互交叉的。对
于 OCR 识别来说,它大致可以分为结构模式识别和统计模式识别。
(1)结构模式识别——结构模式识别方法一般需要先抽取基本的笔画作为基元,由这些基
元构成部件,再由部件的组合来描述字符,最后利用形式语言及自动机理理论进行文法推断。其
优点在于对于字符形状的稍变适应性强,区分相似字能力强;但是抗干扰能力差,这些因素直接
影响到结构上的提取难度。而且结构模式识别的描述是十分复杂的,需要经过大量的计算。
(2)统计模式识别——统计模式识别方法是先提取待识别模式的一组统计特征,然后按照
一定准则所确定的决策函数进行分类判别。这样的识别方法具有良好的鲁棒性和较好的抗干扰能
力,但是,可以用来区分“敏感部位”的差异也随之消失,因此区分相似字的能力较差。
结构模式识别和统计模式识