文档介绍:邓媛欢:OCR 识别技术研究·1·
OCR 识别技术研究
(工程技术学院电子科学与技术系电子科学与技术专业邓媛欢)
(学号:2001301055)
内容提要:随着近年来信息化浪潮的不断高涨,OCR 渐渐渗入了网络的各个领域。本论文
主要讨论 OCR 中数字图像处理的英文字母和阿拉伯数字识别。系统以 Visual C++ 作为编
程环境,通过图像二值化、腐蚀、膨胀、中值滤波等处理,辅以 Excel 2003,画板等程序实现数
据分析以及模板制作,最终达到字母和数字从提取到识别的目的。该系统最后生成的可执行程序,
可一步到位完成图像中字母和数字序列的识别。
关键字:OCR,模板匹配,二值化,中值滤波,腐蚀,膨胀
教师点评:邓媛欢同学对 OCR 识别技术尤其是 OCR 号码和字母识别技术方面展开了较深
入的研究,并对 OCR 技术在实际应用中提出了有效的解决方案,且对号码的特征提取进行了大
量统计工作,为最后的号码识别系统的高可靠性奠定了理论基础。(点评教师:刘承香,副教授)
第一章 OCR 识别系统简介
OCR,optical character recognition 的简称,即光学识别系统,是属于图形识别的一个分支。
OCR 是针对印刷体字符,采用光学的方式将文档资料转换成原始资料黑白点阵的图像文件,通
过识别软件将图像中的文字识别成中文和英文内码,转换成文本格式。这样,计算机通过 OCR
识别系统,可以清楚自己看到了什么,读到什么,尤其文字资料。OCR 为文字的进一步编辑加
工提供了条件。
OCR 可以说是一种不确定的技术研究,正确率就像是无穷趋近函数,知道其趋近值,而
100%的完美却可望不可及影响 OCR 识别率的因素有:书写者的习惯或者文件印刷品质,扫描仪
的扫描品质,识别的方法,学习以及测试的样本等等。
从预处理的目标图像的撷取到文本结果的输出,有如下步骤:影像输入,影像前处理,文字
特征提取,对比识别,最后经过人工校正将误判的文字更正,将结果输出。
本设计将最终生成一个识别程序,完成将固定格式的号码识别出来的工作。
第二章 OCR 识别系统的设计
设计任务
本 OCR 识别系统的主要设计任务是研究字母和数字识别算法,并将图片中的字符提取后以
文本形式读出内容。
实现流程:
1. 影像输入:目标文件经过光学仪器后生成为位图储存在计算机;
2. 影像预处理:包括二值化,腐蚀与膨胀,中值滤波等。
3. 文字特征提取:用 EXCEL 统计特征,并根据字符本身特点,在不同区域采集数据。
4. 对比数据库:通过画板制作相应的字母和数字模板作为对比的标准。
5. 对比识别:根据不同区域的特征比较,找出最相近的字符。
6. 结果输出:将相近字符所对应的识别结果,即识别码输出。
实现的主要工具:Visual C++ ,EXCEL 程序,画板程序。上述 1~6 的流程,在设计
过程中需要反复进行,直至获得较理想的识别率。
OCR 系统思路分析
BMP 格式图像的获得
邓媛欢:OCR 识别技术研究·2·
BMP 图像的获得,可以是实物扫描所得。本系统针对特定格式