1 / 11
文档名称:

文字识别算法.docx

格式:docx   大小:100KB   页数:11页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

文字识别算法.docx

上传人:glfsnxh 2020/4/5 文件大小:100 KB

下载得到文件列表

文字识别算法.docx

相关文档

文档介绍

文档介绍:题目图像分割技术学院计算机科学与技术班级计软1401学生兰俊锋学号文字识别是智能识别技术中的一个重要技术。文字具有便于信息保存和传递的优点,使信息在时间和空间上得以迅速扩散。在人们的日常生活中,在机关事务处理、工业以及商业交往中,需要识别文字的数量如同天文数字,但利用计算机识别的文字量却很少。最近几年,随着计算机技术、数学和图像技术的发展,文字识别的应用领域逐步扩大,目前较为活跃的应用包括数字识别,文字识别等。文字识别是指用计算机字典、高速地识别现在介质(如纸张等)上的数字、英文符号或汉字。文字识别实际上就是解决文字的分类问题,一般通过特征及特征匹配的方法来进行处理。本文将从算法、应用两方面介绍文字识别技术,本文介绍的文字识别应用有英文字母识别、车牌特殊文字识别、书写文字识别、特殊文字识别。文字是人类相互交流信息的重要工具。社会发展进入信息时代,人们已不再停留在用自己的耳朵和眼睛去直接获得这些信息,而是使用计算机将文字自动的输入计算机,用计算机对他们进行处理,随时以各种方式满足人们的不同需要。因此,研究如何用计算机自动识别文字图像,解决文字信息自动输入计算机,并进行高速加工处理的问题已引起大家的广泛关注。归一化算法一般作为一种图像的预处理技术,其目的是将采集到的原始图像转换成特征提取器所能接受的形式(灰度图像或二值图像),消除一些与类别无关的因素(噪声消除、归一化等)。从理论上讲,经过归一化后的骨架应该是宽度为一的中心线,但这是不可能的。不同的硬件设备和不同的算法得出的结果可能不是唯一的,其结果与原图案的扭曲程度也是不~样的,扭曲程度尽量的小应该是归一化算法追求的目的之一。既然预处理是为后续的特征提取和分类器设计服务的,那么预处理方法的选择就应该有利于特征的提取,以使分类变得简单。汽车牌照识别,在高速公路收费、电子警察和治安卡口等系统中有重要的应用价值。作为图像识别的典型问题,汽车牌照识别的研究有很长的历史,但因为实际路况的高度复杂性(如车速、光线、污染及变形等),目前的性能还不能令人满意。文字识别过程概述一般来说,文字图像的识别过程主要由以下4个部分组成:①正确地分割文字图像区域;②正确地分离单个文字;③正确识别单个文字;④正确地连接单个文字。其中①、④属于文字图像分析技术问题,③属于文字识别技术问题。关于②,由于仅从分割处理不能对其进行评价,通常采用文字识别地评价值来判断分离的正确性。单纯的文字识别是指经二值化处理后的单个文字识别。文字识别系统的原理及组成文字图像的识别的原理如下图所示。图中光电变换检测部分的主要功能,是对纸面上的文字进行光电转换,然后经模数转换成具有一定灰度的数字信号,送往其后的各部分进行处理和识别。D摄像头等。文字图像分割的目的就是根据文字图像的特征的视线文字图像区域的定位和分割,将真正的文字图形分割出来,以便后续进行识别,识别与处理部分的功能是将已分割出的文字图形信息加以区分,去除信号中的污点、空白等噪声,增强文字图像的信息。并根据一定的准则除掉一些非本质信号,对文字的大小、位置和笔画粗细等进行规范化,以便简化判断部分的复杂性。特征提取部分是从整形和规范化的信号中抽取反映字符本身的有用信息,供识别部分进行识别。作为特征提取的内容是比较多的,可以是几何特征,如文字线条的端点、折点和交点等。识别判断部分则是根据抽取的特征,运用一定的识别原理,对文字进行分类,确定其属性,达到识别的目的,实际上判断部分就是一个分离器。识别系统学****部分的功能是生成计算机特征字典,学****根据已准备好的多个字样,抽出代表该字的特征,进行修改,按照字典的规定位置存放该特征。学****分为两种:一种是在人的参与下进行,称为“有教师”学****一种由计算机自动进行,称为“无教师学****文字识别的方法文字识别是指用计算机字典、高速地识别现在介质(如纸张等)上的数字、英文符号或汉字。文字识别实际上就是解决文字的分类问题,一般通过特征及特征匹配的方法来进行处理。特征判别是通过文字类别(例如英文或汉字)的共同规则(如区域特征、四周边特征等)进行分类判别。它不需要利用各种文字的具体知识,根据特征抽取的程度(知识的使用程度)分解到地使用结构分析的办法完成字符的识别。匹配的方法则是根据各国文字的知识(称为自动)采取按形式匹配的方法进行。按实现的技术途径不同又可分为两种:一种是直接利用输入的二维平面图像与字典中记忆的图像进行全域匹配;另一种是只抽出部分图像与字典进行匹配。然后根据各部分形状及相对位置关系,与保存在字典中的知识进行对照,从而识别出每一个具体的文字。前一种匹配方法适合于数字、英文符号一类的小字符集;后一种匹配方法适用于汉字一类的大字符集。边缘检测边缘(Edge)是指图像局部亮度变化量最显著的部分。边缘主要存在于目标与木板、目标与背景、区域与区域(包括不