1 / 18
文档名称:

怎么把图片转换成文字.ppt

格式:ppt   页数:18页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

怎么把图片转换成文字.ppt

上传人:zhangbing32159 2015/11/17 文件大小:0 KB

下载得到文件列表

怎么把图片转换成文字.ppt

相关文档

文档介绍

文档介绍:把图片转换成文字 捷速OCR文字识别软件
前言
图片的形成有很多种,用相机照出来的相片;用手机拍出来的照片;用扫描仪扫描的图像等等。这些数据以图片的形式保存在电脑里,用电脑显示出来。图片是光与影的结合,每一个图片因为不同的形成方式,它们的明暗度、对比度都会不一样。有时候因为种种原因,我们要将图片中的文字读取出来,由于图片的不同,也同样给识别增加了困难。现在,我们要要谈论的就是如何将图片中的文字识别出来。
OCR识别技巧
OCR文字识别软件,集名片识别,文档识别,证件识别,车牌识别多项专有技术于一体,充分满足了政府公务员、企业经营管理人员、教师学生、科研人员、编辑记者、交警文员等日常文档办公应用录入的需要,极大地提高了工作效率和质量,轻松实现视频、图片转WORD, PDF转WORD多方面的文字处理功能。
OCR识别技巧
分辨率的设置是文字识别的重要前提。一般来讲,扫描仪提供较多的图像信息,识别软件比较容易得出识别结果。但也不是扫描分辨率设得越高识别正确率就越高。选择300dpi或400dpi分辨率,适合大部分文档扫描。[3]注意文字原稿的扫描识别,设置扫描分辨率时千万不要超过扫描仪的光学分辨率,不然会得不偿失。下面是部分典型设置,仅供参考。
第一:分辨率
OCR识别技巧
扫描时适当地调整好亮度和对比度值,使扫描文件黑白分明。这对识别率的影响最为关键,扫描亮度和对比度值的设定以观察扫描后的图像中汉字的笔画较细但又不断开为原则。进行识别前,先看看扫描得到的图像中文字质量如何,如果图像存在黑点或黑斑时或文字线条很粗很黑,分不清笔画时,说明亮度值太小了,应该增加亮度值在试试;如果文字线条凹凸不平,有断线甚至图像中汉字轮廓严重残缺时,说明亮度值太大了,应减小亮度后再试试。
第二:亮度和对比值
OCR识别技巧
选好扫描软件。选一款好的适合自己的OCR软件是作好文字识别工作的基础,一般不要使用扫描仪自带的OEM软件,OEM的OCR软件的功能少、效果差,有的甚至没有中文识别。
再选一个图像软件,第一,OCR软件不能识别所有的扫描仪;第二,也是最关键的,利用图像软件的扫描接口扫描出来的图像便于处理。
第三:扫描软件
OCR识别技巧
如果要进行的文本是带有格式的,如粗体、斜体、首行缩进等,部分OCR软件识别不出来,会丢失格式或出现乱码。如果必须扫描带有格式的文本,事先要确保使用的识别软件是否支持文字格式的扫描。也可以关闭样式识别系统,使软件集中注意力查找正确的字符,不再顾及字体和字体格式。
第四:文本格式
OCR识别技巧
在扫描识别报纸或其他半透明文稿时,背面的文字透过纸张混淆文字字形,对识别会造成很大的障碍。遇到该类扫描,只要在扫描原稿的背面附。盖一张黑纸,扫描时,增加扫描对比度,即可减少背面模糊字体的影响,提高识别正确率,
第五:识别文件要求
OCR识别技巧
一般文本扫描原稿都为黑、白两色原稿,但是在扫描设置时却常将扫描模式设为灰度模式。特别是在原稿质量较差时,使用灰度模式扫描,并在扫描软件处理完后再继续识别,这样会得到较好的识别正确率。值得注意的是OCR识别软件可以自己确定阀值,几个百分点的阀值差异,可能就会影响识别的正常进行。当然,得到的图像文件的大小会比黑白文件大很多。在进行大批量文稿扫描时,必须对原稿进行测试,找到最佳的阀值百分比。
第六:阀值
OCR识别技巧
遇到图文混排的扫描原稿,首先明确使用的识别软件是否支持自动分析图文这一功能。如果支持的话,在进行这类扫描识别时,OCR软件会自动计算出文本的内容、位置和先后顺序。文字部分可以按照标示顺序正常识别。
第七:图文混排