1 / 5
文档名称:

扫描仪的文字识别.doc

格式:doc   大小:22KB   页数:5页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

扫描仪的文字识别.doc

上传人:花花世界 2019/4/5 文件大小:22 KB

下载得到文件列表

扫描仪的文字识别.doc

文档介绍

文档介绍:扫描仪的文字识别                               编辑整理---迟宝山                   借助扫描仪将文字内容以图片形式扫描存人电脑后,然后可利用OCR文字识别软件将图形中的文字直接识别为文字文档。一般扫描仪驱动盘中都附送了文字识别软件,目前市场上较常见的文字识别软件有尚书、汉王、紫光、丹青等。  小提示:什么一叫OCR?OCR(Optical Character Recognition)的概念产生是在1929年,由德国的科学家Tausheck首先提出。它可以将图形中的文字转换为一个个的字元,并保留其格式,最后达成图像文档转成文字文档的目的,免去重新打字输入的技术。我们接下来以“尚书七号”为例,介绍一下如何对已扫描存人电脑中的图像文档进行文字识别。而其它文字识别软件在使用上也基本相似,在使用时如有问题可多查看软件所带的帮助说明。在作OCR识别时应以300dpi、黑白二值扫描,并适当调高亮度和对比度。启动文字识别软件,单击尚书七号工具栏上的“打开”图标,打开要进行识别的文档,此时便可在原图栏看到图像。1、图象位置的校正 若扫描的图像文档方向有误,如没有水平,或者图像颠倒,我们可以在常用的文字识别软件中进行简单的修正。在菜单栏“编辑”便可在其下看到一些常用得上的调节方式(如图2)如果图像是上、下颠倒,则可借助“旋转图像→左转90度”(或者是“右 转90度”)来分两次完成修正。如果在对图像进行修正时出现错误操作,可利用“编辑”菜单下“恢复原图”来进行恢复。如果扫描得到的图像出现轻微的倾斜,我们除利用“自动倾斜校正”来进行修正外,还可选择“手动倾斜校正” 来进行。在进人手动倾斜校正后,可将指针移到“手动倾斜校正”窗口图像上(不能在红色横坐标上),然后按住鼠标左键,并移动鼠标,这样便可调整该窗口显示的内容在手动校正时除了可单击右侧的  “顺时针”或“逆时针”两个按钮外,还可将指针移到红色横坐标中的小方块上,按住鼠标左键上下移动鼠标,使得水平线条与文本图像的倾斜角度一致(也可以用键盘上的上下箭头在按钮间切换),校正好后单击“确认”按钮便可进行校正(如图3,),因此在识别前我们可以进行范围选取,使图像中的图像、页码等不需要识别进来的内容排除在外,这样能提高我们的正确识别率。      小提示:若当前图像文档有比较规则的、不需识别的内容,可在工具栏上选择“恢复鼠标”按粗,然后再将光标箭头移动到当前图像边框处,此时箭头变为卡住围像边框的双箭头。按下鼠标左键,将该位置的图像边框向内一移动,使边框只选择当前图像需识别的部分。      在尚书七号中,可在工具栏单击“版面分析,,图标(或者直接在键盘上敲"F5"快捷键),此时软件会自动对文档进行版面分析,并会自动根据文档来划分方块,每个方块上都有一个数字,此数字表示识别时的排队等待编号,有些类似于去银行办理业务时领取的号码。若框切分不对,可单击需取消的框,  操作方法为单击“识别”菜单中的“取消当前栏”命令,取消当前栏重新画框;若整页切分错误较多,可单击工具栏中的“取消版面分析结果”按钮,取消图像页的全部版面分析。一般我们可以采用手动选取的方法:直接在图像上按下鼠标左键,拖动鼠标产生方框,使方框正好框住需识别的文字内