文档介绍:各种方法如下:
Office 在 2003 版中增加了 Document Imaging 工具,用它可以把文字给“抠”出来。
把JPG文件另存为 TIFF-TAG图像文件格式(可用 ACDSe(软件)
在“开始”菜单的“ Microsoft Office 工具”中打开 Microsoft Office Document Imaging ,
文件-》打开,选择想要提取文件的图片,
在"工具”中选择"使用 OCR识别文本”,Document Imaging的OCR识别程序就会对图
片进行识别,完成后
选择“工具”中的“将文本发送到 Word',程序会自动打开 Word文档,展现在你面前的
就是从图片中“抠”出来的文字。
提示:一般而言,识别的准确率可以达到 95%以上,但对英文和数字的识别不是太好
其它软件
一、汉王 感觉比紫光好,可以识别表格,新版汉王 5800,还没有装。
以前 用过很多次,基本还可以,文科类书籍识别还不错,新版紫光 ,应该有提高。
三、慧视小灵鼠 号称很厉害,用手机拍得都行。
四、尚书 有表格识别,大概很中庸,用的人不多。
五、丹青 能识别繁体
六、 cajviewer 不是专用识别软件,内部应该是汉王的核心。
七、 Microsoft Office Document Imaging
八、 FineReader Professional 据说很牛的英文识别软件,是俄国人搞的,天空软件有下,汉字也有,只是没有地方下到。
九、 ABBYY
e 文识别。
十、 TextBridge
e 文识别
首先你得先把这些打印稿或文件通过扫描仪扫到电脑上去, 一般单位都有扫描仪, 如果没有
也没关系,用数码相机拍也行,拍成图片放到 WORD!面去,不过在些之前,你还得装一下
WORDI带的组件,03和07的都行。点开始-程序-控制面板-添加/删除程序,找到 Office- 更改-添加或删除功能,然后下一步,注意一定要勾选上“选择应用程序的高级自定义” -
下一步, 单击 office 工具 - 找到 Microsoft Office Document Imaging 这个组件, Microsoft Office Document Imaging Writer 点在本机上运行,单击更新然后按步骤操作就可以了。 首先将扫描仪安装好,接下来从开始菜单启动“ Microsoft Office/ Microsoft Office 工
具/Microsoft Office Docume nt Scanning ”即可开始扫描。
提示:Office 2003 默认安装中并没有这个组件,如果你第一次使用这个功能可能会要求你
插入 Office2003 的光盘进行安装。 由于是文字扫描通常我们选择“黑白模式', 点击扫描, 开始调用扫描仪自带的驱动进行扫描。这里也要设置为“黑白模式',建议分辨率为
300dpi 。扫描完毕后回将图片自动调入 Office 2003 种另外一个组件“ Microsoft Office
Document Imaging ”中。
点击工具栏中的“使用 OCR识别文字”按键,就开始对刚才扫描的文件进行识别了。按下
“将文本发送到 Word'按键