1 / 9
文档名称:

尚书七号ocr文字表格识别系统.docx

格式:docx   大小:25KB   页数:9页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

尚书七号ocr文字表格识别系统.docx

上传人:bb21547 2019/6/21 文件大小:25 KB

下载得到文件列表

尚书七号ocr文字表格识别系统.docx

相关文档

文档介绍

文档介绍:尚书七号ocr文字表格识别系统篇一:尚书7号OCR文字识别系统完全版Shocr7 尚书7号OCR文字识别系统完全版软件语言:简体中文软件大小:MB 本软件系统是应用OCR(OpticalCharacterRecognition)技术,为满足书籍、报刊杂志、报表票据、公文档案等录入需求而设计的软件系统。目前,许多信息资料需要转化成电子文档以便于各种应用及管理,但因信息数字化处理的方式落后,不但费时费力,而且资金耗费巨大, 造成了大量文档资料的积压,因此急需一种快速高效的软件系统来满足这种海量录入需求。本软件系统正是适用于个人、小型图书馆、小型档案馆、小型企业进行大规模文档输入、图书翻印、大量资料电子化的软件系统。●识别字符简体字符集:国标GB2312-80的全部一、二级汉字6800多个。纯英文字符集。简繁字集:除了简体汉字外,还可以混识台湾繁体字5400多个以及香港繁体字和GBK汉字。●识别字体种类能识别宋体、仿宋、楷、黑、魏碑、隶书、圆体、行楷等一百多种字体,并支持多种字体混排●识别字号初号小六号字体。●表格识别可以自动判断、拆分、识别和还原各种通用型印刷体表格。●可支持繁体WINDOWS系统首先,尚书七号开始将整个OCR的过程,明确化了,通过程序的菜单,我们就能够知道整个OCR 的过程,主要分为:“文件”、“xx”、“识别”、“输出”等步骤。在文件菜单中,您可以调用扫描仪,或者选择将已经扫描好的图像文件打开。得到图像文件后,用户开始的工作,就是“xx“菜单里面所提示的:图像页面的处理,其中包括图像页的倾斜校正(提供自动和手动实现方法),旋转等功能。处理完毕后,就可以进入“识别过程”该过程关键的是“版面分析”,现在尚书七号的自动版面分析功能很强,面对报纸杂志等复杂情况的版面,也是分析的正确率很高。不再需要我们在尚书六号里面那样的建议手工划识别范围。也正是这点,大大降低了使用者的工作量。为了方便,“识别”菜单下,也提供了用户自己在自动版面分析后,通过修改识别范围框的属性,来决定需要识别否的功能(默认的情况下,图象属性的栏目是不用识别的。当然,如果用户还是****惯原来尚书六号那样,自己来设定识别区域,只要直接用鼠标划框就可以了。接下来,用户就可以直接选择“开始识别”的按钮了,等待识别的结果。尚书7号OCR使用方法示例因为不断有用户来电咨询尚书7号软件的使用,为此我们这里特别写了一份关于尚书7号软件的使用方法的实际例子,来帮助用户使用好尚书7号OCR软件。其中,很多是我们自己在使用尚书软件的心得,请用户尽量按照示例来操作。一、扫描仪驱动程序请切换到高级控制面板状态为了得到较好的OCR 使用效果,建议用户将扫描仪的驱动 SCANWIZARD5软件,由初始安装的标准控制面板,切换到高级控制面板状态。其切换的方法,如下图所示。二、第一次使用尚书OCR7号软件 ,向汉王科技购买授权,赠送给用户使用的软件,该软件是放在了扫描仪随机的驱动光盘中,用户可以选择安装。 ,用户请点击桌面左下角“开始”,找到“尚书7号OCR”软件图标,并点击。打开尚书7号OCR的使用界面。 “文件”采单下的“选择扫描仪”,选择对应扫描仪的驱动“MICROTEKSCANWIZARD5”的选项。并选择“确定