1 / 8
文档名称:

古腾堡计划电子图书的校对方法.docx

格式:docx   大小:14KB   页数:8页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

古腾堡计划电子图书的校对方法.docx

上传人:无需盛会 2022/2/22 文件大小:14 KB

下载得到文件列表

古腾堡计划电子图书的校对方法.docx

文档介绍

文档介绍:精品范文模板 可修改删除

免责声明:图文来源于网络搜集,版权归原作者所以
若侵犯了您的合法权益,请作者与本上传人联系,我们将及时更正删除。
撰写人:___________日 期:___________对者还需标注原著中的粗体、斜体字以及脚注等内容。(6)校对是协作式的,来自世界各地的志愿者通过互联网可能对同一本书的不同页进行校对。校对者在完成了对某本图书一页的校对后,可以再申请新的校对页,也可以退出校对。有意思的是,“古腾堡计划”并不鼓励校对者一天校对太多的页数,他们的建议是“一天一页”。他们认为,每个人每天对校对工作贡献的绵薄之力,最终会形成生产数字图书的强大力量。2004年,“古腾堡计划”的管理者自豪地宣布:平均每天有300~400个志愿者参与校对工作,平均每天完成校对页数4000~7000个,这意味着每分钟完成校对4个图书页。实际上,2004年以后,志愿者数量和校对页数总量等数据每年都有相当大的增长[2]。(7)校对过的图书页会保存在网站的数据库中,等待下一轮的校对。“古腾堡计划”的校对会有2轮,以尽量避免错误的发生。(8)当所有的图书页都经过2轮校对后,“古腾堡计划”的处理软件会将其整合成一本完整的数字图书,并且再进行一次错误检查。由于一本书的校对很可能是由多人完成,因此这时的重点在于一致性的检查上。(9)通过检查后的图书会被归档,并上传到全球各地的镜像站点,向全世界提供免费阅读和下载[3]。可以看出,“古腾堡计划”的数字图书制作,奉行“质量优先”的原则。虽然它的图书数量并不太多,但涵盖了莎士比亚、列夫•托尔斯泰、马克•吐温等著名作家的经典作品,另外也包含了许多非文学类的名家名作,而且这些都是相对可靠的电子文本,为世界各地的读者进行阅读、欣赏和研究提供了极大的便利。
 
3分布式校对的几个关键环节
 
3.1分布式校对与集中化管理
 
“古腾堡计划”的图书校对和制作虽然是由各地的志愿者采用分布式的方法完成的,但其基础却是集中化管理。在版权认定、决定哪些图书可以进行扫描、校对与提交以及图书的整合、发布等方面,都不是由志愿者自由和随意地进行,而是由“古腾堡计划”的核心小组统一安排。“古腾堡计划”的管理者会在广泛搜罗图书的基础上对未加工的图书进行审查和鉴定。作为非赢利性组织,“古腾堡计划”准备加工图书的来源非常庞杂,很多图书来自图书拍卖会、图书馆的剔旧以及各类捐赠。志愿者会将这些图书的封面、封底和版权页扫描,送交“古腾堡计划”的版权小组进行审查。版权小组由熟悉知识产权领域法规的专家组成。只有通过审查的图书,才会被允许进行数字化加工。这一举措,有效地避免了可能出现的知识产权纠纷。一旦通过了版权审查,相应的纸质图书会被送交个别志愿者,他们将书脊拆散后扫描,在得到扫描图像的同时,用文字识别软件产生与图像文件对应的文本,然后将这些文件上传到服务器。这一工作过程也是相对集中的,仅由少数较为可靠的志愿者完成,这样可以保证扫描与文字识别的精度。上传到服务器的文件进入“分布式校对”系统,发布在互联网上。这时来自世界各地的众多志愿者就可以利用该系统进行分布式校对。在所有的工作环节中,项目管理员(ProjectManager)、后期制作员(PostProcessor)发挥着重要作用。项目管理员负责监控数字