文档介绍:基于古文献特藏的数字图书馆系统的设计与实现
肖珑
冯英
(北京大学图书馆)
介绍
正如在传统图书馆中存在有大量特藏一样,数字图书馆同样需要收藏特色资源,这部分
资源我们称为数字特藏(digital special collection),是某一数字图书馆单独收藏的资
源,具备特殊收藏和利用的价值。
正在建设中的北京大学数字图书馆,除收藏有数据库、电子期刊、电子图书、网络资源
等数字化资源外,还拥有大量特色资源,包括:
北京大学博硕士学位论文;
北京大学著名学者教授的手稿、照片等各类收藏;
北京大学课程教学参考资料;
北京大学古籍数字特藏。
在上述特色资源中,数量最大、最具特色的当属古籍数字特藏,它是在北京大学图书馆
纸本古籍特藏的基础上建设的,与专业出版商出版的电子版《四库全书》、四部丛刊》、二
十五史》等资源一起,共同构建成北京大学古籍数字图书馆。它的建立,将使北大图书馆馆
藏古籍突破时空的限制,在全世界的范围内得到广泛的利用,并能够长久妥善地留存于世。
古籍数字图书馆的建设代表了北京大学数字图书馆的一个方面,完整地体现了北京大学
数字图书馆的建设与服务思想。本文将从资源建设、标准规范、系统结构与新技术的应用、
服务建设等方面对北京大学古籍数字图书馆进行全面介绍。
一、资源建设
北京大学图书馆目前收藏中国古籍约 1,600,000 册(件)、12 万种,其中孤本、珍稀本
比比皆是,并有相当数量是在公元 16 世纪以前印行的;被辟为特藏的敦煌卷子、家谱、舆
图、戏曲小说、地方志、少数民族文字古籍、金石拓片等类型藏书,都在海内外收藏界占有
重要的地位。特别是金石拓片,收藏异常丰富,计 30,000 种、约 60,000 份,拓印对象包括
商周甲骨、青铜器,秦汉至明清的碑刻以及砖文瓦当等中国历代金石文献,许多拓片是举世
罕见或北大独有的。
建设中的北京大学古籍数字图书馆将选择其中一部分作为自己的收藏:
1,古籍特藏,包括:
(1) 敦煌卷子 240 余件;
(2) 宋元版书 350 多种,5,000 多册;
(3) 明代嘉靖(1566 年)以前的版本约 3,000 种,25,000 册;
(4) 古代舆图 500 余种,名人书画近百种;《
(5) 写本系列:包括手稿本、名人信札、日记,影抄本、旧抄本、名人抄本,圣训、玉
牒、奏折、文书、档案、地契等,在 6,000 种以上;
(6) 手绘本 100 多种,近千册;
(7) 家谱 1,000 余种,近万册;
(8) 古代戏曲小说约 4,000 种,35,000 册;
(9) 地方志共 4,000 多种,60,000 册。
总计约 20,000 余种,均为传本稀少、版本珍贵、学术价值较高的收藏。
2,金石拓片
包括清代缪氏艺风堂、张氏柳风堂等两藏拓大家的完整收藏,以及其他著名学者、收
藏家的旧藏,数量多,版本好,价值高,这些拓片将逐步经过数字化加工收入到古籍数字图
书馆中,约 30,000 种、60,000 份。
基于上述收藏,北京大学古籍数字图书馆将包括以下数据库:
对象数据库:
包括古籍拓片图像数据库、古籍拓片全文数据库,主要通过数字扫描加工、OCR
识别转换和人工录入方式进行建设。
初期建设将对古籍和拓片