文档介绍:北京交通大学
硕士学位论文
数字图书馆建设中数字资源整合的研究与蓝图设计
姓名:常江
申请学位级别:硕士
专业:计算机软件与理论
指导教师:罗四维
20061201
的整合构架方案,该方案可分为,Ⅵ:哪中文摘要摘要:本文以数字图书馆的建设项目为背景,针对目前普遍存在的信息孤岛问题,从数字资源的存储、组织、检索三个层面上进行了数字资源的整合研究。通过对现有的数字资源整合技术的分析与研究,本文提出了被称为氖肿试部分。⒎桨福浼芄挂孕槟獾拇娲⒂虼嫦钟械奈募系统,并设计了资源访问协议和资源路有协议以满足资源的访问和大规模复制等需求。甅桨柑岢鲇檬侄韵蟮母拍罱饩龃娲⒂朐J荩J萦朐J据,元数据与索引之问的整合问题,其中还提出用本体论的方法使元数据与索引在语意层面进行整合。甋U霞焖鞣桨福酆舷钟械牟返姆桨提出了基于检索适配器的中间件架构,并针对协议适配等和非标准检索等问题提关键词:数字资源整合;数字图书馆;海量存储;存储网格:元数据;数字对象;本体论;整合检索出解决方案。
鳦畐腶,Ⅱ鸪鷈骯瞞昱鰐轎百瑃舀酉鼯酉∞,弘閞弘:舀;西;、騝田’辌聇柚,’甦琺甦司琺琣擎;豁籹;—;魌,颍琁Ⅱ,鬭閠,耬痑產.
致谢首先,我要感谢我的导师罗四维教授。在攻读研究生期问,能够成为罗四维教授的学生是我莫大的荣幸。本文的选题和研究工作也倾注了罗四维教授的大量心血和谆谆教诲。在项目研究和本文的撰写过程中,罗四维教授给与我了大量的鼓励和指导,使得我能够顺利完成学业,同时提高了科研能力和实践能力。在此衷心感谢三年来罗四维老师对我的关心和指导。罗四维教授除了悉心指导我们完成学术和科研工作外,在学习上和生活上都给予了我们很大的关心和帮助,让我明白了很多做人的道理,这将会使我一生受益。同时感谢在实验室工作及撰写论文期间,对我论文中的研究工作给予了热情帮助的同学,在此向他们表达我的感激之情。业。最后我要感谢我的家人,他们的理解和支持使我能够在学校专心完成我的学
对缺乏的问题,如果把这对问题合二为一那就是~数字资源管理的缺乏。背景及研究动机随着数字化网络化进程的不断深入,每天都有数以亿万计的文档,网页,图片,音视频文件等各类信息资源以数字的形式被创建,这里我们统称为数字资源。与传统的纸制或者胶片保存的资料不同,数字资源具有信息量大,传播方便,制作编辑简单等优点,但同时也有难以管理,生存周期短,格式繁多内容不规范的缺点。数字资源属于人类的精神产品,而人既是其生产者又是其消费者,然而在数字化信息化浪潮的如火如茶的今天,人与数字资源却面临着危机,我们称之为数字资源危机:一方面每天有大量的数字资源被制造出来无处可以存放,另一方面人们面对海量的数字资源无法找到自己想要的那部分。显而易见,数字资源危机的核心问题就是,数字资源与可以提供的存储间的相对过剩和人们需求间的相数字图书馆是目前最为流行的数字资源管理概念之一,所谓数字图书馆是指用数字技术处理和存储各种图文并茂的文献的图书馆,它实质上是一种分布式信息系统,这种系统把各种不同载体、不同地理位置的信息资源用数字技术存储起来,以便实现跨区域的面向对象的网络查询和传播。据此可以把数字图书馆简明扼要地概括为:有组织的信息资源只莶及相关服务,其中信息资源是用数字化保存的,以便用户通过网络进行信息访问。因此数字图书馆并不是简单的数字化收藏加上信息处理、传播和发布的工具,而是支持面向对象的分布式查询的资料库,这样各种搜索网站也是属于数字图书馆的范畴【俊5孀攀滞际馆建设的深入,数字资源的数量越来越多,包括各种电子期刊数据库,电子图书数据库,自建的特色数据库等等。由于这些数字资源被不同的机构利用不同的数据库系统开发,采用数据结构和系统平台也各不相同,数据通常被存储为多元化的格式,分散在不同的数据库系统中。数字资源出现整体的无序化,内容组织程度不高,数字资源间交叉关联程度较低,这样的数字资源格局被形象的描述为信所谓信息孤岛,指的是一个个相对独立的不同类型不同学科的数字资源系统。不包括网上无序和自身没有控制的数字信息资源。由于各系统相互封闭、无法进行正常的信息交流,犹如一个个分敌、独立的岛屿,所以被称为信息孤岛【俊息孤岛。
论文的研究内容论文的主要贡献从数字资源系统的不同层次上讲,存在三种类型的信息孤岛:存储孤岛。在传统的计算机系统环境中,主机系统拥有自己的存储资源,受磁盘和文件系统的限制,单个主机系统所能拥有的存储资源一般是很有限的。当面对海量的数字资源存储需求时,就不得不将数据存储到多个主机的存储中,为此每个系统管理员需要针对每一种系统来控制存储资源的分配、使用和管理,这就是了我们所说的存储孤岛问题。元数据孤岛。元数据是数字资源组织的关键性数据,在当今的图书馆界存