文档介绍:开源仓储软件的研究应用进展及发展趋势
提纲
开源仓储软件简介
主要开源仓储软件的研究应用进展
清华大学的实践
开源仓储软件的发展趋势
开源仓储软件简介
仓储软件主要被用于构建数字仓储,提供数字对象的管理和服务
包括:Fedora、DSpace、Eprints、DAITSS、aDORe等
应用场景:保存仓储、机构仓储、学科仓储、数字图书馆、内容管理系统、学术出版等
已经有较长的发展历史,得到广泛应用
开源仓储软件简介
Fedora(灵活可扩展的数字对象仓储架构)
美国康奈尔大学和弗吉尼亚大学在2003年推出;
DSpace
美国MIT大学图书馆和惠普实验室在2002年推出;
Eprints
英国南安普敦大学在2000年推出;
DAITSS
美国佛罗里达图书馆自动化中心开发;
aDORe
美国洛斯阿拉莫斯(Los Alamos)国家实验室开发;
主要开源仓储软件的研究应用进展
主要开源仓储软件的研究应用进展
Fedora
DSpace
Eprints
不同仓储之间的互操作问题
主要开源仓储软件的研究应用进展-Fedora
,,之间历经20多个版本,进展迅速;
具有灵活、可扩展的、模块化的架构;
支持数字资产的长期保存,可通过数字对象及内容文件重构整个仓储;
主要是一个工具包,而不是一个完整的应用
Fedora服务框架
Fedora的数字对象模型
在版本3以后有较大的改变
改进之处
老版本中“传播器”静态绑定带来的问题
新版本引入内容模型架构( Content Model Architecture ,CMA)
数字对象与内容模型关联,动态绑定
CMA设计为一种框架,用来开发和部署内容模型驱动的仓储体系结构
CMA的设计参考了软件工程中
面向对象编程
设计模式
模型驱动的架构
基本的内容模型架构关系
4种类型的Fedora数字对象:数据对象、服务定义对象、服务部署对象、内容模型对象。
Fedora的研究应用进展
英国的赫尔大学,mons合作的Hydra项目
假设1:没有一个系统能够满足一个机构的所有需要,但是持久的方案需要具有一种共同的仓储架构
三个大学具有多个独特的仓储应用需求(机构库,数据保存,开放获取论文,ETD,数字化工作流系统……)
可共享的基本功能(存放,管理,搜索,浏览,发送)
解决:端到端,灵活可扩展,工作流驱动的应用工具包