文档介绍:电子文件元数据标准
金更达
2005年4月22日
主要内容
元数据概况
何为元数据?
元数据功能
数字信息长期保存策略
电子文件元数据
概念
总体说明
信息模型
元素分层索引
元数据概况
何为元数据?
元数据功能
何为元数据?
元数据是关于数据的数据,是描述资源的结构化信息。
是数字信息组织和处理的基本工具,为各种形态的数字化信息单元和资源集合提供了规范、普遍的描述标准和方法,使得资源易于被检索、使用和管理。
不同的元数据标准支持不同的目的需求
简单 VS 复杂 如:Dublin Core VS MARC
通用 VS 专用 如:Dublin Core VS FGDC
注:MARC为图书馆书目信息元数据标准
FGDC为数字地理空间元数据标准
何为元数据?(续)
不同行业对元数据的定义也不仅相同
档案领域
元数据是与电子文件的制作形成、运转、处理、储存、检索、传输和利用有关的数据。ISO15489将元数据定义为:“是描述文件的背景、内容、结构及其整个管理过程的数据”。
图书情报等信息领域
是一种用来描述数字化信息资源,特别是网络信息资源的基本特征及其相互关系,从而确保这些数字化信息资源能够被计算机及其网络系统自动辨析、分解、提取和分析归纳(即所谓机器可理解性)的—整套编码体系。
元数据功能(一)
信息发现:帮助使用者检索和确认所需要的资源,如Dublin core(简称DC)主要用于组织网络信息资源。
信息描述:用于对数据单元进行详细、全面的信息描述,如图书的MARC、档案的机读目录、地理空间信息(FGDC)等。
资源管理:支持对资源利用和管理过程的政策与控制机制的描述,例如权限管理、资源评价、电子签名、使用管理等。
元数据功能(二)
资源保护与长期保存:支持对资源的长期保存,除了对信息资源的描述与确认之外,往往还需要关于该资源的格式信息、制作信息、转换方式、技术环境等,以便于资源的利用。
使用:用以描述信息资源的使用层次与类型。如使用与使用者记录追踪、内容再利用与不同版本的信息。
真实性保障(正处于研究之中)
电子文件长期保存
存在问题
主要困难
相关策略
存在问题
电子文件的特性(依赖性、非直读性、信息与载体的相分离性、物理结构与逻辑结构的复杂性等等)
信息技术频繁的范式转换
信息技术的多样性和多种软硬件技术平台的存在,导致形成了多种互不兼容的计算机信息系统和结构各异的电子文件,使信息孤岛现象普遍存在。
数字信息利用过程中,自然衍生而出的著作权、公布权、确实性与可信赖性等问题。
主要困难
要求能够保障电子文件的真实性、完整性和证据价值;
要求能够对分布式存储的、具有多样性和异构性的电子文件进行集成管理,确保电子文件的安全和长期有效性;
要求能够通过集成管理和建立电子文件实时捕获和共享机制,消除信息孤岛现象,有效实现档案信息资源的共享,并能够为不同类型的用户群体提供有效的档案信息资源服务。