文档介绍:专门数字对象描述元数据规范
研制工作手册
(试行)
《专门数字对象描述元数据规范》子项目组
2003年3月
为了保证子项目组研制的各种元数据规范在功能、数据结构、格式、语义语法等方面的一致性和整体性,同时也为了今后在更大范围内实现与其他系统或数字图书馆的互操作和数据共享,项目组特制定本手册。
手册主要内容包括:
描述元数据的定义及功能
元数据规范的设计原则
描述元数据的基本结构、元素组成与扩展规则
描述体系与定义方法
元数据规范应用的相关规则
设计流程与工作规范
文档规范
本手册为试行稿,其中很多内容尚需在实际工作过程进行修订,涉及到核心元素集、元素定义方法、扩展规则、描述体系等方面的内容,将与“基本描述元数据规范”子项目组进一步探讨后确定。各工作小组可暂时按此执行,在执行过程中如有问题,可向子项目组提出,并在子项目组会议上讨论修改并通过。
描述元数据的定义及功能
描述元数据:即用于描述或标识数字对象内容的元数据。
设计描述元数据规范时,要充分考虑和实现元数据的下列功能:
描述:对信息对象的内容、属性等的描述,是元数据最基本的功能,为信息对象的检索与利用奠定了基础。
定位:即有关信息资源的位置方面的信息,如DOI、URL、URN等的记录,由此可知信息对象之所在,有利于信息的发现和检索。
管理:对信息对象的权限管理(版权、所有权、使用权)的揭示和描述。
检索:在描述过程中,将信息对象中的重要信息抽出标引并加以组织,建立它们之间的关系,为用户提供多层次、多途径的检索体系,从而有利于用户发现其真正需要的信息。
评估和选择:由于元数据的描述,使用户在不必浏览信息对象本身的情况下,对信息对象有了基本了解和认识,可以对其价值进行评估,从而决定信息的取舍。
交互:包括与编目人员和用户之间的交互。元数据在结构上呈现出一定的开放性,允许使用者自行设定、调整元素,建立不同元素间的关系,设定检索点,构造规范档;同时不断吸取用户的反馈意见,调整自己的元数据标准。
描述元数据规范的设计原则
调查分析
制定元数据规范要从三个方面的调查分析入手,即:
著录者,指专业和非专业编目人员,还包括管理者;
使用者,指数字图书馆的用户;
著录对象,即被描述的资源。
其中,首先要明确的是著录对象及其著录对象之间的关系。
一个将被元数据描述的对象往往是一个较为复杂的复合对象。以拓片为例,在数字图书馆中,一张拓片还会有拓片原器物和若干拓片图像。那么该拓片对应的复合对象就是复合了拓片本身、拓片原刻、拓片数字图像。
是对复合对象进行著录还是对某个具体的对象著录关系到元数据的结构和具体元素的设计。
在元数据规范的制定过程中,要充分考虑著录者、使用者的需求和著录对象的特性,并在其间做一最佳平衡和组配。
在此基础上要遵循的几组最基本的原则是:
简单性与准确性原则:简单性主要指设计的元数据标准在著录实践时应较为简单,易于掌握,尤其要考虑到著录人员除编目员外,更多的是相关专业人士,如古籍专家、地理学家甚至研究生等。但一味追求简单性易导致标引不够精确,会降低检索结果的准确度和精度,因此,同时要考虑到简单化可能导致的不准确,需在二者中作一权衡。
专指度与通用性原则:由于元数据应用的各类资源的各自特性不尽相同,著录深度(如书目、内容和插图等)和