文档介绍:大气科学数据的元数据标准研究
中国科学院大气物理研究所
2002年8月5日
对元数据的认识
什么是元数据
元数据内容:
对数据集内容的描述;
对数据集中各数据项、数据来源、数据量以及数据生产过程等的说明;
对数据质量如数据精度、数据的逻辑一致性、数据的完整性等的描述;
对数据的表达方式、数据的起止时间、空间范围、数据的尺度以及空间参考系、坐标等的说明;
对数据存储格式、存储介质、存放地点、索取方式、数据及元数据所有者信息的描述;
对数据处理信息的说明,如量纲的转换等;
对数据转换方法的描述;
对数据集更新周期、集成方式的说明等等。
大气科学数据的特点
气象数据--五维数据
空间3维、时间1维、变量1维
从空间结构上看--有两种数据格式:
格点数据
一般是一个时次、一种气象要素的数据形成一个数据文件,每个文
件由若干个二维数组组成(行、列上的要素值按一定的经度、纬度顺序
排列),一个数组代表某一时次、某一层次上、某个区域的要素值。
台站数据
台站资料按台站来组织文件,每个台站的台站号及其同时次、同报
类(如地面观测、高空观测等)该台站的气象观测要素组成一个记录,
在此基础上,所有时次、报类相同的台站纪录组成一个台站数据文件。
大气科学数据的特点
从时间尺度上看
天气是指某一瞬时或某一短时间内大气中气象要素和天气现象的综合;
气候是一个历史的概念,它和特定的时间阶段相联系,某一时段的气候状态是指这一时段气候系统各属性的平均统计特征。
大气科学数据的时间尺度是由时、日、候、旬、月、季、年、多年、世纪等多个时间跨度组成。
变量
天气学的研究对象是大气圈层,而气候系统是由大气、海洋、陆地表面、冰雪覆盖层和生物圈等五个部分组成。所以,大气科学数据涵盖的物理量相当多。
大气科学数据是一种结构比较复杂的数据类型。它涉及到不同的时间尺度、不同的空间参照系统、不同的坐标系统以及种类繁多的要素等等,所以建立大气科学数据的元数据标准是一项复杂的工作。
大气科学数据的元数据标准讨论
目前,大气科学领域--没有统一的、被业界所公认的大气科学数据的元数据标准。
元数据标准的建立是数据标准化的前提和保证,只有建立起规范的大气科学数据元数据标准,才能使用户有效地使用大气科学数据库中的数据。
通过研究,发现大气科学数据的结构与地理信息系统中空间数据的结构相似,空间数据库中的属性值相当于大气科学数据库中的要素值;空间数据库中空间实体包括有点、线、面等多种类型,而大气科学数据库中的空间实体只有点一种类型。因此,可以借鉴比较成熟的空间数据元数据标准,以此为蓝本形成大气科学数据的元数据标准。
对地学界影响较大的是美国联邦地理数据委员会(FGDC)提出的CSDGM数字化的地球空间数据元数据内容标准,它主要用于确定地学空间数据集的元数据内容。该标准于1992年7月开始起草,1994年7月被FGDC正式确认。该标准将地学领域中应用的空间数据元数据分为七个部分:数据标识信息、数据质量信息、空间数据组织方式信息、数据空间参考信息、地理实体及属性信息、数据传播及共享信息和元数据参考信息。
大气科学数据的元数据标准内容
大气科学数据的元数据分为八个部分:
数据的标识信息
数据的质量信息
数据提供者信息
数据的空间参照系统信息
数据的要素分类信息
数据的分发信息
元数据参考信息以及引用信息
大气科学数据的元数据标准内容
数据的标识信息内容表(续2)
13
北部边界纬度
数据集覆盖范围最北部纬度坐标,单位为十进制
实型
-90≤北部边界纬度<90,南部边界纬度≤北部边界纬度
14
空间分辨率
定义数据集中数据的平面密度参数
文本
不限
15
空间编排方式
定义数据集中数据的平面点排列方式
文本
不限
16
垂直层
定义数据集数据所在的垂直层次和层数
文本
不限
17
访问限制
为保护隐私权、知识产权或因为特定的约束、限制等而设置的权限
文本
“无限制”、“知识产权”、“版权”、“专利权”、“许可证”、“商标”、等
18
用户权限
用户使用数据集时需要遵守的有关保密、知识产权保护以及任何特殊的规定
文本
不限
大气科学数据的元数据标准内容
数据的质量信息
是对数据集质量进行总体的评价,包括要素的精度报告、逻辑一致性报告、数据完整性报告以及数据志等方面的信息。用户通过数据质量信息可以了解数据集在数据质量的精度方面是否可以满足自己的使用需求。数据质量信息内容见下表。
序号
中文名称
定义
数据类型
值域
1
数据要素的精度报告
数据集中要素属性值的精度评价,包括精度的评估值和精度说明
文本
不限