文档介绍:地学数据共享领域资源科学主体数据库的构建
王卷乐
中国科学院地理科学与资源研究所
青岛
1
提纲
1 科学数据共享工程中的主体数据库
2 地学数据共享中的主体数据库布局
3 资源科学主体数据库分析和设计
4 资源科学主体数据库系统开发
5 小结与思考
2
1 科学数据共享工程中的主体数据库
3
1 科学数据共享工程中的主体数据库
科学数据共享工程采用“工程门户网站”——“科学数据中心(网)”——主体数据库的组织层次。
科学数据管理与共享服务体系数据内容建设的基本单元,乃是构成数据中心(网)的主体数据库。
科学数据共享工程规划在2010年建成覆盖6大领域的300个左右的主体数据库,进而形成科学数据共享工程的基础层。
4
主体数据库的定义
所谓主体数据库,一般是以学科或专业领域来设置的,它能够刻画或反映本学科或专业领域的数据特征,基本上能够满足相应学科或专业领域科技创新的需求。或者说是由相关领域研究者所共同关注的基础性科学技术数据所构成的规范化、集成化、体系化和规模化的数据库。
一般讲,统计、加工的文本数据应达到10MB级;原始记录文本数据应达到1GB级;矢量数据为10GB级;人工描扫栅格数据应达到100GB级;而自动系统采集的栅格数应达到TB级。对那些针对自然系统的观测、探测、监测数据应保证其整体性(即时、空尺度的系统性、连续性)。
5
主体数据库的定义
主体数据库(Core database):依据国际标准、国家标准或行业标准分类体系构建的二级学科及其分支学科的科学数据集并在计算机系统上运行的数据库。
6
2 地学数据共享中的主体数据库布局
地球系统科学数据共享网是科学数据共享工程的一部分。
地学数据共享中的数据资源建设重点集中在主体数据库构建和面向国家重大科研项目需求的数据产品开发上。
地球系统科学数据共享网当前的主体数据库布局包括七个,并且将在今后数年内有所增加。
7
地理科学主体数据库
人文过程主体数据库
资源科学主体数据库
极地研究主体数据库
固体地球主体数据库
空间科学主体数据库
对地观测主体数据库
2 地学数据共享中的主体数据库布局
8
3 资源科学主体数据库分析和设计
(1)主体数据库组织层次设计
在学科分类框架下,对主体数据库进行层次设计。例如“资源科学主体库”——“水资源数据”——“全国各省年降水数据”——“江苏省年降水数据”等层次结构。对于主体数据库的分类结构,除了学科属性以外,还可以按空间属性(地域)、时间属性(年代)等进行分类,并尽可能地让科学家感觉到进入了种类齐全、排列有序的数据超市。
9
3 资源科学主体数据库分析和设计
(2)主体数据库数据资源的组织和迁移
在主体数据库层次框架下,在尽可能保留现有数据的存储结构条件下,对数据资源的存储进行优化,包括空间数据的存储结构优化、数据库表的归并等。在一些数据资源处理工具的支持下,有序地完成数据资源的组织和迁移。
10