1 / 25
文档名称:

Greenplum数据库设计开发规范.doc

格式:doc   大小:1,064KB   页数:25页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

Greenplum数据库设计开发规范.doc

上传人:秋天学习屋 2022/5/1 文件大小:1.04 MB

下载得到文件列表

Greenplum数据库设计开发规范.doc

相关文档

文档介绍

文档介绍:精品文档
精品文档
1
精品文档


第一章
序言.................................................................
2

....
16

UNION/UNIONALL........................................................
16

高效SQL写法的建议....................................................
18
精品文档
精品文档
精品文档
3
精品文档

精品文档
精品文档
25
精品文档
1
精品文档
精品文档
25
精品文档
精品文档
第一章序言

随着Greenplum数据库的正式上线使用。为了保证Greenplum数据库房系
统平台的平稳运行,保证系统的可靠性、稳定性、可维护性和高性能。特拟订本
开发规范,以规范鉴于Greenplum数据库平台的有关应用开发,提高开发质量。

Greenplum数据库房平台应用的设计与开发人员;
Greenplum数据库房平台的系统管理人员和数据库管理员;
Greenplum数据库房平台的运行维护人员;


《》



精品文档
精品文档
6
精品文档
2
精品文档
精品文档
25
精品文档
精品文档
第二章设计规范

数据库对象种类包括数据表、视图、函数、序列、索引等等,在Greenplum数据库中,系统元数据同时保留在Master服务器和Segment服务器上,过多的数据库对象会造成系统元数据的膨胀,而过多的系统元数据造成系统运行逐步变慢;同时,近似数据库的备份、恢复、扩容等较大型的操作都致使效率变慢。因
此,依据GreenplumDB产品的最正确时间,单个数据库的对象数量,应控制在10万以内。
GP数据库的对象包括:表、视图、索引、分区子表、外部表等。
如果数据表的数量太多,建议按应用域进行分库,尽量将单个数据库的表数量控制在10万以内,能够在一个集群中创立多个数据库。
【备注】:在Greenplum数据库中,一张分区表,在数据库中存储为一张父表、每张分区子表都是一张独立的库表;比如:一张按月进行分区的存储一年数据的表,如果含默认分区,共14张表。

为了防止数据库表数量太多,防止单个数据表的数据量过大,给系统的运行和使用带来困难,在Greenplum数据库中需按照如下的表创立规范:
1、GP系统表中保留的表名称都是以小写保留。往常SQL语句中表名对大小
写不敏感。但不允许在建表语句中使用双引号(“”)包括表名,这样会影响系统
表中存储的名称,使得表名存在大小写或特殊字符。表命名也不允许出现中文字。
2、单个数据库的数据表数量建议不要超过10万张;
3、禁止使用二级分区表,因为二级分区表会造成表对象数量的急剧膨胀;
4、由于过多的数据文件会致使操作系统对文件的操作效率降低,直接影响
到数据库的管理效率。如果数据文件数量过多,建议增加多个表空间,把数据表

精品文档
精品文档
8
精品文档
3
精品文档
精品文档
25
精品文档
精品文档
平均散布到不同的表空间。每个表空间目录下的数据文件数量,应控制在
80万
以内。文件数统计能够直接到某个Segment实例目录下指定的表空间目录下统计。
5、创立数据表(DDL)的时候(不含临时表和程序中使用的中间表),必须
使用tablespace子句指定用于存储的表空间,而不是把所有表都存储在默认表
空间;比如:
Createtableemployee(idint,namevarchar)
TABLESPACEtpc_data_01distributedby(id);
6、关于数据量超过1TB的大表,需从应用设计方面,考虑对大表进行优化,
比如是否可区分为历史数据表和目前数据表,并分开寄存;是否应采用压缩存储
节俭空间;是否合理分区;是否应定期清理数据等等。
2