文档介绍:数据库及数据仓库精要前言数据库扮演的角色也叫联机事务处理OLAP(ransactionalProcessing),数据库保存由日常管理过程中涉及的业务操作创建的操作型结构化数据,数据记录系统管理行为(通过各种业务逻辑来交互)。反映细粒度的事务数据,保存时间短。主要依赖关系建模方法论。数据仓库扮演的角色也叫联机分析处理OLAP(OnlineAnalyticalProcessing),数据由联机事务处理来,经过选择和聚集,变为分析事实产生的因果,辅助决策制定(通过各种分析报表来交互)。反映大范围的事实数据,保存时间长。主要依赖多维建模方法论问题的导入结构良好的表,范式,SQL语言及关系基本表与中间表、临时表不同,基本表及其字段之间的关系,应尽量满足第三范式,是结构良好的表,它可以消除删除行,改变行,修改行(实例)的错误和异常。它具有如下四个特性:(1)原子性,基本表中的字段是不可再分解的。(2)原始性,基本表中的记录是原始数据(基础数据)的记录。(3)演绎性,由基本表与代码表中的数据,可以派生出所有的输出数据。(4)稳定性,基本表的结构是相对稳定的,表中的记录是要长期保存的。(5)基本表的每个决定因子都必须是候选建。(6)菲基本表必须分解为两个或多个基本表。三个基本范式:(1)1NF是对属性的原子性约束,要求属性具有原子性,不可再分解。(2)2NF是对记录的惟一性约束,要求记录有惟一标识,即实体的惟一性。(3)3NF是对字段冗余性的约束,即任何字段不能由其他字段派生出来,它要求字段没有冗余大多数结构不良好的表,会产生或包含大量的冗余数据,同时可能会出现删除行,改变行,修改行的错误和异常,这都是都是使用了SQLDMLCURD语句产生的。像中间表、报表和临时表:(1)中间表是存放统计数据的表,它是为数据仓库、输出报表或查询结果而设计的,有时它没有主键与外键(数据仓库除外)。(2)临时表是程序员个人设计的,存放临时记录,为个人所用。(3)基表和中间表由DBA维护,临时表由程序员自己用程序自动维护。关系是一个由行和列组成的二维表,不一定结构良好,特征为:行包括实体的数据,列包含实体性质的数据,表中的单元格存储单个值,每列的所有实体类型一致,每列具有唯一名称,列的顺序任意,行的顺序任意,任意两行互不重复。这是最大的复合关系模式的条件,符合这个要求的表就是关系型表格。统计,汇总,分析表自动用Excel做目录E-R模型的概念与表示实体-联系方法(概念设计)E-R图向关系表的转换(逻辑设计)E-R模型的概念与表示实体集-语义(名词类性)实体(Entity)事物就是在行动影响下物质本身的改变,或者进行。客观存在并可相互区别的事物称为实体。实体可以是具体的,也可以是抽象的概念或联系。具有共性的一类实体可归类为一个实体集(Entityset)。属性(Attribute)实体所具有的某一特性称为属性。一个实体可以由若干个属性来刻画。域(Domain)属性的取值范围或类型。键或标识符(Key)标识符是实体中一个或多个属性的集合,可用来唯一标识实体中的一个实例。每个实体都必须至少有一个标识符。如果实体只有一个标识符,则它为实体的主标识符。如果实体有多个标识符,则其中一个被指定为主标识符,其余的标识符就是次标识符了E-R模型的概念与表示联系集-语义(动词类型)实体之间可以通过联系来相互关联。与实体和实体集对应,联系也可以分为联系和联系集,联系集是实体集之间的联系,联系是实体之间的联系,联系是具有方向性的。联系具有方向性,每个方向上都有一个基数。联系的两个方向上各自包含有一角色名,描述该方向联系的作用。按照实体类型中实例之间的数量对应关系,通常可将联系分为4个基本联系分为类,即一对一(ONE TOONE)联系、一对多(ONETOMANY)联系、多对一(MANYTOONE)联系和多对多联系(MANYTOMANY)。三个特殊联系每个实体类型都有自己的标识符,如果两个实体集之间发生联系,其中一个实体类型的标识符进入另一个实体类型并与该实体类型中的标识符共同组成其标识符时,这种联系则称为标定联系,也叫依赖联系。反之称为非标定联系,也叫非依赖联系。递归联系是实体集内部实例之间的一种联系,通常形象地称为自反联系。同一实体类型中不同实体集之间的联系也称为递归联系。E-R模型的概念与表示E-R模型的概念与表示E-R图的设计步骤第一步:针对特定的应用,确定实体、属性和实体间的联系,画出局部E-R图。第二步:综合各个局部E-R图,产生反映数据库整体概念的总体E-R图。E-R模型的概念与表示弱实体集有些实体集的所有属性都不足以形成主码,这样的实体集称为弱实体集(WeakEntitySet),依赖于其它实体集而存在。与此相对,其属性可以形成主码的实体集称为强实体集。弱实体集所依赖的实体