文档介绍:华北电力大学计算机系数据库系统概论AnIntroductiontoDatabaseSystem第六章关系数据理论本章概要前面已经讲述了关系数据库、关系模型的基本概念以及关系数据库的标准语言。如何使用关系模型设计关系数据库,也就是面对一个现实问题,如何选择一个比较好的关系模式的集合,每个关系又应该由哪些属性组成。这属于数据库设计的问题,确切地讲是数据库逻辑设计的问题,有关数据库设计的全过程将在第7章详细讨论。本章讲述关系数据库规范化理论,这是数据库逻辑设计的理论依据。要求了解规范化理论的研究动机及其在数据库设计中的作用,掌握函数依赖的有关概念,第一范式、第二范式、第三范式和BC范式的定义,重点掌握并能够灵活运用关系模式规范化的方法和关系模式分解的方法,这也是本章的难点。,后经许多专家学者对关系数据库理论作了深入的研究和发展,形成了一整套有关关系数据库设计的理论。,关键是关系数据库模式的设计,一个好的关系数据库模式应该包括多少关系模式,而每一个关系模式又应该包括哪些属性,又如何将这些相互关联的关系模式组建一个适合的关系模型,这些工作决定了到整个系统运行的效率,也是系统成败的关键所在,所以必须在关系数据库的规范化理论的指导下逐步完成。关系数据库的规范化理论主要包括三个方面的内容:函数信赖范式(NormalForm)模式设计其中,函数信赖起着核心的作用,是模式分解和模式设计的基础,范式是模式分解的标准。?什么是好的关系模式?某些不好的关系模式可能导致哪些问题?下面通过例子进行分析:,要求设计教学管理数据库,其关系模式SCD如下: SCD(SNO,SNAME,AGE,DEPT,O,GRADE)其中,SNO表示学生学号,SNAME表示学生姓名,AGE表示学生年龄,DEPT表示学生所在的系别,O表示课程号,GRADE表示成绩。根据实际情况,这些数据有如下语义规定:,但一个学生只属于一个系;,但一个系主任可以同时兼几个系的系主任;,每门课程可有若干学生选修;。在此关系模式中填入一部分具体的数据,则可得到SCD关系模式的实例,即一个教学管理数据库,。,并分析以上关系中的数据,我们可以看出:(O)属性的组合能唯一标识一个元组,所以(O)是该关系模式的主关系键。但在进行数据库的操作时,会出现以下几方面的问题。。每个系名和系主任的名字存储的次数等于该系的学生人数乘以每个学生选修的课程门数,同时学生的姓名、年龄也都要重复存储多次,数据的冗余度很大,浪费了存储空间。。如果某个新系没有招生,尚无学生时,则系名和系主任的信息无法插入到数据库中。因为在这个关系模式中,(O)是主关系键。根据关系的实体完整性约束,主关系键的值不能为空,而这时没有学生,O均无值,因此不能进行插入操作。另外,当某个学生尚未选课,即CNO未知,实体完整性约束还规定,主关系键的值不能部分为空,同样不能进行插入操作。,删除全部学生的记录则系名、系主任也随之删除,而这个系依然存在,在数据库中却无法找到该系的信息。另外,如果某个学生不再选修C1课程,本应该只删去C1,但C1是主关系键的一部分,为保证实体完整性,必须将整个元组一起删掉,这样,有关该学生的其它信息也随之丢失。,则该学生的所有记录都要逐一修改SNAME;又如某系更换系主任,则属于该系的学生记录都要修改MNAME的内容,稍有不慎,就有可能漏改某些记录,这就会造成数据的不一致性,破坏了数据的完整性。,我们说,SCD是一个不好的关系模式。产生上述问题的原因,直观地说,是因为关系中“包罗万象”,内容太杂了。那么,怎样才能得到一个好的关系模式呢?我们把关系模式SCD分解为下面三个结构简单的关系模式,。学生关系S(SNO,S