文档介绍:数据库系统概论第六章关系数据理论1前面已经讲述了关系数据库、关系模型的基本概念以及关系数据库的标准语言。如何使用关系模型设计关系数据库,也就是面对一个现实问题,如何选择一个比较好的关系模式的集合,每个关系又应该由哪些属性组成。这属于数据库设计的问题,确切地讲是数据库逻辑设计的问题,有关数据库设计的全过程将在第7章详细讨论。本章讲述关系数据库规范化理论,这是数据库逻辑设计的理论依据。掌握函数依赖的有关概念,第一范式、第二范式、第三范式的定义。,后经许多专家学者对关系数据库理论作了深入的研究和发展,形成了一整套有关关系数据库设计的理论。在该理论出现以前,层次和网状数据库的设计只是遵循其模型本身固有的原则,而无具体的理论依据可言,因而带有盲目性,可能在以后的运行和使用中发生许多预想不到的问题。3在关系数据库系统中,关系模型包括一组关系模式,各个关系不是完全孤立的,数据库的设计较层次和网状模型更为重要。如何设计一个适合的关系数据库系统,关键是关系数据库模式的设计,一个好的关系数据库模式应该包括多少关系模式,而每一个关系模式又应该包括哪些属性,又如何将这些相互关联的关系模式组建一个适合的关系模型,这些工作决定了整个系统运行的效率,也是系统成败的关键所在,所以必须在关系数据库的规范化理论的指导下逐步完成。4关系数据库的规范化理论主要包括三个方面的内容:函数依赖范式(NormalForm)模式设计其中,函数依赖起着核心的作用,是模式分解和模式设计的基础,范式是模式分解的标准。关系模式的存储异常问题数据库的逻辑设计为什么要遵循一定的规范化理论?什么是好的关系模式?某些不好的关系模式可能导致哪些问题?下面通过例子进行分析:5例如,要求设计教学管理数据库,其关系模式SCD如下:SCD(SNO,SName,SAGE,SDEPT,O,SCORE)其中,SNO表示学生学号,SName表示学生姓名,SAGE表示学生年龄,SDEPT表示学生所在的系别,O表示课程号,SCORE表示成绩。根据实际情况,这些数据有如下语义规定:,但一个学生只属于一个系;;,每门课程可有若干学生选修;。在此关系模式中填入一部分具体的数据,则可得到SCD关系模式的实例,即一个教学管理数据库,如图所示。OSCORES1赵亦17计算机刘伟C190S1赵亦17计算机刘伟C285S2钱尔18信息王平C557S2钱尔18信息王平C680S2钱尔18信息王平C770S2钱尔18信息王平C570S3孙珊20信息王平C10S3孙珊20信息王平C270S3孙珊20信息王平C485S4李思男自动化李伟C1937根据上述的语义规定,并分析以上关系中的数据,我们可以看出:(O)属性的组合能唯一标识一个元组,所以(O)是该关系模式的主键。但在进行数据库的操作时,会出现以下几方面的问题。。每个系名和系主任的名字存储的次数等于该系的学生人数乘以每个学生选修的课程门数,同时学生的姓名、年龄也都要重复存储多次,数据的冗余度很大,浪费了存储空间。。如果某个新系没有招生,尚无学生时,则系名和系主任的信息无法插入到数据库中。因为在这个关系模式中,(O)是主关系键。根据关系的实体完整性约束,主键的值不能为空,而这时没有学生,O均无值,因此不能进行插入操作。另外,当某个学生尚未选课,即CNO未知,实体完整性约束还规定,主关系键的值不能部分为空,同样不能进行插入操作。。某系学生全部毕业而没有招生时,删除全部学生的记录则系名、系主任也随之删除,而这个系依然存在,在数据库中却无法找到该系的信息。另外,如果某个学生不再选修C1课程,本应该只删去C1,但C1是主键的一部分,为保证实体完整性,必须将整个元组一起删掉,这样,有关该学生的其它信息也随之丢失。。如果学生改名,则该学生的所有记录都要逐一修改SName;又如某系更换系主任,则属于该系的学生记录都要修改MN的内容,稍有不慎,就有可能漏改某些记录,这就会造成数据的不一致性,破坏了数据的完整性。9由于存在以上问题,我们说,SCD是一个不好的关系模式。那么,怎样才能得到一个好的关系模式呢?我们把关系模式SCD分解为下面三个结构简单的关系模式,如图所示。学生关系S(SNO,SName,SAGE,SDEPT)选课关系SC(O,SCORE)系关系D(SDEPT,MN)10