文档介绍:第1章数据库系统概论
数据库系统原理与设计 ( 第 2 版)
计算机学院魏文红,短号:733055
目录
数据库系统
数据库系统的作用
数据模型
数据抽象与数据库三级模式
数据与数据管理
数据:描述事物的符号记录。
无结构的文本形式描述:李天乐,男,1968年9月出生,江西南昌人,现工作于江西财经大学信息学院,教授,主要研究兴趣包括XML数据库、Web数据管理。
显然,数据的表现形式不能完全表达其内容,其含义即语义需要经过解释才能被正确理解,因此数据和关于数据的解释是不可分的。
表格形式(有结构的记录形式)描述:
表中一行数据组织在一起便构成一条记录,其数据的语义已由其所在列的表头栏目名解释,因此表格描述的数据称为结构化数据。
姓名
性别
出生年月
籍贯
工作单位/部门
职称
研究方向
李天乐
男
1968年9月
江西南昌
江西财经大学
信息学院
教授
XML数据库、Web数据管理
…
…
…
…
…
…
…
数据与数据管理
数据处理:从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说有价值、有意义的数据。
数据管理:对数据进行有效的分类、组织、编码、存储、检索、维护和应用——数据处理的中心问题。
数据管理技术的发展及其应用的广度和深度,极大地影响着人类社会发展的进程。
数据库技术的产生与发展
人工管理阶段
20世纪50年代中期以前的这段时间。
计算机还很简陋,尚没有完整的操作系统,主要应用于科学计算。
数据是面向应用程序的,一个数据集只能对应于一个程序,程序与数据之间的关系如图1-1所示。
数据需要由应用程序自己定义和管理,没有相应的软件系统专门负责数据的管理工作。
当多个应用程序涉及某些相同的数据时,必须由各自的应用程序分别定义和管理这些数据,无法共享利用,因此存在大量冗余数据。
应用程序1
应用程序2
应用程序n
…
数据集1
数据集2
数据集n
…
图1-1 人工管理阶段应用程序与数据
之间的对应关系
数据库技术的产生与发展
文件系统阶段
20世纪50年代后期到60年代中期的这段时间。
计算机除了应用于科学计算外,已开始应用于数据管理
在操作系统之上建立的文件系统已经成熟并广泛应用,数据由专门的软件进行统一管理。
对于一个特定的应用,数据被集中组织存放在多个数据文件(以后简称为文件)或文件组中,并针对该文件组来开发特定的应用程序。
利用“按文件名访问,按记录进行存取”的管理技术,可以对文件进行记录的修改、插入和删除等操作。
文件系统阶段程序与数据之间的关系如图1-2所示。
存取
方法
应用程序1
应用程序2
应用程序n
…
文件组1
文件组2
文件组n
…
图1-2 文件系统阶段应用程序与数据
之间的对应关系
数据库技术的产生与发展
文件系统的主要特点
文件系统实现了文件内的结构性,即一个文件内的数据是按记录进行组织的,这样的数据是有结构的(语义的)。
整体上还是无结构的,即多个文件之间是相互独立的,无法建立全局的结构化数据管理模式。
程序和数据之间由文件系统提供的存取方法进行转换,程序员可以不必过多地考虑物理细节。
由于数据在存储上的改变不一定反映在程序上,因此应用程序与数据之间有了一定的物理独立性。
姓名
性别
学号
出生日期
所学专业
家庭住址
联系电话
学生文件Student的记录结构
课程号
课程名称
教材名称
学时
学分
课程文件Course的记录结构
CS005
数据库原理
数据库概论
64
4
CS012
操作系统
操作系统原理
80
5
……
……
……
……
……
数据库技术的产生与发展
文件系统的弊端
数据共享性差,数据冗余和不一致
数据冗余是指相同的数据在不同的地方(文件)重复存储
文件系统中的一个(或一组)文件基本上对应于一个应用程序,不同应用程序之间很难共享相同数据
如何有效地提高不同应用共享数据的能力成为急需解决的问题
数据独立性差
文件系统中的文件组是为某一特定应用服务的,其逻辑结构对于该特定应用程序来说是优化的,但系统也不易扩充
数据与应用程序之间缺乏逻辑独立性
如何有效地提高数据与应用程序之间的独立性成为急需解决的问题
数据孤立,数据获取困难
对于数据与数据之间的联系,文件系统仍缺乏有效的管理手段
如何有效地管理数据与数据之间的联系成为急需解决的问题
数据库技术的产生与发展
文件系统的弊端
完整性问题
数据的完整性是指数据的正确性、有效性和相容性,也称为一致性约束
例如,一个学生需要选修某门课程,该学生必须已经修过了该课程规定的先修课程