文档介绍:该【数据库系统学习概论总结 】是由【闰土】上传分享,文档一共【5】页,该文档可以免费在线阅读,需要了解更多关于【数据库系统学习概论总结 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。数据库系统概论小结
数据库技术是人类生活过程中对数据管理任务的需要而产生的。电脑对数据的管理过
程大致经过了三个主要阶段,一、人工管理阶段;二、文件管理阶段;三、数据库管理阶段。
随着电脑技术的飞速发展,软、硬件水平的不断提高,人类利用电脑管理数据的能力也越来
越高。同人工和文件管理阶段,数据库管理的主要特点是:数据结构化,数据共享性高、冗
余度低且以扩充,数据独立性高,有完整的数据库管理系统控制数据的能力和提供数据安全
性、完整性和并发控制的能力。
数据库,顾名思义,就是指存放数据的仓库。严格的定义指,长期存储在电脑内、有
组织、可共享的大量数据的集合。有了数据库的概念之后,为了利用这种技术,人们提出了
数据库管理系统的概念〔DBMS〕,那么DBMS实际上是位于用户与操作系统之间的一层管理
软件,其主要功能有:
、存储和管理
实时数据库首先是一个数据库管理系统,它应具有一般DBMS的基本功能:
,包括数据库的定义、存储和维护等;
,包括各种数据库操作、查询处理、存取方法和完整性检查;
;
;
,增强数据库的可靠性。
关系型数据库具有开放性好、数据处理能力强等特点,在系统中它作为第三
方和用户二次开发的接口,以及内存数据库的转储介质而存在。
一般的,由数据库、数据库管理系统、应用系统、数据库管理员共同构成了一个完整的
数据库系统。数据库技术是电脑领域发展最快的技术之一。数据库技术的发展是沿着数据模
型的主线展开的。数据模型是用来描述数据、组织数据和对数据如何进行操作的一种模型,
它是数据库系统的核心和基础。数据模型具体的可以分为两类,一类是概念模型;另一类是
逻辑模型。概念模型也叫信息模型,是按用户的观点对现实世界的信息和数据进行抽象建模,
将事物分为实体、属性和关系,主要用于数据库系统设计阶段,最典型的概念模型即ER图。
数据库中常用的逻辑模型有:层次模型、网状模型、关系模型、面向对象模型和对象关系模
型。
数据模型数据结构主要概念存储结优点缺点
构
层次模型树形结构片段、字段、层邻接法、数据结构简单、查询与现实不符
次序列、层次路链接法效率高合,冗余大,
径程序化
网状模型网状结构记录、数据项、链接法直接描述现实世界,结构复杂
系、域存取效率高
关系模型二维表关系、属性、元表,索引概念单一,逻辑清查询效率低
组、关键字、域晰,数据独立性高
面向对象对象对象、类、方法、类可以表示复杂对象、
模型消息、封装、继模块化结构、抽象数
承、多态据类型的能力
层次模型和网状模型都属于格式化数据模型,属于第一代,目前市场上主流的数据库
软件如SQLServer、Orical、MYSQL等都支持关系数据模型,因为关系数据模型有关系代数
作为语言模型,有关系数据理论作为理论基础,使得关系数据库拥有数据结构单一、数据共
享性高等特点。那我们重点的就是学习关系数据库理论,包括关系操作和关系代数等。常用
的关系操作包括查询、插入、删除、修改;其中查询操作又可分为选择、投影、连接、并、
交、差、补、笛卡尔积和除运算,这些运算都是建立在关系代数运算上进行的。另外关系模
型中有三类完整性约束:实体完整性、参照完整性和用户定义完整性。
SQL〔StructuredQueryLanguage〕,即结构化查询语言,是关系数据库的标准语言,是一
种通用的、功能性极强的关系数据库语言。SQL的功能大致分为四类:数据查询〔SELECT〕、
数据定义〔CREAT、DROP、ALTER〕、数据操纵〔INSERT、UPDATE、DELETE〕和数据控制〔GRANT、
REVOKE〕。SQL语言不仅可以在数据库软件中使用,也可以嵌套在其他高级语言中使用。因
此,SQL语句的熟练掌握是学习和使用数据库的基本条件,对同一操作的不同SQL语句最终
在电脑中执行的效率也不尽相同。
关系数据理论是数据库逻辑设计中的重要的理论依据,关系的标准化理论可以帮助系统
解决插入、删除可能存在的问题。关系模式中可能存在的问题主要有数据冗余太大、更新异
常、插入异常和删除异常。函数依赖和范式是标准化理论的核心概念。范式是建立在函数依
赖的基础上进行定义的。属性间的依赖关系是关系模式存在问题的根源。通常按属性间依赖
情况来区分关系标准化的程度为第一范式、第二范式、第三范式和第四范式。
1NF
消除非主属性对码的部分依赖
2NF
消除决消除非主属性对码的传递函数依赖
定因素
3NF
非码的
非平凡消除主属性对码的部分和传递依赖
BCNF
函数依
赖
4NF消除非平凡且非函数依赖的多值依赖
关系模式的标准化过程主要通过对关系模式的分解来实现的。模式分解的时候注意需要两个
问题:无损连接性和保持函数依赖性。
数据库是指对于一个给定的应用环境,构造〔设计〕优化的数据库逻辑模式和物理结构,
并据此建立数据库及其应用系统。数据库的设计目标是为用户和各种应用系统提供一个信息
基础设施和高效率的运行环境。高效率的运行环境包括:数据库数据的存取速率、数据存储
空间的利用率、数据库系统运行管理的效率等都是高的。“三分技术,七分管理,十二分基
础数据”是数据库设计的特点之一。基础数据的收集、入库是数据库建立初期工作量最大、
最繁琐、最细致的工作。在以后的数据库过程中更需要不断地把新的数据加到数据库中,是
数据库称为一个“活库”,否则就成了“死库”。而一旦成了死库,系统也就失去了应用价值,
原来的投资也就失败了。数据库设计应该和应用系统设计相结合。也就是说,整个设计过程
中要把数据库结构设计和对数据的处理设计密切结合起来。传统的软件工程无视对应用中数
据语义的分析和抽象。数据库设计的基本步骤为:
;——准确分析和了解用户需求
;——通过对用户需求综合、归纳与抽象,形成独立DBMS概念模型
即ER图。
;——将概念结构转换为某个DBMS支持的数据模型。即ER图向关
系模型的转换。
;——为逻辑数据模型选取合适的物理存储结构,选择存取方法等。
;——数据载入和应用程序编码调试。
。
在数据库操作中一个非常重要的概念是数据库恢复技术,是事务处理技术的一种。事务
是一系列的数据库操作,是数据库应用程序的基本逻辑单元。数据库恢复机制和并发机制是
数据库管理系统的重要组成部分。所谓事务是用户定义的一个数据库操作序列,这些操作要
么全做要么全不做,是一个不可分割的工作单位。事务具有四个特性:原子性、一致性、隔
离性和持续性。恢复的基本原理:冗余。建立冗余数据最常用的技术是数据转储和登录日志
文件。日志文件是用来记录事务对数据库的更新操作的文件。日志的概念是非常重要的,比
方一个SQLServer数据库就是由一个文件和一个日志构成的。登记日志文件必须遵循两条原
则,一是登记的次序要严格按并发事务执行的时间次序;二是必须先写日志文件,后写数据
库。
事务处理的另一种技术是并发控制技术。数据库是一个共享资源,可以供多个用户使用,
尤其在多处理机系统中,当多个用户同时并发的存取同一数据时如果不加控制就可能会存取
和存储不正确的数据,破坏事务的一致性和数据库的一致性。并发控制主要是为了保证事务
的隔离性和一致性。封锁是实现并发控制的一个非常重要的技术。
可串行化的定义:多个事务的并发执行是正确的,当且仅当其结果与按一次序串行地执
行这些事务时的结果相同,称这种调度策略为可串行化的调度。可串行性是并发事务正确调
度的准则。按这个准则规定,一个给定的并发调度,当且仅当它是可串行化的,才认为是正
确调度。并发控制机制调度并发事务操作是否正确的判别准则是可串行性,两段锁协议是可
串行化调度的充分条件,但不是必要条件。因此,两段锁协议可以保证并发事务调度的正确
性。
除了以上章节的数据库基础篇之外,数据库的发展又有一些新的技术如分布式数据库系
统、关系对象数据库系统及多媒体数据库等等。