文档介绍:第九章:数据库的发展方向
第一节分布式数据库系统
第二节并行数据库系统
第一节:分布式数据库系统
一、分布式数据库系统的定义
分布式数据库是由一组数据组成的,这组数据分布在计算机网络的不同计算机上,网络中的每个结点具有独立的数据库系统,它有自己的数据库,自己的用户,自己的CPU,运行自己的DBMS,执行局部应用,具有独立处理的能力。同时,每个结点也能通过网络执行全局应用。每个场地是具有高度的自治性,同时又相互协作组成一个整体。
分布式数据库主要强调分布性和逻辑整体性
分布性是指数据库的数据不存储在同一计算机的存储设备上,这与集中式数据库有区别。
逻辑整体性是指这些数据逻辑上是互相联系的一个整体,即逻辑上与集中式数据库相同。
二、分布式数据库系统的特点
1、数据独立性
数据的逻辑独立性、物理独立性、数据的分布独立性(分布透明性)
分布透明性指用户不必关心数据的逻辑分片,不必关心数据物理位置分布的细节,也不必关心重复副本(冗余数据)一致性问题,同时也不必关心局部场地上数据库支持哪种数据模型。
2、集中与自治共享结合的控制结构
数据的共享有两个层面:一是局部共享,即在局部数据库中存储供本地多用户共享的数据。二是全局共享,即在分布式数据库的各个场地同时存储供其他场地的用户共享的数据,支持系统的全局应用。
相应的控制机构也有两个层面:集中和自治。各局部的DBMS可以独立地管理局部数据库,具有自治的功能。同时,系统又设有集中控制机制,协调各个局部DBMS的工作,执行全局应用。
3、适当增加数据冗余度
(1)为了提高系统的可靠性,可用性:当某一场地出现故障时,系统可以对另一场地上的相同副本进行操作,不会因一处故障而造成整个系统的瘫痪。
(2)为了提高系统性能:系统可以根据距离选择用户最近的数据副本进行操作,减少通信代价,改善整个系统的性能。
所以在分布式数据库中增加冗余数据,在不同的场地存储同一数据的不同副本。
冗余副本之间数据不一致性的问题是分布式数据库必须着力解决的问题。
4、全局的一致性、可恢复性和并发操作的可串行性
应保证数据库的全局一致性,全局并发操作的可串行化和系统的全局可恢复性。因为全局应用要涉及两个以上结点的数据,所以分布式数据库系统中一个事务可能由不同结点的多个操作组成。当其中某一个结点出现故障操作失败后如何使另一个结点撤消已执行操作?这些技术要比集中式数据库复杂和困难的多,分布式数据库系统必须解决这些问题。
三、分布式数据库的系统结构
●全局外模式。它们是全局应用的用户视图,是全局概念模式的子集。
●全局概念模式。它定义分布式数据库中数据的整体逻辑结构,全局概念模式定义了一组全局关系。
●分片模式。每一个全局关系可以分为若干个不相交的部分,每一部分称为一个片段。分片模式定义了全局关系到片段的映像,而一个全局关系可以对应多个片段。
●分布模式。片段是全局关系的逻辑部分,一个片段在物理上可以分布到网络的不同结点上。分布模式定义了片段存放结点的映像