1 / 8
文档名称:

数据库系统概论 第十四章 分布式数据库系统.doc

格式:doc   页数:8
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据库系统概论 第十四章 分布式数据库系统.doc

上传人:xgs758698 2016/2/28 文件大小:0 KB

下载得到文件列表

数据库系统概论 第十四章 分布式数据库系统.doc

相关文档

文档介绍

文档介绍:、影响分布式查询处理的因素(详细见分布式数据库系统的查询优化)影响分布式查询处理效率的主要因素有:1数据分布(数据的局部性)。系统中数据的合理分布将使数据存放到离其应用点最近的节点,这样就使得每个节点只处理数据库的一个部分,CPU和I/O服务的竞争就不像集中式数据库那样严重,而且还减少了远程访问的延迟(这样的延迟常发生在通信链路中)和节点间数据的传输量。2内部查询和内在查询的并行化。系统的内部查询并行化是多个查询同时执行的结果;内在查询并行化是将单个查询分解成子查询以便每个子查询在不同的节点执行的结果。这样的并行将大大降低查询处理所需的时间,提高查询处理的效率。3节点间传输的数据总量。在系统的分布式处理中,查询策略的不同将导致在节点间传输的数据总量的差异,这将极大的影响查询处理的效率(特别是在节点间的通信效率不高时)。4传输一组数据的代价。在系统中,传输一组数据的代价随具体查询处理的要求和通信线路的状况而变,将影响查询处理的代价模型从而改变查询处理的策略,导致查询处理效率的变化。5各节点的处理延迟。在分布式查询处理中,由于涉及多个节点的操作,各个节点的处理延迟就成为影响查询处理效率的重要因素了。2、分布式查询的优化经过对分布式查询处理的分析(如上文所述),对其优化处理如下:1查询分解2查询的场地选择在分布式数据库系统中,由于数据分布在用网络连接的多个场地上,有重复副本的数据库中每个关系在不同的场地上又都有一些副本,这样在查询处理时,必然要涉及场地选择问题。场地选择关系到传输延迟,因而是影响查询处理效率的重要因素之一。场地选择的原则是:①保证查询的成功;②尽量保证处理的局部性;③尽可能选取通信开销小的场地。对于分布式查询处理中的场地选择有四种典型算法:分支与估界算法(BB)、贪婪算法(GR)、模拟退火法(SA)和局部搜索算法(LS)。3查询优化的实现以个人代理营销业务系统为例,查询优化主要从两个方面考虑:①减少场地间的数据传输;②要增加操作的并行性。对通信费用的算法主要思想是对每个查询条件都尝试是否能够用半连接减少通信费用;对响应时间的算法主要采用“本地析取,异地合取”的策略,即把各节点满足条件C1∨…∨Cm数据元组集合先传送到选定的处理节点,然后在处理节点对其并集过滤出满足条件C1∧…∧Cm的数据元组集合,得到所需的结果。这样可以缩短响应时间并实现查询结果的即时传送。3、优化相关半连接优化实例:SDD-1分布式数据库系统、AHY算法直接连接优化实例:R*(嵌套循环方法(nestedloop)对外层循环(Student)的每一个元组(s),检索内层循环(SC)中的每一个元组(sc)检查这两个元组在连接属性(sno)上是否相等如果满足连接条件,则串接后作为结果输出,直到外层循环表中的元组处理完为止2排序-合并方法(sort-mergejoin或mergejoin)适合连接的诸表已经排好序的情况排序-合并连接方法的步骤:如果连接的表没有排好序,先对Student表和SC表按连接属性Sno排序取Student表中第一个Sno,依次扫描SC表中具有相同Sno的元组当扫描到Sno不相同的第一个SC元组时,返回Student表扫描它的下一个元组,再扫描SC表中具有相同Sno的元组,把它们连接起来重复上述步骤直到Student表扫描完)14.