文档介绍:山东大学硕士学位论文摘 要本文的工作就是针对一个企业或者一个子行业系统,一方面其各分支机构地理上分布在不同的地区,需要跨时空的信息联络,另一方面企业的信息主要分散在异地异构的数据库中,需要企业通过互联网进行数据查询,为企业提供实时、有效、透明的信息。上述工作最核心的任务就是本文研究的分布式数据库查询。Web的分布式特性使之成为一种良好的数据库应用平台,以之相适应的B/S三层(多层)结构作为了本文分布式应用系统的运行平台。本文重点研究:提高信息访问响应速度、减少网络流量,优化分布式数据库的查询策略。分布式查询的优化目标需要权衡网络流量、响应时间、服务器负载、算法复杂性等多种因素,设计出“满意算法”,并不一定要寻求“最优算法”。分布式查询算法的核心部分是全局查询优化算法,将查询请求合理地优化分解为子查询任务,并尽量使子查询任务并行执行,其中要考虑一个子查询任务在某个节点的执行代价,将子查询任务交给最合适的节点来执行,若某些子查询任务不能并行执行,则需要交换其执行顺序。查询的类别分为三个层次:原子查询、简单查询(包括不确定查询、合并查询、连接查询)和复合查询。查询过程对用户是完全透明的,用户提交的全局查询需求分解为几个相关节点均可识别的本地局部查询(即予查询)请求,然后执行每个局部查询任务,即将复合查询问题转化为简单查询问题,再将简单查询问题转化为原子查询问题,最后将各节点的查询结果汇总并返回给用户。本文的分布式数据库查询,根据每个用户的查询请求分别设计查询算法。其中连接查询及其半连接技术和复合查询的复合策略是研究的核心。连接查询的优化问题几乎是分布式查询优化算法的全部,本文的主要手段是半连接技术,半连接算法针对有两处以上的不同网络节点的信息组合连接时,本着减少节点之间的数据传输量的目的,提出一个复杂度和延迟时间之间进行衡量的优化算法。复合查询的策略分为连接优先和合并优先策略,目的是从增加并行性或减少子查询方面优化查询。关键词:分布式数据库、分布式查询、联邦数据库、WEB山东大学硕士学位论文ABSTRACTTheworkofthispaperaimsatanenterpriseorasub—tradesystem,,’eonegoodplatformofdatabaseapplication,thenB/Sthreelayers(multilayer),“thesatisfiedalgorithm”butnotnecessarilytoseek“thebestofa11algorithm”.————