1 / 9
文档名称:

分布式数据库系统.docx

格式:docx   大小:22KB   页数:9页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

分布式数据库系统.docx

上传人:niupai11 2022/10/25 文件大小:22 KB

下载得到文件列表

分布式数据库系统.docx

相关文档

文档介绍

文档介绍:该【分布式数据库系统 】是由【niupai11】上传分享,文档一共【9】页,该文档可以免费在线阅读,需要了解更多关于【分布式数据库系统 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。分布式数据库系统
摘要:随着时代的发展,分布式数据库在各行业中的应用也越来越广泛,分布式数据库系统是数据系统和计算机网络进行结合的产物,其目的是为了可以使计算机网络中实现数据的分布于处理。如果在查询数据的过程中,数据处于分布式环境,由于查询涉及到的关系通常会被分片或是复制到多站点,因此计算代价的过程中不仅需要对于I/O和CPU的速度进行考虑,同时还需要考虑数据在站点之间进行通信过程中的网络传输代价。本文主要对于分布式数据库查询处理基本原理出发,阐述了优化算法,以及并发控制算法的引入,列举常用的分布式并发控制方法并对其特点进行分析,给出了一种新的并发控制方法,还有分布式目录管理。
关键词:分布式数据库并发控制查询处理目录管理
Abstract:withthedevelopmentofTheTimes,theapplicationofdistributeddatabaseinvariousindustriesisalsomoreandmoreextensive,distributeddatabasesystemisthecombinationofdatasystemandcomputernetworkproducts,,datainadistributedenvironment,becauseofthequeryinvolvesmorethanwouldnormallybedividedorcopiedtothesite,sointheprocessofcomputingthecostofnotonlytheneedforconsideringtheI/OandCPUspeed,,thispaperexpoundstheoptimizationalgorithmandtheintroductionofconcurrencycontrolalgorithm,liststhecommonlyuseddistributedconcurrencycontrolmethodsandanalyzestheircharacteristics,andpresentsanewconcurrencycontrolmethodanddistributeddirectorymanagement.
Keywords:distributeddatabaseconcurrencycontrolqueryprocessingdirectorymanagement
1引言
并发控制是指在多用户的环境下,对数据库进行并发操作进行规范的机制
并发控制是分布式数据库系统中分布式事务管理的基本任务之一,其目的是保证分布式数据库系统中多个事务高效正确地并发执行,从而避免对数据的丢失修改、读脏数据与不可重复读等,进而保证数据的正确性与一致性。其作用主要是协调同一时间访问同一数据库文件的多个事务之间的关系,防止这些事务之间发生冲突,产生一个可串行化的调度。
通过利用集中式数据库技术为基础,然后结合计算机网络就可以得到分布式数据库系统。分布式数据库内的数据相较于集中式数据库的区别为:其是网络不同的场所中采用分散性储存方式,同时所有场地的数据库都具有独立处理的能力。而每一个场地都需参与到执行全局应用程序中,而全局应用程序则是利用已有的网络拓扑结果来实现通信的目的,并访问在各场地分散的数据。但是由于实际应用和操作环节,并不会感受到分布式网络,但是操作确实属于整个数据库系统的,所以导致虽然分布式数据库物理上会在各场地分散,但是在逻辑方面却还是属于同一个数据库系统的数据集,而这也导致查询处理方面存在一定的复杂性。
随着移动通信技术的不断发展,泛在计算技术正与移动业务呈现出越来越紧密的融合趋势。据WWRF(WirelessWorldResearchForum)预测,到2017年,将有7万亿无线设备服务于全球的70亿人口,而这些设备大多将深入到人们的周边智能环境中,无声地服务于人们的生活。这些设备的协同工作在为人们带来更丰富的业务体验的同时,也对设备的自主控制与管理与业务的移动性带来了极大挑战,因为所有这些设备不仅数量较多,而且会随着用户的移动而经常变化。作者在国家863项目“统一业务终端技术(2003AA121580)”和“移动网格(2004AA119030)”中对个人周边智能设备构成的分布式系统进行的研究中[1],给出了一种适用于具有较强移动性的异构个人域环境的无中心化的目录信息存储机制,作为系统自主控制与管理的基础设施。
分布式数据库的并发控制算法
并发控制算法所针对的数据库并没有分别,但在信息的提取方式上却有很大的改变,充分掌握这一变化特征为算法引入创造一个理想的环境,这也是分布式数据库系统运行使用的针对部分。算法引入过程中功能实现也是重要任务,通过系统之间的相互配合运行,最终的数据库控制管理效果也能得到明显的提升,达到更理想的控制管理任务。
分布式数据库系统并发控制的理论基础
由于分布式数据库系统的排布相对分散,在控制管理上存在一定难度。应用并发控制方法,将分散式的数据库之间建立起联系,形成一个控制整体,在后续的并发控制中,只需要针对整体来进行管理控制,可以节省大量的数据分析时间,基于整体数据库系统之上,来进行更深入的数据分析,精确到各个分层数据库中,形成一个具有整体性的数据基础。这一系列任务实现的理论基础中,对于数据库的完善也有很大要求,数据控制管理是单项进行的,并不能够从读取的角度反复分析,这种控制管理特征对提升数据库运行效率有很大的帮助。当前流行的数据库基础中,具有数据锁定的功能,能够将运行中的数据库定位至具体的区域内,加强系统之间的相互配合,使数据库逐渐变得更全面,其中所存在的各项数据管理差异性也均能够体现,基于理论分析基础上探讨与分析技术相结合的有效方法,促进数据库系统的运行稳定性提升。
基于分布式数据库系统的并发控制方法分类
锁技术。该技术应用能够将数据库定位,锁定需要读取的范围区域内,这样在对数据库系统进行分析时也避免浪费时间,确保后续建设管理任务可以更高效的开展。系统需要完成的操作指令会进行一个分类,分析操作指令之间的关系,如果指令之间是相互串联的,则表示控制请求之间存在冲突,不可以同时实现,只有通过操作技术相互串联才能够得到解决,为后续管理计划落实创造一个稳定的基础环境。同时执行的指令在发生阶段不存在冲突,系统在分析时可以将这两项操作指令共同完成,达到更理想的运行使用效果,这也是传统方法中所难以达到的。锁技术应用正是实现了这两者之前的意义,通过简单的技术结合方法来判断各项功能指令之间的关系,从并发控制层面采取有效的处理方法,确保各项工作任务均能够得到有效的开展。锁定过程中还要考虑运行环境是否能够满足建设需求,例如信息传输效率不能满足这一需求,则要考虑对数据信息进行梳理,保障传输阶段的连贯性与信息安全性,以免信息资源受到损坏。
时间戳法。该种分析控制方法会将所需要运行控制的数据进行分类处理,观察在数据系统中所存在的问题,充分采取控制方法来进行完善解决,根据事物的先后顺序来确定时间上的排布,达到一个更理想的经营管理效果,时间的先后顺序也确保了分析结果之间处理独立状态,避免发生冲突现象,促进管理计划可以更高效的落实应用。其功能实现的依据是对每一项指令进行特定的时间设置,在该时间范围内,可以进行高效的发展运行,分析数据库系统中的信息,将所得到的指令传输到下一个系统中,这种方法对实现全面综合控制计划也是十分有帮助的。当事物指令之间发生冲突时,系统需要对其中的一项事物指令采取撤除的方法,这样接下来的指令控制才能更高效进行,确保管理计划在其中得到落实。该并发控制方法并不具有同时处理事物的能力,只是根据不同事物发生的时间来进行宏观调控,达到更理想的状态控制效果。如果系统运行中的冲突事件较多,应用这种方法在反应速度上很难达到使用需求,也增大了系统的运行安全隐患。因此通常在事件指令冲突较少的系统中适合使用这种方法,后续任务完成的稳定性也会有明显提升。
基于版本的并发存取策略。在该方法中,通过事件之间的联系体系建立,能够进一步提升分析结果的传输效率,更快的完成这一系统的反馈功能,实现对分布式数据库的全面监管控制。对于运行系统中可能会发生的隐患问题,充分掌握版本的自身运行规律,促进管理计划在其中得到更全面的落实,这也是其他方法中所不能实现的。基于版本之上所开展的各项管理控制,要求信息传输稳定性达到标准,避免在传输中受到结果使用稳定性的影响,进一步促进管理计划落实开展,提升现场工作任务完成的数据安全。当前的技术手段可以将数据库以视图的形式体现出来,观察在系统内部是否存在隐患情况,充分探讨预防控制方法,帮助实现综合管理任务。数据库之间联系系统的建立也要考虑事件发生的相互关系,确定一个更稳定的运行状态,更深入的提升工作任务管理效果。系统功能完善也是数据库的一个具体表现,关系到最终数据库系统建立的稳定性与全面性。
并发控制方法应用的注意事项
在并发控制方法应用时,要考虑分布式数据库系统的自身稳定性,并确定常规状态下的事件特征,更深入提升工作任务完成效果,促进管理计划在其中得到落实完善。需要注意的是事件是否会受环境影响发生改变,将环境因素融合到其中,这样发现问题处理效果也更理想,能够在问题发生后及时采取控制方法,基于数据库基础上所开展的各项分析任务,也要考虑其安全稳定性,将事件结合到数据库系统中加以分析探讨,实现综合管理计划。当数据库自身信息发生误差时,要在指令实现前选择有效的控制方法加以解决,以免问题继续深入影响到并发控制效果实现,技术方法应用是具有选择性的,从多个角度共同探讨问题,达到预
期控制目标。
分布式的查询处理
各个站点内的局部数据库系统模式的结构就是局部数据模式。全局数据模式的目的主要是协调局部数据模式,使其成为整体模式。
分布式数据查询的处理模式
在对于数据进行分片之后得到的片段就是分布式数据库数据中的分布模式,该部分是一种全部关系逻辑,每一个分片都可以进行一个或多个站点来开展分配和定为工作。分布模式能够以选择的数据来分配策略,同时还可以定义判断物理存放站点。在分布模式中,对于映像的类型进行定义之后,可以确定分布式数据分配冗余。如果映像属于一对多,那么就将片段存放到多站点之后进行分配,因此,这一数据分配工作属于冗余,但是情况如果相反的话,则表示不属于冗余。
分布式环境查询中主要包括本地产讯、全局查询以及远程查询。其中,本地查询也就是局部查询,并且本地查询与集中式数据库优化技术之间非常相仿。远程查询则是指单点数据远程通信,数据如果是冗余分配的话,那么就需要将查询通信处理付出的代价减少,同时选择与查询节点距离最为接近的数据。全局查询则指的是多点数据查询,首先在确定查询对象之后,开始进行路径的访问,而通过访问路径、算法,可以确定二元操作的连接有效性,在执行节点的过程中,要考虑查询速度以及执行效率、通信代价等。也就是说,要想实现查询处理的有效性,就必须要在确定必要的物理片段后,实现查询的目的,最终确定各操作在查询过程中的执行站点。另外,分布式数据库查询在优化方面,与算法操作具有十分密切的关系。
分布式数据库查询优化算法
查询优化在分布式数据库中,主要是围绕局部处理的优化以及查询策略的优化来开展的。不同的应用和机构所执行的策略也是完全不同的,因此,在传输的响应时间以及系统资源的消耗等众多方面也存在较大的差异。另外,查询优化方法主要分为查询转化以及查询映射。
(1)半连接查询优化基本方法。
(2)该这一方法是利用临界、投影操作所产生的一种关系代数,其适合应用在带宽较低的远程广义网络。半连接查询优化的原理是网络中只会传输参与连接的数据,并不会传递无用的数据和未参与连接的数据。数据传输为整个关系或是片段,属于冗余方法。
(3)二次半连接算法。请求结果存放的站点如果不是请求站点的话,那么在结果集的出现较大数据量的时候,将会导致数据传输网络出现拥堵,从而发生网络负载不均衡的问题,最终导致响应的时间延长,通信次数增加。以半连接为基础,对其进行改进之后可以得到二次半连接算法是,改进的目的是为了降低通信数据量,并提高各个站点的通信并行性。
二次半连接算法相较于半连接算法而言,在请求站点方面增加了一次连接过程,可以为不同属性进行排序,在所属的站点也同样可以进行排序,这样能够避免请求站点传输数据时,减少连接时间。在大型的分布式数据库系统中,二次半连接算法相较于半连接连接算法来说,在传输量和响应时间的性能优化方面具有更加明显的效果。
分布式目录管理
移动技术和泛在计算的融合在推动移动业务发展的同时也带来了移动性方面的挑战。分析了移动泛在条件下个人域网络的异构性、短距离性与组移动性的特征,针对这些特征给出了一种无中心化目录存储机制,用于个人域网络的自主维护与组织。在大量设备成组加入的情况下,消耗的带宽资源不会随之大幅增加,有效节约了带宽,维护了系统工作的稳定性。

不同于通常意义上的移动自组织网络个人域当中的设备虽然同样处在一个无基础设施的环境中,但其中的节点是一些各不相同的设备,而不是相同或类似的通用计算机,并且这些节点都围绕在一个用户周围。因此,异构个人域网络的基本行为特征可以概括如下:首先,设备能力各有不同,且通过异构网络互联。由于移动个人网络之中的节点都是个人周边的设备,这些设备中可能有计算和连接能力非常强的设备,也可能简单到如一些无线传感器,没什么富余的计算能力。虽然这些设备在能力上相差悬殊,但在应用中,它们各有用武之地。其次,设备之间的距离足够近。在个人域网络之中,所有可用设备都围绕在用户周围,所有设备间的距离都是足够接近的,影响互相之间的可达性的最主要因素不是距离带来的信号衰落,而是连接上的异构性或是通信制式的容纳能力带来的限制。因此,假设同一链路间的各个设备是互相可达的,跨链路转发则依赖于多模设备。此外,设备之间的相互移动行为具有组特征。在
MANET的组移动性研究中,组往往是由于人员组织等造成的,而个人周边的泛在设备的组移动特征更为显著,这些设备通常都是附着于某一实体的,比如车内的GPS导航仪、车载音响和车载电视等。所以,这些设备就是按组移动的,而某一时刻下,整个个人域网络总是由一个或若干个组组成的。因此,为个人域网络设计的各种机制需要考虑到上述异构性、短距离性和组移动性。
已有的分布式存储机制
对于分布式系统的组织维护所需的目录存储机制,目前主要有有中心和无中心分布式存储2大类。
有中心存储机制一般设置一个或多个目录服务器,系统中的所有节点都通过这些中心服务器存储或查询目录信息,但有中心的存储方式在网络中面临着2个主要问题:由于网络连接和服务器自身的可靠性是有限的,中心节点或关键链路失效会导致尽管整个系统的大部分元素工作正常,但服务却无法正常进行;由于中心节点的存储、计算能力和通信带宽都是有限的,当系统的规模增大时,中心节点相关的性能将成为整个系统的瓶颈。
当然,有中心架构并非只有一个节点,通过多个中心节点进行互相备份与负载均衡,可以在一定程度上缓解上述瓶颈效应,而如果让系统中所有有能力维护目录信息的节点都承担起存储功能,所有节点既是目录服务器又是目录客户端,系统的可靠性和可伸缩性将被极大增强,这就是无中心的分布式存储架构。由于个人域设备的可靠性有限且大部分设备都不会始终可用,无中心的分布式存储机制更加适用。
无中心分布式数据存储又分为结构化和非结构化2类。非结构化无中心存储方法中,节点之间的信息查找使用所谓的“泛洪”方式,即从一点起,向所有已知的节点散播查询消息,接到查询消息的节点会把用同样方法得到的信息返回给查找者,当然,一次查找所散播的跳数被限制在一个很有限的值之内,以避免过长的响应时间以及过度占用网络带宽,虽然这种方法没有任何组织开销,不需要任何节点为整个系统的组织负责,工作方式稳定而可靠,然而,它所带来的最显著的缺点就在于“不确定性”,即查找者无法确定得到的是否是最恰当的结果,因此更适用于文件共享而不是目录存储。而所谓“结构化”无中心架构是利用某种映射关系,将系统中存储的元素与存储这些元素的节点相对应起来,从而可以在有限步骤内,查询到一个元素或是确定地知道该元素不存在[2]。一类比较常见的用于结构化P2P中查询机制的映射关系是所谓的分布式哈希表
(DistributedHashingTable,DHT),基于相容哈希(Consistenthashing)理论[3],使用一个相容哈希函数处理存储节点的名称(地址)和要存储的数据的名称构成对应关系,并通过在每个节点维护一定的组织数据,能够提供大约OllogN的查询复杂度。不过,当节点发生变更时,需要付出一定代价管理维护组织结构。这一代价在动态性不强的互联网上并不会带来很大影响,但对于设备常常成组变化的个人域网络则可能带来很大影响。
异构个人域网络中的分布式数据存储具体地考虑移动个人网络中的分布式数据存储,作为MANET的一个子集,移动个人网络同样是没有任何基础设施,具有很强的对等与自组织性,这与无中心的应用Overlay非常类似,而且,由于个人域网络中,并不假设设备具有高性能与高可用性,需要避免因部分设备失效而带来的系统服务中断。因此,有必要将移动个人网络中的所有具有一定能力的节点组织起来,成为一个分布式系统信息存储的Overlay。
对于移动个人网络来说,应该避免结构化和非结构化的P2P方式均有其各自的不足:非结构化无中心的P2P分布式系统通常用于资源共享,没有固定的存储机制,不存在一个确定的"存储元素-存储节点”的映射关系;而结构化P2P当大量节点同时加入时,不可避免地会带来更高的维护开销和更长的达到稳定所需的时间。
将结构化P2P中的确定性部分地引入到非结构化P2P的基础架构之中,构成一种“半确定性”架构,达到效率和可靠性的折衷。为了均衡各个节点的负担,提高系统的可靠性和可伸缩性,数据以无中心方式分布到各个节点之上,并通过一定的冗余度,保障在节点大规模损失情况下的数据可靠性。数据信息会被组播到所有的目录节点,在广域网中,使用网络层组播的方式传递消息需要有较大的组播组维护开销和不小的组播消息开销,而个人域网络中,大量的节点分布在几跳之内的几个网段之中,而不是广泛地分布于互联网上,组播并不会带来额外的开销和流量。
5结语
并发控制是当前比较常用的技术性方法,指在多用户的环境下,对数据库进
行并发操作进行规范的机制。并发控制是分布式数据库系统中分布式事务管理的基本任务之一,其目的是保证分布式数据库系统中多个事务高效正确地并发执行,从而避免对数据的丢失修改、读脏数据与不可重复读等,进而保证数据的正确性与一致性。其作用主要是协调同一时间访问同一数据库文件的多个事务之间的关系,防止这些事务之间发生冲突,产生一个可串行化的调度。并发控制算法主要分为两大类:以封锁为基础的并发控制算法和基于时间戳的控制算法。
本文对于分布式数据库查询优化处理进行分离,同时也分析了其中的主要代价,以查询优化的主要因素为基础,对于具体问题适合的优化算法进行选择。另外,分布数据库系统的环境虽然非常复杂,但是随着web的发展,分布式数据库系统的查询优化技术在未来也会更加的完善。
本文为异构的个人域网络设计了一种无中心的分布式目录数据存储架构,用于个人域分布式系统的自主维护与组织,相比于已有的分布式数据存储算法,更有效地适应并利用了个人域网络的异构性、短距离性和组移动性。
参考文献
李中显,[J].农机化研究,2017(12):12-13.
白光远,——基于智能路由器
[J].农机化研究,2017(11):14-15.
郑宗强,翟明玉,彭晖,孟勇亮,高原,[J].电力系统自动化,2017(05):18-19.
张鹏宇•分布式数据库查询处理和优化算法[J].计算机光盘软件与应用,2014(19):106-
108.
张博•分布式集群环境下基于并行计算的图聚类信息高效处理方案[J].自动化技术与应用,
2016(35):29-35.
WANGX,JIY,TANGX,[C]..:IEEE,(WCNC2006),2006:236-241.
BALAKRISHNANH,KAASHOEKM,KARGERD,
Systems[J].CommunicationsoftheACM,2003,46(2):43-48.
KARGERD,LEHMANE,LEIGHTONT,:DistributedCachingProtocolsforRelievingHotSpotsontheWorldWideWeb[M].:ACMPress,ProceedingsoftheTwenty-ninthAnnualACMSymposiumonTheoryofComputing,1997:654-663.
STOICAI,MORRISR,LIBEN-NOWELLD,:AScalablePeer-to-peerLookup
ProtocolforInternetApplications[J].IEEE/ACMTransactionsonNetworking,2003,11(1):17-32.