1 / 56
文档名称:

分布式多节点容错系统的设计与实现.pdf

格式:pdf   页数:56
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

分布式多节点容错系统的设计与实现.pdf

上传人:coconut 2014/2/17 文件大小:0 KB

下载得到文件列表

分布式多节点容错系统的设计与实现.pdf

文档介绍

文档介绍:大连理工大学
硕士学位论文
分布式多节点容错系统的设计与实现
姓名:刘晶晶
申请学位级别:硕士
专业:计算机系统结构
指导教师:王占杰
20091215
要摘息处理,人们对计算机系统的处理能力和可用性都提出了更高的要求。为避免因故障导致的停机和服务的中断,就要尽可能的提高业务系统的稳定性和可用性。最常采用的高可用技术便是容错技术,其中最具代表性的是集群系统,它在提高服务可用性方面得到基于以上出发点,本文首先对高可用、容错和集群的各种关键技术进行了深入的研究和探讨,并总结了当前集群系统普遍面临的问题。针对这些问题,利用实验室现有的软硬件资源,设计并实现了一个分布式多节点容错系统。该系统不仅具有二级容错能力,构架存在的消息复杂度高等问题,本文构建了分组管理模式,不仅满足了系统的可扩展性,更大大减少了因节点间周期性发送消息带来的通信代价。针对任务调度的问题,点的调度模块执行,降低了算法的求解复杂度,提高了效率。同时,算法综合考虑多了多方面的性能指标,包括任务的最早执行时间、通信量、负载均衡和调度开销等,能够根据任务和系统运行的状态进行动态多目标调度,从而满足各方面的性能要求。在此基础上,设计了失效任务和故障节点的接管算法。通过任务调度算法对失效的任务进行合关键词:高可用性;容错;任务调度;故障接管随着τ玫娜找嫫占埃绕涫窃贗咸峁┐罅康纳桃捣窈痛蠊婺P了业界越来越多的关注。即提供对任务和计算节点的双重保护,还具有灵活的任务调度功能以及较好的负载均衡能力。系统采用分布式的松耦合体系结构来组织节点,具有良好的可扩展性。针对分布式本文设计了分布式任务调度模型及分布式协商调度算法,将大部分决策过程分布到各节理的重新分配,即保证了系统整体性能,又满足了系统高可用性的要求。大连理工大学硕士学位论文
甌,,琣,瓵瑆甇,.—..,—,,琤甌,,,瑃琣,.Ⅱ
篐分布式多:说闳荽硐低车纳杓朴胧迪.;;;.Ⅲ.
蝴逝是垦盔叁趁堡望过丝盘日期:—点丑年—丝月耆到弱酗大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,,本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。学位论文题目:作者签名:
导师签名:甑阂贿谠聊晡涝隆蝗学位论文题目:盆獐氢丝堑童。痉蕴丞蕴酌丝巡复塞弛到望日丝年—生月—堡日大连理工大学学位论文版权使用授权书本人完全了解学校有关学位论文知识产权的规定,在校攻读学位期间论文工作的知识产权属于大连理工大学,允许论文被查阅和借阅。学校有权保留论文并向国家有关部门或机构送交论文的复印件和电子版,可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印、或扫描等复制手段保存和汇编本学位论文。作者签名:日期:大连理工大学硕士学位论文
髀课题背景随着计算机技术和网络技术的飞速发展,人们社会生活的各个方面越来越受到了信息技术的影响。无论是公司和企业的商务活动,还是金融,电信和银行等关系到国计民生的关键性部门和行业,都开始广泛地采用计算机系统来进行数据存储和大规模的信息处理。但与此同时,也引来了另一方面的问题。就如美国国家科技研究委员会的计算机科学技术范围和方向审定委员会所认为的:计算机在给社会带来利益的同时,也带来了损失。社会对运行失败的计算机系统的关注就像对诸如失业、侵权等方面一样,计算机对社会已不再是一种单纯的正面的影响【¨。计算机系统一旦运行失败或产生故障,就可航天和金融等大型的关键应用方面,计算机系统任何的故障都会产生重大的影响或威的事故,年美国商务航空公司由于计算机系统瘫痪,造成圣诞节期间飞往龀市的个航班延误和取消等等,都是由于计算机系统故障而产生的严重后果。随着应用的日益普及,尤其是在它上面提供的对大规模海量信息和数据的仅年月盏碧欤肆髁烤鸵丫咏亿人次,而交易量则达到了谌嗣币。如此大的访问流量给服务器带来了巨大的负载和压力。同时,一旦服务器出现了故障,则会给网上消费者及卖家产生无可估量的影响。传统的计算机系统己无法满足当前计算和信息处理能力的需要,因此一方面需要建立可伸缩的高可用计算机系统来满足应用需求,另一方面也要保证服务的高可靠性蛭U饫嗤镜闹卸暇鸵馕蹲啪薮蟮木济损失和声誉的降低。如何建立具有高可用性和高可靠性的计算机服务系统就成为摆在人们面前的问题。为了提高计算机系统的可用性,人们开始建立具有一定容错能力的计算机系统来解决数据和应用保护问题。容错是实现计算机系统高可靠性的重要手段,所谓容错是指在系统内部出现故障时,计算机仍然能够正确的执