文档介绍:国防科学技术大学
硕士学位论文
星载计算机多机并行系统容错技术研究与设计
姓名:王伟成
申请学位级别:硕士
专业:计算机科学与技术
指导教师:罗宇
20100301
摘要星载计算机设备运行于外层太空中,容易受到空间强辐照射线对电子设备产技术。使用了容错技术的星载计算机系统在发生硬件故障或软件错误的情况下仍然能够正确执行指定的任务。星载多机并行系统采用分布式的多节点并行体系结构,具有良好的重构能力和一策略,可以对单粒子效应等由空间恶劣环境引起的故障进行容错处理,有效地提①设计了一种动态主从式的多节点并行星载计算机体系结构。该系统的特点②在该体系结构中,提出了后备主节点的概念,用来负责监控主节点的状态,计了多机并行体系下的节点间故障监控通信的概念和类型。③通过故障模式影响分析对星载多机并行系统的故障发生情况和类测恢复机制,并围绕该机制进行了各种容错恢复策略的研究性工作。④在7⑵教ǘ孕窃囟嗷⑿邢低辰辛嗽拖低车纳杓朴胧迪帧通过平台模拟器模拟了其底层的硬件体系结构和基本运行机制,在此基础上开发实现了各种容错恢复策略程序。⑤利用随机分析工具对星载多机并行系统进行了建模及性能主题词:容错技术,星载计算机,故障模式影响分析,层次式故障检测,国防科学技术大学研究生院硕士学位论文生的各种效应影响,产生各种软硬件故障,因此需要运用容错技术手段来保证其对可靠性的高度要求。容错技术是提高可靠性、保证系统能够全天候工作的关键本文设计了一种新型的星载多机并行系统,并对其进行了原型机的实现。该定的通用性。配合该结构,设计了基于层次式容错故障检测恢复机制的多种容错高了系统的可靠性。本文的主要工作和创新点如下:是不含专门的集中式管控部件,所有系统的管理控制功能可由分布式的各节点共同制定策略实现。同时在主节点失效时接替主节点的工作,增强了系统的可靠性和容错恢复的实时性;提出了全局状态信息表的概念以及其在多机并行体系下的存储访问方式;设型进行了系统的分析归纳,在此基础上针对性地设计了一套层次式的容错故障检分析。第
②③④—⑤.琕猼①瑆.,,瓸瑆..瑆現国防科学技术大学研究生院硕士学位论文猰.,猺.,;;.猟。第页。—猲;甌—
表目录表原型系统节点模块功能描述表⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.表全局状态信息表⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一表系统表⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯表节点任务表⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯表低车目纱锉晔丁国防科学技术大学研究生院硕士学位论文第
图目录图全局状态信息表存储逻辑结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.图任务死循环容错故障检测恢复机制流程⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.图初始化流程工作伪代码⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.图节点失效控制子模块函数调用关系⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.图创新一号星载计算机系统结构图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图甇低橙荽斫峁埂图星载多机并行系统总体结构图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.图星载多机并行系统容错逻辑结构图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..图系统异常处理机制⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.图系统异常处理流程⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图后备主节点和一般节点失效容错策略流程图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.图主节点失效容错策略流程图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.图任务重新部署流程图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..图任务并行复算运行流程⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图四节点星载多机并行系统原型系统逻辑结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.图全局状态信息表结构体⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图任务异常处理函数伪代码⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..图任务失效控制子模块函数调用关系⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.图任务并行复算机制模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..图原始程序实例⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.图复算接口函数内部伪码⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..图经典P汀图星载多机并行系统容错系统P汀P偷穆矶品蛄础国防科学技术大学研究生院硕士学位论文第页
型堑立塞二蟹乏』塾直日期:加石年弓月岁日期:加卜年乡月弓学位论文版权使用授权书独创性声明日期:矽D旯拢唬其他入已经发表和撰写过的研究成果,也不包含为获得国防科学技术大学或其它何贡献均已在论文中作了明确的说明并表示谢意。星羹馏鹄菖ば哂Ш熘羡业婵细凑趇土本人完全了解国防科学技术大学有关保留、使用学位论文的规定。本人授权国防科学技术大学可以保留并向国家有关部门或机构送交论文的复印件和电子文档