文档介绍:1计算机系统安全第三讲计算机系统的可靠性2一、可靠性、可用性和可维修性可靠性(Reliability):指从它开始运行(t=0)到某时刻t这段时间内能够正常运行的概率。在给定的时间间隔和给定条件下,系统能正确执行其功能的概率称为可靠度。平均无故障时间MTBF(Meantime Between Failures)是指两次故障之间能正常工作的平均值。故障即可能是元器件故障、软件故障、也可能是人为攻击造成的系统故障。可维修性:指计算机的维修效率,通常用平均修复时间(MTRF)来表示。MTRF是指从故障发生到系统恢复平均所需要的时间。第三讲计算机系统的可靠性3一、可靠性、可用性和可维修性可维修性有时用可维修度来度量。在给定时间内,将一失效系统恢复到运行状态的概率称为可维修度。可用性(Availability):系统在执行任务的任意时刻能正常工作的概率。系统可用性用可用度来度量。系统在t时刻处于正确状态的概率称为可用度,用A(t)来表示。A = MTBF / (MTBF + MTRF) ,即:A =平均无故障时间/ (平均无故障时间+平均修复时间)第三讲计算机系统的可靠性与容错性4一、可靠性、可用性和可维修性提高可靠性的方法:完美性(perfection):提高软硬件的质量,抵御故障的发生。追求一种避错技术。要求各个部件具有高可靠性,容错性(Fault Tolerance):在故障发生时,系统仍能继续运行,提供服务与资源。这就是所说的“容错能力”。第三讲计算机系统的可靠性与容错性5系统可靠性的获得可靠性┌──────┴──────┐容错性完美性│┌───┴───┐冗余技术─┬硬件冗余完美硬件完美软件(redundancy)├软件冗余├整机完美性│ | | ├部件完美性可信软件 | └信息冗余└器件完美性第三讲计算机系统的可靠性与容错性6系统可靠性的获得 |静态冗余(部件冗余)动态重组 |--被动重组(后备stand-by) |--主动重组(优美降级graceful degradation)7二、完美性1、硬件的可靠性与完美性提高可靠性,可以通过元器件的精选、严格的工艺、精心的设计来实现。系统应尽量不出故障,一旦出故障,系统则失效。这种设计是以系统“不出故障”为前提的,故称为“避错设计”。2、软件的可靠性与完美性一般采用统计方式来衡量。在规定的时间周期内在给定条件下执行所要求的功能的程序的能力。第三讲计算机系统的可靠性与容错性8三、容错性1、容错系统的概念容错技术:在一定程度上容忍故障的技术。也称为故障掩盖技术(fault masking)。容错系统:采用容错技术的系统。容错主要依靠冗余设计来实现,以增加资源换取可靠性。由于资源的不同,冗余技术分为硬件冗余、软件冗余、时间冗余和信息冗余。可以是元器件级、部件级的、系统级的冗余设计。在可靠性与资源消耗之间折衷、权衡。第三讲计算机系统的可靠性与容错性9三、容错性1 硬件冗余:增加线路、设备、部件,形成备份堆积冗余:在逻辑域可采用多数表决方案。自动恢复。待命储备冗余:该系统中多个模块,其中只有一块处于工作状态,其余块都处于待命接替状态。当有一个模块发生故障时,立刻将其切除,并代之以无故障待命模块。混合冗余:堆积冗余和待命储备冗余的结合。第三讲计算机系统的可靠性与容错性10三、容错性数据备份 数据容错的策略就是数据备份,指的是将计算机系统中硬磁盘上的一部分数据转到可脱机保存的介质(如磁带、软磁盘和光盘)上。备份的策略有三种:完全备份增量备份差分备份。第三讲计算机系统的可靠性与容错性