1 / 11
文档名称:

双机热备.doc

格式:doc   大小:380KB   页数:11页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

双机热备.doc

上传人:endfrs 2017/9/11 文件大小:380 KB

下载得到文件列表

双机热备.doc

文档介绍

文档介绍:双机热备
双机热备概述
双机热备需求
随着信息化建设的不断推进,企业的信息化已经非常普遍,各个企事业单位的活动越来越多的依赖于其关键的业务信息系统,这些业务信息系统对整个机构的运营和发展起着至关重要的作用。如果一些关键应用一旦发生宕机故障或应用停机,将给企业带来巨大的经济损失,并且由于业务的不可用而影响了企业的信誉,致使客户对企业失去信任,所造成的危害是致命的。
非正常的服务终止时间的长短会对用户造成不同的损失,或者说用户对服务停止所能承受的时间是不同的。通常取决于应用的类型,如果能够在几秒钟内修复错误,不会对一个在线联机事务(OLTP)处理系统构成影响,但是对火箭发射等实时应用,哪怕只停止一秒都是不可忍受的。
由于系统的任何一个部件都可能发生故障,因此系统设计师在构建系统时需要能够预见到系统可能会发生的各种故障,并进行软硬件的部署,在这些故障后发生能够迅速纠正。
可见,对那些需要保障信息安全和提供不间断的信息服务的企业而言,业务系统的容错性和不间断性显得尤为重要。如何保障各种关键应用持续运营,达到永续经营的良性循环,已成为当今企事业单位和IT领域急需解决的关键问题。
服务宕机的必然性
通常企业构造服务的硬件环境为单一服务器配置模式,一旦因为计划中宕机和计划外宕机,便会引起服务终止。
计划中的宕机通常指完成系统升级、应用迁移、部件更换等操作引起的宕机,这些计划中的宕机是企业维护服务正常工作不可避免的工作项目,虽然可以人为地采取一些措施减少损失,但依然会造成服务的终止。
计划外宕机通常是由于系统出错造成的。错误包括硬件、软件、系统和网络,或是系统运行外部环境原因等,这些情况包含了:硬件故障、操作系统崩溃死机、硬盘满、电压不稳、跳电、电源损坏、网络故障、软件漏洞(Bug)、应用出错。同样人为失误造成的故障也称为出错。当然,并非所有的出错会造成宕机,也不是所有的意外宕机都是由于部件出错造成的,灾难或其他意外情况同样会造成服务终止。计划外宕机通常会导致非常严重的后果,比如酒店的入店和结帐系统故障,所有的客户将无法check-in和check-out;医院的电脑系统出错,将导致患者无法结账、医生无法得到患者信息,甚至无法进行手术;银行的记帐系统因电脑出错,客户将无法提现和存款。总之,机会外宕机所造成的损害将非常大。有些环境下,系统停止服务将导致事务处理无法进行,必将导致客户对企业信任度降低,甚至会给客户带来不可挽回的损失。
双机热备解决方案
通常,对于服务因错误造成的不可避免终止,企业都会安排相关的管理人员进行定时的监控,一旦发现服务不可用,便会立即进行处理排错。这是非常原始的双机热备解决方案,存在诸多问题,譬如及时性问题,一旦错误在深夜发生,而人工不可能24小时监控;再譬如处理时间长短不可控,一旦错误造成的原因非常复杂,排错非常困难,需要非常长的时间,那么服务的终止将非常长。在排错过程中,人为操作失误将可能导致系统的永久瘫痪。另一方面,为了维持系统的双机热备而配备操作人员,劳务费用也非常昂贵。
目前,市场上提供多种双机热备解决的软件解决方案。主要原理是在提供硬件冗余的系统基础之上,运行高可靠性软件而构成。双机热备软件自动检测服务的运行状态,一旦服务在主机上出现故障,双机热备软件将自动地把服务转到另一台服务器上,从而让服务持续可用。对系统应用状态的监控和服务故障的恢复,由双机热备软件自动完成,减少了人员的负担。
双机热备工作原理
双机热备硬件配置
双机热备环境中,硬件是要求冗余的,包括两台服务器(我们称这种环境为双机容错), 每台服务器拥有足够的I/O能力、内存容量、系统硬盘空间、网卡部件,使得配置能够在使用中符合系统的需求,并能够最大限度的降低系统停机时间。
存储系统通常也必须是冗余的,例如,将数据存放在RAID 5磁盘阵列中。当一个硬盘发生错误时,数据仍然可以正常访问,而且可以从其他硬盘中恢复出这个硬盘的内容(称为RAID重建)。
图1 双机热备的硬件拓扑结构
双机热备的硬件拓扑结构如图1所示。
服务器:主服务器和备份服务器运行同一版本的操作系统,但其硬件配置可以不一致,主服务器为提供服务的服务器,备份服务器平时不提供服务,只有主服务器出现问题时,其能够接替主服务工作的服务器。
私网:用于在服务器之间传输cluster的信息网络结构,其主要是支持TCP/IP协议的以太网和光纤网。
公网:供客户端访问服务的网络,客户端可以通过公网访问到每台服务器。
共享存储:每个服务器都能访问的存储设备,同时也是服务数据存放的地方,一般采用磁盘阵列,为了对数据进行冗余保护,可根据客户需要做不同的RAID级别数据保护。磁盘阵列的接口形式可以是iSCSI、FC、SAS、NAS等。
双机热备工作原理
每台服