文档介绍:某地应用级容灾方案
(初步解决方案)
一、容灾备份中心建设模式分析
客户现已在中心机房对现有重要业务及应用部署了HACMP集群,确保不会出现因本地软硬件或系统管理维护导致的失效而引起应用和数据对用户的不可用。但本地容灾方案无法解决因火灾、自然灾害(如洪水、地震)造成对系统及应用数据的破坏。
对于客户的信息系统建设,光有本地的设备冗余和数据备份是远远不够的,如果数据中心出现非计划停机(如停电、自然灾害等),那么其下辖的网点将无法正常开展工作,必须要防范区域性灾难对系统造成的重大影响。因此应该采用本地备份和异地应用容灾相结合的保护措施,确保数据中心即使遭遇整体性故障,应用容灾中心能在很短的时间内接管所有下辖网点和相关部门的业务,确保业务的整体高可用性。
容灾中心建设模式的确定主要考虑以下三方面因素:
(1)灾难承受程度:明确数据中心需要承受的灾难类型,系统故障,通信故障,长时间断电甚至火灾等意外情况所采取的方案不尽相同;
(2)业务影响程度:明确当数据中心发生意外无法工作时,导致业务停顿所造成的损失程度,即对于IT环境发生故障的最大容忍时间,它是容灾中心系统建设的重要指标;
(3)数据保护程度:是否要求数据库可以恢复所提交的交易并且要求实时同步数据,即数据的连续性和一致性,决定了灾难恢复方案规模和复杂程度的重要数据。
从上述分析可以看出,在对业务影响程度和数据的保护程度要求较高的前提下,如果距离不是很远(在几十公里之内),那么采用“同步”的方式最为理想。因为业界现有的技术已经可以在这样的距离之内将线路铺设成本降至最低,同时提供最大的带宽;容灾技术对于业务性能的影响也可以降低到最低(5%之内)。
客户的容灾备份系统采用应用级的同城异地容灾系统,由于生产中心与容灾中心同在某市内,数据复制的距离不是很远(在十公里到三十公里之内),因此建议采用同步数据复制方式。只有这样才能够保证数据的零丢失。同时为了保证主要核心业务系统能最快的得到接管,在主数据中心,灾备中心和下辖网点之间采用高带宽TCP/IP网络连接方式。
为了确保数据中心出现紧急事件(如大面积停电、自然灾害等)发生时,确保所有业务能第一时间切换到容灾中心,必需确保数据中心和容灾中心的数据实时的同步,而且确保这些数据能被容灾中心的业务在很短的时间内使用,只有这样,切换到容灾中心的客户端连接才可以正常的处理业务,根据本原则,容灾中心主要由以下两部分组成。
容灾中心系统包括如下的组成部分:
(1)网络容灾
客户的容灾机房建设要充分考虑系统整体网络结构和配置的容错和容灾能力,通过采取全面的容灾部署,来满足业务系统的稳定性、有效性及不间断的需求。通过在数据中心配置路由器、交换机、防火墙,广域网采用与主数据中心同一个运营商的线路。
(2)应用、数据级的容灾
应用、数据及的容灾基于磁盘的数据复制技术来实现。磁盘的数据复制技术指的是主备系统的磁盘系统通过磁盘镜像技术来做数据复制。系统需要把主中心的全部数据盘(包括各种数据库的文件和其它数据文件)复制到备份中心。一般来讲,物理级数据复制技术包括两种方式:同步方式以及异步方式。
.app的存储,,但现在数据中心使用的存储时EMC和其他存储,,他们之间是没法同步的,只能通过两边存储虚拟化来抹平存储异构的问题。
二、系统总体结构
1、容灾中心的功能及拓扑
对于客户数据中心与容灾中心之间的数据复制链路,为了提高在数据同步时业务的稳定,建议采用两条裸光纤直接相连,主备中心之间采用高速TCP/IP网络连接方式,来实现数据复制
分析客户现在的业务结构,客户数据中心现有30多台X系列服务器和8台小型机,其中小型机包括HP小型机和IBM Power小型机。
根据各业务对CPU的不同配置要求,在容灾中心使用两台IBM power 740和若干台IBM X3850来实现应用平台的搭建,中心机房与容灾中心之间的拓扑结构如下图所示。
如上图所示,中心机房与容灾机房间通过两根裸光纤相连,每对B24交换机之间级联一根裸光纤。
上图容灾机房的蓝色阴影部分为可选配置,可以在将来添加一台高容量带库,定期实施镜像数据的备份,这样更添一份保险。
2、容灾中心X系列平台搭建
在容灾中心采用若干台IBM X3850服务器搭建,采用VMware虚拟化技术搭建虚拟池,在虚拟池中可以划分出足够客户使用的虚拟机,可以通过P2V技术实现现有业务的迁移或者是在容灾中心重新部署业务环境
3、容灾中心小型机平台搭建
(1)对于数据中心的IBMpower小型机的容灾,在容灾中心通过2台power740搭建小型机备份平台,采用PowerVM虚拟化