文档介绍:人民银行广州分行IT系统运维治理平台方案故事目录1 方案背景 22 IT治理需求 性能监测的需求目标 IT治理的特别挑战 33 方案实施预期成效综述 GAINEM方案 方案说明 方案物理拓扑 方案逻辑拓扑 提供集中的跨层次监测平台 以业务为主线建立治理监测视图 以高层治理者角度定制系统 75 总结方案的成效 9方案背景在金融行业猛烈的竞争中,广州人民银行不断拓展自己的新业务范畴,同时也充分意识到业务服务的高可靠性才是提高对整体服务中意度和忠诚度的核心竞争力。广州分行目前的IT治理自动化程度低,网管系统和业务系统监控是相对独立的,机房环境监控尚未形成规模,保护人员疲于被动的应对多套治理工具,多种形式的告警,分离的故障和投诉。不仅大大降低了已有网络资源的利用效率和保护人员的工作效率,也造成IT治理严重脱节于企业业务的整体治理,新业务的扩展不断引起IT建设和保护成本的飞涨。随着广州分行网络规模的不断扩大,网络设备数量和各种应用软件系统的慢慢增多,软件和硬件设备显现问题的情形也越来越多,网管人员现在处于一种“救火员”工作方式,就是哪里显现问题,就去哪里救火解决问题。因此,建设IT系统综合治理平台实现对所有IT系统和资源的24小时无人值守就成了当务之急。广州人行在本系统内经过多年发展已建立了大小二十多个业务系统,每个系统对行里来说说都是至观重要的。IT治理需求建立IT综合治理平台,实现横向对网络系统、业务系统和机房环境的运行状况实行监控,实现纵向对系统治理员、部门领导人、行领导等决策层的多层次监控展现。性能监测的需求目标目前银行业采用的IT治理工具大都是以传统的IT元素监控为出发点,基于各自独立的派系式模式,即使在同一网络的不同区域也是各自为政,甚至普遍存在着同一机房中同时使用多套分散监控工具的局面,更谈不上从企业业务的宏观角度去主动治理整体的IT架构。全新的IT治理理念认为,对IT的治理必须舍弃对IT元素的独立治理,而必须作为一个整体统一的治理,只有这样,才能正确表达多个IT资源与业务的关系,实现着眼于业务角度的整合式治理。这次主要测试的内容有:监测网络使用情形;监测网络的通断,并及时报警;监测每个交换机的端口流量,CPU、内存的状态;监测服务器的CPU、磁盘、内存、IO及平均负载等信息,显现问题时,能及时报警;监测Sybase的每个库的运行状况,当显现问题时,能及报报警;监测Lotus状态,及每一个关键进程的活动状态;监测IIS状态,及每一个关键进程的活动状态;监测URL状态,及每一个关键进程的活动状态;将多个主机和应用,按业务的关系,模拟业务应用进行整体监测广州人行IT系统现状:大约有30个网络节点(包括:思科、华为、北电、中软……)主机节点约有40个(IBM、HP……)数据库有:SYBASE、ORACLE、MYSQL、DB2WEB应用:WEBLOGIC、WEBSPHERE业务应用:CICS、DOMINO自主研发产品及应用等IT治理的特别挑战图表直观、指标全面、易于治理是人行广州分行IT系统治理平台建设的基本要求。直观是指各种图表能直接反映网络系统的结构,并直接发觉运行过程中网络的故障点及存在问题;指标全面是指各种监控参数应尽可能详细,并能汇总排列;易于治理是指尽可能提高图表