1 / 29
文档名称:

CNNIC自有运维监控平台规划.docx

格式:docx   大小:1,302KB   页数:29页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

CNNIC自有运维监控平台规划.docx

上传人:zhanglaifa 2017/7/11 文件大小:1.27 MB

下载得到文件列表

CNNIC自有运维监控平台规划.docx

文档介绍

文档介绍:CNNIC
自有运维监控平台规划
文件状态
草稿
报审稿
正式发布
文件标识
当前版本

作者
CNNIC运行管理中心-工程部-应用服务组
使用范围
创建日期
2011-09
生效日期
目录
1. 规划背景 3
关于运维监控系统 3
NIC自有运维监控平台的必要性与可行性 3
现有监控系统分析 4
设备与服务监控系统(SOS2) 4
SOS2 4
开源网络流量监测图形分析系统(MRTG/CACTI) 6
2. CNNIC应用运维体系规划 8
规划概述 8
应用运维体系四个组成部分 8
8
9
9
9
3. CNNIC自有运维监控平台方案 10
建设目标 10
设计原则 10
平台架构 11
监控系统设计 12
逻辑拓扑 12
物理拓扑 13
系统特色 14
系统功能 14
用户管理 14
设备层监控 14
网络层监控 15
服务层监控 15
业务层监控 15
问题告警与自动化处理 16
业务与数据流的图形化展现 16
性能与兼容性 16
性能要求 16
兼容性要求 17
系统安全 17
架构安全 17
软件安全 17
监控测试原型系统 18
知识库设计 21
配置管理数据库(CMDB)设计 21
实施阶段及资源需求 21
项目实施推进时间计划 21
项目实施人力资源需求 21
项目实施硬件资源需求 22
参考文献 23
附录一:开源网络监控和管理软件对照比较表 24
附录二:主要监控项设计及比较 26
规划背景
关于运维监控系统
监控是系统与服务运维的基础和核心。依靠监控系统能够实时准确地反映出系统与服务的运行状况,快速监测出在业务运营各环节出现的故障,使运维人员快速定位问题、隔离故障点并进行修复,从而保障业务的连续性与可用性,奠定IT系统运维管理的基础。
NIC自有运维监控平台的必要性与可行性
2005年,为了保证线上域名相关服务运行的稳定性、NIC开始建设运维监控平台SOS2(Service Operation Supporting System)。Gain Enterprise Manager[1]系统为核心建设,同时提供针对日常运维工作涉及到的诸如排班管理、文档管理、配置管理、IP管理等功能。2009年在原有系统基础上进行功能改进和性能提升,通过对系统监控项进行合并及优化,达到了降低虚警率和提升用户体验的目的。目前,NIC所有硬件设备与软件服务的监控,其规模已十分庞大。
NIC业务不断发展,同时业内相关技术也在不断进步,NIC运维团队的管理与技术水平也在不断提升。我们的运维技术在不断满足自身需要的同时,也在不断谋求发展与突破,NIC肩负的国家使命要求我们在核心运维技术不能长期依赖第三方厂商,而必须进行自主研发和建设,NIC自有运维技术与产品输出的第一步,NIC自有运维服务水平和自主研发实力。
经过调研,NIC自有运维监控平台的建设是最为可行一种方式,并且能够与现存开源网络监测系统进行融合统一。因此,可以在借鉴现有SOS2系统各种优点的基础上,充分利用开源产品的开源与可定制优势,NIC自有运维服务水平和自主研发实力,也同样有利于SOS2监控系统的改进和提升,从而改变我们单独依赖于第三方产品进行核心运维的局面,NIC运维监控两条腿走路,两手都要硬的目的。
现有监控系统分析
Gain Enterprise Manager的监控系统进行系统及服务监控,同时使用MRTG[2]及Cacti[3]两个开源网络监测系统进行设备与服务流量监测。
设备与服务监控系统(SOS2)
SOS2
SOS2系统架构
图1-1. SOS2服务监控代理拓扑图
从图1-1中可以看到,应用层探测服务器使用的IP地址有:、、、()、(数据库探测);灾备中心服务器使用的IP地址有: