文档介绍:中国移动江苏公司网络部
十一月 17
江苏公司告警关联工作汇报
- 2 -
目录
网管部署
指标分析
江苏特色
愿景期望
优化阶段
意义和目的
现网IP、软换设备组网,组网复杂,故障点多,故障原因可能是传输网、IP承载网、交换等各种设备,在故障处理过程中,故障定位困难,故障定位时间长。
现网告警数量巨大,派发告警工单多,使监控人员和维护人员陷入大量工单中,影响故障处理和设备维护等正常工作。
现网设备不断增多,人员不变,如何避免维护人员花大量时间在工单处理上。
工程频繁,传输网、承载网、相邻网元工程,都会导致大量无效告警工单。
1、告警关联:快速准确故障定位
2、告警关联:告警压缩派单、减少工单量
3、告警关联:解决无效工程告警工单
4、告警关联:提高工作效率、提升故障处
理质量
告警关联:高质高效低成本运维!
告警关联项目过程
准备阶段
程序开发
测试阶段
优化阶段
正式运行
告警标准化系统上线运行
告警关联规则梳理
系统设计
系统开发与集成测试
关联规则测试
系统派单测试
关联规则优化
系统派单优化
KPI指标分析
准备阶段
告警标准化系统上线运行
告警关联规则梳理
—江苏话音网告警标准化系统试运行
—江苏告警话音网标准化系统正式上线运行
--集团组织安徽会议对话音网告警关联规则评审
--江苏牵头梳理话音网卡特设备的告警关联表
--集团组织安徽会议对TD告警关联规则评审
--江苏牵头梳理大唐TD设备的告警关联表
—江苏牵头话音网卡特设备告警梳理
—江苏话音网告警标准化系统开发
卡特、大唐告警关联规则梳理
江苏为大唐TD设备告警关联试点的牵头省,共梳理告警关联规则31条,其中主次关联规则21条,衍生告警关联规则10条。涉及网元类型有RNC、NodeB 2类。
江苏为卡特设备告警关联试点的牵头省,共梳理告警关联规则45条,其中主次关联规则4条,衍生告警关联规则41条。涉及网元类型有HLR、MSC_SER、MGW、BSC 4类。
程序开发阶段
2009年5月集团在杭州组织告警标准化评审会,会上讨论形成《中国移动省级话务网网管系统告警关联功能规范》,并制定了告警关联工作时间进度计划,江苏按此计划进行告警关联程序的开发。
5月中旬完成系统设计,包括所有模块的设计:关联分析引擎、KPI指标计算模块、自动派单调整。
7月中旬完成系统开发与集成测试,包括各功能模块的开发和实验室测试:告警关联规则查询、维护,告警关联呈现,关联分析引擎,关联告警派单,KPI统计报表。
7月底完成告警关联程序部署。
测试阶段
验证每条关联规则是否在网管正确部署,确保不影响告警监控与工单的正常派发。
告警关联测试目的
模拟验证、逐条验证、正向验证、反向验证、报表验证
告警关联验证方法
验证关联规则的准确性:该告警关联条件是否正确,告警关联时间窗、频次是否合理,定位信息是否正确。
验证关联告警的准确性:满足条件的告警是否正常关联,有无误关联,关联告警生成时间和关联告警清除时间是否正确。
验证派单的准确性:主/衍生告警工单是否及时派发,次/子告警工单是否被抑制。
告警关联测试项目
测试阶段最重要、繁琐、耗时的是告警关联规则验证,其它测试还有关联呈现、关联查询、关联配置、关联派单、系统稳定性测试。
测试阶段----五种验证方法
模拟验证
在测试环境中,模拟上报满足触发关联条件的设备告警,验证关联告警是否正常建立;模拟上报满足关联告警解除的设备告警,验证关联告警是否正常清除。
逐条验证
根据关联规则梳理表逐条到告警标准化系统查询,并核对关联告警的关联时间窗口、量值、触发关联条件是否与关联规则相符,保证该条关联规则的部署正常。
正向验证
每天在话务网管上查询昨天的历史关联告警,检查是否存在不满足关联条件但产生关联告警;检查关联告警的告警关联产生时间、告警关联清除时间等是否正确。
反向验证
每天从EOMS中导出昨天的EOMS工单,检查是否存在符合告警关联条件应抑制派单,但未生成关联告警按原子告警或次告警派单的现象。
报表验证
根据KPI报表中的单条关联规则效果评估表中的告警匹配数和关联成功数等各项数值进行对比,检查程序是否存在异常。
测试阶段----五种验证方法的比较
验证方法
适用阶段
使用人员
功能、优缺点
模拟验证
测试阶段
开发人员
验证每条关联规则的网管部署是否正常。
逐条验证
测试阶段
维护人员
验证每条关联规则的网管部署是否正常。
正向验证
测试阶段
优化阶段
维护人员
主要用于发现