文档介绍:基于大数据的人工智能运维服务支撑方案
01概述
在运营商传统网络运维中,巡检、告警分析、故障处理等工作长期积累了丰富的经验,其价值并未被充分挖掘。同时,目前的人工运维存在系统复杂耦合度高、数据来源多种多样、人工维护风险度高,修复间隔时间置信网络实现基站特征异常概率分析等功能。针对网络性能指标特征的异常情况,进行概率预判,即尝试对“亚健康”网络进行预判。预先判断网络问题,减少投诉和性能告警、设备故障实际发生的概率。
(SAE)
自编码器(AutoEncoder)是一种无监督的学****算法,主要用于数据的降维或者特征的抽取。autoeneoder通过深度置信网络进行预训练,从而确定网络权值的初始值。其目标是让输入值等于输出值。首先用网络权值矩阵对输入进行编码,经过激活函数后,再用矩阵转置进行解码,从而使得输出数据等于输入。该过程可以看作是对输入数据的压缩编码,将高维的原始数据用低维的向量表示,使压缩后的低维向量能保留输入数据的典型特征。
为实现智能站点画像,需要对站点的性能指标,资产信息,地理信息,历史告警信息等多维特征进行梳理。通过自编码器可以对大量特征进行梳理并降维,最终形成构成基站健康度指标的多维特征,可对后期的异常检测,告警预测,隐患管理降低输入数据维度,降低计算成本。
(RNN)
循环神经网络可用于时间序列相关的样本取值预测。在传统的神经网络模型中,是从输入层到隐含层再到输出层,层与层之间是全连接的,每层之间的节点是无连接的。RNNs之所以称为循环神经网路,即一个序列当前的输出与前面的输出也有关。具体的表现形式为网络会对前面的信息进行记忆并应用于当前输出的计算中,即隐藏层之间的节点不再无连接而是有连接的,并且隐藏层的输入不仅包括输入层的输出还包括上一时刻隐藏层的输出。理论上,RNNs能够对任何长度的序列数据进行处理。
03端到端运维功能架构
端到端的运维架构主要由两大部分组成:网络运营中心NOC
(NetworkOperationCenter)和现场外线。
NOC现场外螳
込缈谁讣运维监控故降价析诊断测试匸单诫览任务调Kli毙源调度川肾巡检
NOC(网络运营中心)是实现远程实时监控服务运营和检测设备状况的网络化中心,主要涉及运维设计、运维监控、故障分析、诊断测试等几大功能模块,可结合运营商EOMS(ElectrieOperationMaintenaneeSystem)电子运维系统进行任务工单派发,将NOC嵌入现有运维流程可提高相关技术、流程、组织及管理效率,进而提升网络与服务的稳定性与可预见性。
现场外线主要是承载、处理、闭环EMOS电子运维系统所派发任务工单,包括现场维护人员的任务调度、资源调度及最终的排障巡检。
运维设计功能主要包括两部分功能设计:运维规则设计与AI辅助规则设计。
其中运维规则设计主要来源于运营商长期积累的相关运维经验,制定分析规则、诊断规则、派发规则、调度规则、激活规则等,将上述规则应用于可视化设计分析中,为自动化运维提供快速设计能力。
AI辅助规则设计则是由传统技术专家进行专业设计转变为通过AI技术辅助进行根因规则设计。将相关网元类型、告警类型、告警信息、告警码、位置信息等作为输入项,通过神经网络相关算法最终输出AI辅助规则。
、数据表等分析进行场景监控设计,可视化呈现多系统、多界面的监控。
场景运维监控可对网络全景监控,也可选择性针对主题监控,定制适合实际需求的个性化监控功能。将之前被动运维、基本无故障预测转变为隐患故障可预测及规避。
通过部署RCA(RootCauseAnalysis)根本原因分析规则挖掘工具,根据算法学****出固有规律,形成规则放入RCA中进行告警根因查看和告警抑制压减。
再结合性能指标、参数配置、相关变更情况、问题日志等进行
多源关联分析,从而对故障进一步确认,提高故障分析的准确性及效率性。
⑤
诊断^果或诊断报告中有异常/自动创建维护工单
t人工诊断指
动诊断脚本
指派现场处理
诊断测试功能主要包含人