文档介绍:运维管理系统方案
概述
伴随着企事业网络规模的不断扩大,企事业服务器的增多,企事业管理的信息化,企事业网络管理也变的越来越重要。一旦网络、服务器、数据库、各种应用出现问题,常常会给企事业造成很大的损失。怎样能7x24小时检测网络系统的运行情况,避免各种故障的发生,改进传统的网络管理方式来适企事业信息化发展的需要?
因此,运维管理系统就有他的必要性。一个完备的运维管理系统能够提供7x24小时检测网络、服务器、数据库、各种应用系统,及时发现将要出现的问题,并通过短信、Email、声音报告给运维管理人员。运维管理人员就可以及时排除故障,避免造成重大损失。
运维管理系统的功能:
?
?
?
?
?
?
?
?故障发现与警报;记录日常运维日志信息;服务器故障统计;服务器软硬件信息统计;服务进程管理;将数据信息存储到数据库,并使用图
形方式直观的展示出来;权限、密码管理;将数据生成报表。
运维管理系统的特点:
?
?
?
?
?
?
?邮件和短信实时故障报警;B/S结构,能够通过web对远程服务器下达指令;监控服务器和被监控服务器之间通过pythonsocket来发送信息;统计日常故障处理,以便下次出现同样故障时能够更快的解决问题;实现自动化管理和自动化监控;安全管理服务器性能;操作流程统计与管理。
系统结构
运维管理系统采用B/S构架,运维管理人员随时随地可以对服务器进行管理、配置及故障处理。它是将部署在同一个局域网内的所有服务器统一管理,服务器之间的信息通讯、指令发送、运维管理都通过python来实现。监控服务器端负责采集、统计和分析数据,在数据出现异常时发送报警信息到管理员的email、手机中,并将错误日志存储到数据库中。
运维管理系统主要通过LAMP服务器、python编程、snmp和shell编程来实现。在被监控端安装python服务,并在被监控服务器上部署
python程序和shell脚本用于接受监控服务器端指令、信息采集并发送会监控服务器端。监控服务器端部署python程序和LAMP服务器,用于发送指令、接受数据信
息、存储数据、统计数据以及异常报警。
运维管理人员日常通过web浏览器远程登录监控管理系统,检测各被监控服务器的运行状态、服务状态、防火墙配置、进程信息、操作日志等信息。在出现异常时,通过运维系统可以查看到具体的异常服务器、进程等信息,并根据这些信息来处理异常。
服务器状态信息界面
运维管理系统具备后台管理功能,针对不同的用户设置不同的权限,通过后台管理可以添加删除被
监控主机、修改用户权限。
操作日志
运维监控系统具备远程控制功能,通过远程重启业务、检查业务状态、查看关键服务的配置文件、获取服务器状态信息、查看服务日志、执行备份、添加删除定时计划任务、添加删除开机机启动业务、在线业务数据统计。并且可以实现在线业务版本更新,批量业务处理。
服务管理
运维监控系统设备监控主要还是采用snmp,结合nagios
与运维管理平台整合。
功能模块
运维管理系统根据不同的需求和智能划分为以下几个模块:
智能管理模块
智能管理通过程序远程查看被监控服务器实时信息,对服务器进行在线管理,对一些业务执行