文档介绍:服务器和存储运维管理的介绍
介绍
互联网最近几十年发生了很大变化,从最初的modem拨号接入,经历了 ISDN接入、DSL 接入、cable modem接入、专线接入、光纤接入、无线接入,以及分组交换网、帧中继网和ATM网,每一 次技术果、数据统 管理
iiiiM 1
运维管理人员日常通过web浏览器远程登录监控管理系统,检测各被监控服务器的运行状态、服务状 态、防火墙配置、进程信息、操作日志等信息。在出现异常时,通过运维系统可以查看到具体的异常服务 器、进程等信息,并根据这些信息来处理异常。
智能管理模块
智能管理通过程序远程查看被监控服务器实时信息,对服务器进行在线管理,对一些业务执行在线操 作,并记录下远程操作日志。减少远程登录服务器操作,减少故障风险。同时将服务信息储存在数据库中, 便于形成报表,为企业运维累计宝贵的运维经验。智能管理主要包括:
•:・用户管理:指远程服务器的用户添加、删除,监控管理系统的用户添加、删除;
•:•密码管理:指远程服务器的用户密码更新(或动态密码),监控管理系统的用户密码更新;
•:•权限管理:指远程服务器用户权限分配,监控管理系统权限分配;
・•・ 服务器信息管理:记录服务器的cpu、内存、硬盘、网卡等硬件信息,业务信息,在线时间;
・•・ 服务管理:对服务器中运行的进程、业务惊醒管理;
・•・ 业务数据统计:在线业务数据统计,如:注册、登录、充值、消费等信息;
系统操作管理:记录用户登录系统操作的日志;
运维日志管理:将出现的故障原因和解决方法以运维日志的形式保存下来;
•:・ 服务器日志管理:通过远程查看系统日志信息,并实现系统日志保存到监控服务器端。
智能监控模块
智能监控是在原cacti监控的基础上将nagois、cacti和运维管理系统整合,实现同一平台下的监控管 理。并对一些特定的需求进行定制,使监控系统能够更加高效、准确、及时的发现和报告故障信息,提升 故障处理质量。智能监控主要包括:
•:・ 服务器网络:对服务器的网络状态、网络流量进行监控;
•:・服务器硬件:对服务器的硬盘、cpu、内存进行检测;
•:・ 服务进程:对服务器上的关键服务进行监控,并对进程的的总数进行监控;
•:・ 系统性能:对服务的负载进行监控;
•:・ 业务状态:对在线的业务进行检测,如端口、web页面检测。
安全管理模块
安全管理是通过运维管理系统执行需要执行的操作可以减少不必要的误操作,如删除不该删除的文件 导致业务、系统不能正常工作。对服务器设置一些规则,当服务器出现异常时能够预警。安全管理主要包 括三大块:
•:•应用安全:指系统关键进程和业务服务;
•:・ 系统安全:指远程登录、帐号密码管理、服务器的端口状况;
•:・网络安全:指服务器连接数、流量信息等。
流程管理模块
规范的流程可以提高工作效率,流程管理可以累积工作经验。许多故障并不是因为程序本身和被入侵 导致的,常常由于疏忽而导致遗漏了一些重要的信息,因此按照流程操作可以减少故障出现的频率,并且 随着时间的累计流程就成为一种良好的习惯。流程管理是一个企业规范的体现,并且为运维累积经验。主 要功能包括:
•:・服务器部署:指新服务器上架和业务部署;
•:•新业务部署:新增在