文档介绍:XXXXXXXX有限公司工作规范
目录
一、系统运维管理的维护职责
二、系统运维管理职责的划分
系统管理员职责
系统工程师职责
三、系统运维管理具体工作内容
资产统计管理
网络、安全系统运维管理
主机、存储系统运维管理
网络连通性需归纳到每天的主干网络日常巡检工作范畴内,连通性测试可以确认网络平台的正常运作,并可以及时检查出网络的连通故障,缩小问题出现时间差,根据的网络基础数据和测试得到的数据,更快更准确的确定网络的故障点,排除故障,恢复网络的正常运行。
工程师定期通过日常网络巡检,网络安全硬件日志,对网络问题、网络运行状况进行周期性检查和数据分析后,总结出网络的性能。
日常运维工作中,除去网络的连通性和网络性能的监测,还需要对终端使用网络的情况有定的掌控,如服务器的日常访问量、网络数据传输峰值、工作用机日常对网络的使用情况等。
对网络负载能力、网络畅通性、网络运行瓶颈、网络常见问题根源等方面有一定了解后,针对性的提出解决建议方案,提早预防发现的网络隐患,降低公司运营风险,保障网络的稳定运行。
2)计算机网络安全运维可分为物理安全和逻辑安全两方面。
保护网络系统中相关设备(机房设备,日常工作设备)的物理保护,以免予破坏、丢失等。机房设备应有固定人员进行维护管理,非工作人员未经许可不得进入。机房日常巡检时要注意机房环境和周边设备的检查,如机房温度、机房适度、有无异味异响、机房异常痕迹、UPS、空调、消防等,为机房设备提供良好运作环境保障。日常工作设备要严格按照公司相关固定资产管理规定方法进行使用和管理。
物理设备连接,以最小化连接原则,根据业务服务响应需求,将不必要的物理网络连接去掉,必要时将不同的服务需求群体划分VLAN,细化防火墙访问控制,减少服务端口数量,对端口加以控制,做好信息物理隔离,以免内部信息有不必要外泄。
操作系统安装系统补丁软件和网络版杀毒软件,定期扫描系统漏洞,安装系统补丁,定期检查病毒库更新情况和发布情况,杜绝病毒的感染、传播和发作,提高系统的主动防御能力。系统管理员要注意账户密码的强壮度,并避免账户和密码的大众性和常规性,在创建系统用户时,要严格控制,对系统进行多角色、多等级管理,出现问题可方便确认责任人和问题根源。对系统定期进行查看,关闭不必要的系统组件和应用服务,检查系统日志,检测是否出现异常。
规划网络ip地址和MAC地址,限制连入局域网的上网计算机,对网络终端连入状况有清晰的了解。对网络终端上网行为管理规则进行规划,规则添加如屏蔽与工作无关的网站、屏蔽某些关键词、监控p2p流量等,并将相关条款体现在公司规章制度中,以加强管理力度
主机、存储系统运维管理
日常巡检要对硬件运行状态仔细检查,从设备硬件提示信息及时发现问题,防止影响扩大化,及时解决故障,恢复系统的正常运作和系统冗余性,外部提示包括面板指示灯、电源指示灯、网卡指示灯、磁盘指示灯,以及各种硬件故障提示和报警信息。
定期监控cpu性能,内存使用情况,硬盘利用情况,硬盘运行状态,网卡状态,系统日志,交换分区,进程状态,存储交换机端口状态,存储传输情况,通过监控数据对主机和存储系统的性能进行评估。发现隐患,先将问题确定到点,进行一段时间的问题信息数据监控,根据搜集的更多更高密度的数据对问题原因做出判断,如果属于一般应
用系统问题,就将相应问题的应对工作加入工作日程,及时排除系统隐患,如果是由于硬件瓶颈导致,就对相关数据做出整合报表并附加解决提案提交公司上级,最终拟定解
决方案,以确保服务系统的高可用性和高冗余性。
应用服务系统运维管理
应用服务系统是公司对外业务的信息平台,也是公司信息化能力的体现,同时也承载了公司内部工作平台,所以平台的持续稳定运行显得十分主要。管理人员要对不同应运服务的服务需求和服务人群有一定的了解,以便于规划网络构架,划分网络资源,定位应运服务的性能。
应运服务的运维管理,除了要结合机房硬件日常管理,还要对服务的配置信息进行维护管理。日常巡检是有条件的话要从不同的网域检测服务响应能力,并要定期进入服
务操作系统检查应用系统服务配置是否正常、检查日志文件是否有异常报错、检查服务平台操作系统是否流畅。通过对配置信息、故障报错、服务性能的管理,提高服务平台事件的分析处理能力。
5、
数据系统运维管理
数据系统承载了服务平台的数据功能,它的正常运行和应用服务系统是同等重要的,数据系统运维主要体现在数据服务维护和数据备份两个主要方面。
数据库运维服务管理包括主动数据性能管理,快速发现、诊断、解决性能问题,在发现问题是,及时找出性能瓶颈,解决数据库性能问题,并要注意数据库系统的变化,主动预防可能发生的问题,保证数据访问响应能力。
数据备份对服务冗余性有着重要的作用,对数