文档介绍:----
-----
运维驻场管理标准
一、驻场效劳介绍
为保证集中统一存储系统的软硬件产品、备份系统的正常运行,我方提供1名具备2年工作经历的工程师进展驻场效劳。驻场效劳地点为广电总局监管大楼18层,工作环境由数据中心及影响,提出解决方案并现场解决问题。出局故障分析报告及故障,内容包括故障信息描述、故障现象分析、故障造成的影响、故障导致损坏或丧失的文件列表、故障解决过程、问题改良措施等。
日志搜集方法如下:
登录到mds:
使用xshell ssh 到root目录下〔cd /root〕;
在执行ls命令,显示root目录下的所有文件,
----
-----
为收集日志的脚本。
执行这个脚本〔./文件名〕。
在IO节点和接口节点上全部执行一遍,单独收集;
执行完上面的脚本后,登录mds2(),在mds2的home目录下生成所有节点的message搜集。
再登录Mds1,搜集/var/log/cfs这里面的内容。
登录接口节点搜集日志中:日志路径/var/log/messages。
:执行数据的删除
执行原那么:系统容量缺乏百分之90时,及时进展数据的删除,防止影响系统可用性。
执行流程:由巡检人员发起,存储负责人责任确认,业务部负责人确认删除内容,巡检人员执行删除操作,执行完毕之后,再顺次找业务部负责人、存储负责人确认。
执行命令:rm –rf *****
严格填写数据删除单据,按单据指示操作。
:工作要求
为保证集中统一存储系统的软硬件产品、备份系统的正常运行,我方提供1名具备5年工作经历的工程师与驻场工程师进展每月1次深度巡检效劳,执行如下工作:
----
-----
执行日巡检内容。
执行月巡检内容。
分析日巡检报告及周巡检报告,提出分析结果
针对故障问题,出现2次及以上问题,需针对问题彻底解决,杜绝在下一巡检周期再次出现类似问题。
提交日巡检报告、周巡检报告、月巡检报告,向数据中心汇报月度巡检情况。
提交统一存储系统容量曲线、磁带库容量曲线报告等。
检查存储系统网络IP分配情况
:绘制存储系统、带库每日增量图
文件系统容量增长曲线
----
-----
:检查存储系统网络分配状况
按照以下表格分类及对应关系,检查存储系统网络分配状况是否正确。
节点网络IP
AS10000
节点
节点IPMI
〔监控网络〕
节点类型
管理网络
〔千兆网络〕
数据网络
〔万兆网络〕
结果
MDS01
控制节点
〔eth0〕
〔bond0〕
正常
MDS02
控制节点
正常
----
-----
〔eth0〕
〔bond0〕
IO01
数据节点
〔eth0〕
〔bond0〕
正常
IO02
数据节点
〔eth0〕
〔bond0〕
正常
IO03
数据节点
〔eth0〕
〔bond0〕
正常
IO04
数据节点
〔eth0〕
〔bond0〕
正常
IO05
数据节点
〔eth0〕
〔bond0〕
正常
IO06
数据节点
〔eth0〕
〔bond0〕
正常
SC01
协议转换节点
〔eth0〕
(bond0)
正常
SC02
协议转换节点
〔eth0〕
(bond0)
正常
IO07
.
数据节点
.
正常
----
---