文档介绍:鹏博士电信传媒集团股份有限公司IT服务白皮书二零一三年十一月目录第一章运维服务概述 21、 22、 23、 2第二章监控巡检服务 21、实时监控 22、日常监控 2第三章服务器运维管理服务 21、服务器健康检查 22、服务器日常维护 23、服务器配置管理 24、服务器性能管理 2第四章网络运维管理服务 21、网络拓扑规划和优化 22、网络设备安装、配置、调试 23、网络设备“高可用”配置和维护 24、网络设备性能管理 2第五章存储运维管理服务 21、存储设备安装、配置、调试 22、存储容量空间管理 23、存储性能管理 2第六章数据库管理服务 21、数据库安装、配置、调试 22、数据库性能管理 23、数据库容量空间管理 24、数据库备份和恢复管理 2第七章安全管理 21、服务器安全管理 22、网络安全管理 2第八章管理制度、流程 21、服务支持 22、服务交付 2第九章应急管理 21、应急预案开发和维护 22、应急演练 2第一章运维服务概述1、2、3、第二章监控巡检服务1、实时监控2、日常监控第三章服务器运维管理服务1、服务器健康检查为了提高系统的可用性,将故障排除在发生之前至关重要。健康检查服务是鹏博士提供的一项针对设备的非常有效的事故预防服务,是主动式服务的一种。通过健康巡检服务可以尽早发现系统的问题或潜在问题,保证系统的安全、稳定运行。健康巡检将帮助客户从技术角度对正在运行的服务范围内系统的技术特征、故障隐患有一个全面的了解,以便根据业务发展需求和目前系统资源状况,制定合理、可行的系统扩容、改造、维护计划,提高系统运行的安全性。服务内容如下:根据客户需求制定健康检查计划、方案、流程;检查系统运行状况,含CPU、内存、SWAP、IP、PV、VG、错误日志、补丁程序版本号;文件系统检查,查看文件系统空间使用状况;系统性能检查,含系统性能情况、磁盘使用情况、僵尸进程;系统安全检查,含系统在线时间、系统时区核对、系统时间核对、环境变量、TMOUT;备份检查,查看系统全备份状况;协助客户分析评估发现的报警、错误或故障;协助客户分析评估系统的目前状态;与客户沟通健康巡检效果,并根据设备系统运行情况向客户提供设备系统升级、改造、更换的建议。2、服务器日常维护鹏博士将为客户提供必要的日常维护支持服务,以便更好响应客户的运维服务请求,并有效应对服务器系统突发故障,主要服务如下:系统故障处理发现系统系统故障或硬件问题时启动事件管理程序对系统平台的问题分析和研究在客户授权下进行问题的处置协调后台支持资源(包括:二三线支持人员、第三方服务、原厂服务等)对于客户代维的服务器系统,鹏博士系统管理员将提供系统级的操作支持服务,包括:操作系统参数配置和版本管理,授权下的补丁升级文件系统管理软件安装和配置系统管理工具安装,配置和操作系统安全设置和检查硬件维护动作查看系统软,硬件运行状态动态调整硬件资源的可用性执行和查看系统重启过程3、服务器操作管理鹏博士为客户提供备份和恢复操作服务,备份和恢复管理服务包括设计,实现和测试根据客户现有IT系统在发生问题时如何恢复系统数据的工作。此项工作的目的是使在系统失效之后,鹏博士帮助客户按照系统失效所对应的操作流程进行系统恢复,并且把系统失效对业务的影响程度降至最低鹏博士可以提供对于操作系统,数据文件和特定应用程序的恢复工作。主要工作定义如下: