文档介绍:IT运维管理
IT运维管理方法论之广通见解
IT系统管理已经有二十几年的历史,其发展历程已经从无序、混沌的运维管理,经过简单的对重要资源运行的自动监视,直至发展为统一的IT系统管理。随着系统规模的不断扩大,业务应用的持续增加,其个阶段,服务对象对运维管理的务实期望就是:减少故障,实现对IT技术设施的有效掌控和管理。这就要求我们必须要做好四件事:一是理清资产;二是建立服务台;三是细化配置项;四是充实知识库,才能为将来服务管理级别的提升打好基础。
理清资产方面,我们按照ISO/IEC27001和ISO/IEC27001标准,进行资产的分类,理清我中心负责运维的所有软硬件资产,建立了资产注册表,和项目做了关联对应,并在每个设备上作了资产标签,方便运维工作。
以前,用户网络或PC遇到故障时,通常都是直接给维护工程师打电话,有时工程师即使手头有其他工作安排,为了保证客户满意度,也得放下手中工作及时前去维修;有的时候可能因为其他的工作安排而影响响应速度。所以网络部的工作人员总是感觉每天的工作杂乱无章,天天就像“救火队员”,疲于应付。网络部面对这种局面进行了工作调整,建立服务台,设立热线电话,实现“一口受理,分级转办”,具体方法是聘请外包公司技术人员做服务台一线处理员。服务台一线人员接到申请后,针对用户提出的问题做出反应,先通过电话对故障类型进行了
解,并尝试电话指导排除故障,如无法电话解决或涉及数据、权限等的申请,提交二线解决,二线管理人员将会派工程师到现场服务并记录。通过严格的流程、权限控制,实现对操作流程的规范,从而达到通过面向用户统一而专职的服务联系点促进组织业务流程与IT运维管理架构的集成,实现逐步把网络管理部运维人员从“救火队员”的状态解放出来的目标。
我们清醒地认识到就日常工作而言,配置管理尤为重要,它不仅仅是将客户端、网络、服务器、操作系统、应用系统等相关软硬件记录在案,而是能够帮助一线及二线人员提高效率,减少差错。我们不光对所管理的硬件、软件进行详细记录,而且将签订合同、各服务商的联系电话、提供的应急预案和服务响应等级协议等也作为配置项的重要关联文档进行记录并存档,为日后变更管理、能力管理以及IT服务财务管理提供支持。
运维系统建设的目的不仅仅是规范、记录、督促、自动化管理工作,而且要帮助各级支持人员提高技能水平,简化IT服务任务。同时也是降低对具体某个个人依赖的手段。这些需要通过知识经验的积累和共享来完成。要想实现这样的目的就必须建立知识库,而要让知识库能充分发挥作用就必须在细节上下功夫。我们要求服务人员在线完成服务记录的同时,要对出现故障的情况进行详细描述,还要求其对排除故障的步骤、措施以及对问题的分析及建议进行规范描述,使其有更强的操作性和可用性。例如:信息中心空调故障知识库所涉及的项目包括:时间、气温、风力、服务类型、设备型号、设备位置、故障现象、解决方法、建议内容,以及故障原因等方面内容,从而为日后查找、分析问题原因直接提供有力支持,同时也为运维人员在日常维护中做到提前预防,快速排障提供智力支持。
强调IT服务管理
第二阶段:提高技术支持,实现ITIL从“被动响应”到“主动管理”的转变。
在第一阶段实施后,运维质量有了明显改善,但仍未从根本上解决“意外问题”的发生,而要规避风险,技术上的改进是必不可少的。我们利用的网络监控软件对各个系统的服务器CPU、内存、硬盘利用率,各端口流量及通断状况进行监控,发现异常,及时处理,实现了预防关口的迁移,保证了服务器良好运行,确保网络状态正常。
第三阶段:强化管理措施,实现电子政务运维管理的“人员、技术、流程”相结合。
引入ITIL理念,强调“技术、人员、流程”三者结合的IT服务管理,成为我们优化组织结构、改进管理流程的方法。ITIL是IT服务管理流程的最佳实践,分为两个主要领域:服务支持—包括服务的日常运行和支持;服务交付—包括服务的长期计划和改进。
我们首先构筑三级服务体系:是指服务管理、服务整合和服务实施三级服务组织体系。服务管理职能包括服务规划的制定与发布,服务要求和服务级别协议的制定与发布,服务管理制度、标准、规范的制定与发布,服务过程中重大问题的决策,服务水平的考核等内容,服务管理职能由信息中心承担。服务整合职能包括服务体系规划与执行,服务平台的建立与管理,服务流程的建立与执行,服务级别协议的落实与分解,相关制度、
标准、规范的起草,服务信息收集与运行报告提供等。服务整合职能的提供者要求具备服务体系规划和执行能力,对IT基础设施和安全管理情况比较了解,有很强的协调和推动能力。服务整合职能由信息中心承担。服务实施职能是指具体的技术实现工作,包括网络维护,主机、存储等硬件设备维护,操作系