1 / 60
文档名称:

机房运维方案.docx

格式:docx   大小:124KB   页数:60页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

机房运维方案.docx

上传人:lzw_678 2022/8/16 文件大小:124 KB

下载得到文件列表

机房运维方案.docx

文档介绍

文档介绍:文件编码(008-TTIG-UTITD-GKBTT-PUUTI-WYTUI-8256)
机房运维方案
机房运行维护工作建议书
为加强********单位数据中心机房各系统的运行维护和管理工作,保证系统长期稳定、展趋势。
规范制度不健全
IT系统三分建、七分管,运维管理十分复杂,技术要求高,涉及范围广,实施难度大,突出有“三难”。
职责难明
IT系统运维管理离不开使用、建设、运维三方的共同努力。不能将所有运维责任归于运维部门,运维部门与其他部门相互配合程度低,导致运维人员压力大,处理事务多。哪些由使用部门负责,哪些由运维部门负责,难有明确的职责界定。
资料难全
网络设备价格和系统集成复杂度不断降低,部门自建“网中网”、“小系统”现象愈加普遍,资料准确性和完整性不断降低,给清查设备和排查故障带来很大困难,运维部门掌控系统资源越来越难,运维管理资料难求完整。
绩效难估
运维部门有个“两难”境界:系统问题越多,工作量越多,但有人认为维护水平越低;维护水平越高,问题越少,但别人认为工作量越少。
运维部门绩效评估难以用业务部门类似的指标来衡量,不能受到公平评估。因此运维人员积极性越来越低,人员流失率高。
总体目标
机房运维管理规范化、流程化、制度化
鉴于最终用户对信息化服务持续性供应的要求,******数据中心机房运维工作急需由被动式变更为主动式,针对以下内容进行规范化管理,确保其持续运行时间与工作性能满足生产需求。
机房环境,包括温度、湿度、供电、防雷、消防、承重等;
机房设备,包括服务器、交换机、存储、网络安全、通讯等设备;
机房链路,包括骨干光缆、机房跳线、收发与中继等;
机房应用软件的运行监控,包括门户、办公、生产、财务、网络等应用软件等;
机房软性资源,包括IP地址、VLAN等。
对于以上各个项目类别,基本上都包括监察、报警、故障排除、优化等工作,由于应用软件等受到供应商的限制,其故障排除与优化往往只能由供应商提供,但对其运行进行实时监控仍然是机房运维职责范围内的工作。
统一管理和集中授权
机房运维目前存在的诸多问题,导致工作较为混乱,职责不清,相互推诿时有发生,这与运维本身所需要的快速排除事故,综合性根本性的解决潜在问题的要求是不一致的。
除了技术上需要一个中央平台以外,显然管理上也应该形成一个统一的运维团队,这个团队应该对机房内各项内容都承担相应的职责,这种职责是深入的,而不仅仅是简单的遇到事故时一个通知者的角色。设备厂商、应用软件开发商都是在不断变化中的,而运维管理团队却是不变的。
地研院信息中心认为,运维管理团队应该保障运维行为的合理性。
不允许在事故排除、问题诊断、持续改进的过程中,出现互不承担责任,尤其在一些业务交叉点上;
对运维配置项的识别方法是统一的,工作单、知识库等的格式是标准一致的;
对石油钻探行业的知识理解是一致的,包括不同应用的重要性等级、不同部室数据的安全性等级等;
团队内应共同对运维服务工作的推进承担责任;
内部区分不同的安全等级,比如管理员账号与密码属于高安全级,而外部人员的工作则是适度授权的。
在业务与管理上达到集中统一的要求后,就形成了“******数据中心机房运维一体化”的工作模式,由于这种模式加强了运维内部凝聚力,因此易于在运维流程、技术等方面进行持续改进,从而不断提高********公司在信息化运维工作上的能力,也就为********公司信息化建设解除了后顾之忧。
那么,我们再看一看现在的现状,可以反射出多方运维所形成的一些后果。
集中监控平台
机房是公司的信息化核心,无论是应用服务、核心网络、骨干链路,都将牵动全公司的信息化使用。而机房的软硬件通常都是由不同的渠道采购的,这就造成了多厂商与多供应商共同维护的局面,由于不同厂商有不同的管理平台,不同集成商有不同的运维方式,运维队伍良莠不齐,在运维的及时性、有效性、安全性上,都无法满足********公司的业务需要。
事实上,我们需要如下所述的一个平台。
统一而且固化可执行的流程,保证无论何人来都可以按标准执行,以减少运维风险;
集中的监控预警系统,通过集成机房环境、网络、服务器等系统,任何系统出现故障,都将在第一时间发现并报警,同时,管理人员也只需在一个统一门户上进行操作管理,而无需面对各种各样的管理体系,在减缓学****曲线的同时也提高运维品质;
集中的知识库,知识包括历史实施过程、技术方案、原始资料等,由于运维的延续性非常重要,因此,具有高度参考价值的历史运维资料是一笔相当宝贵的财富
;
集中的运维队伍管理;
统一规范的基础配置项数据库。
只有通过一个中心平台,封装不同厂商与集成商所提供的不同内容,最终达到运维工作可执行,业务延续而不受