1 / 75
文档名称:

运维思路.ppt

格式:ppt   大小:10,838KB   页数:75页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

运维思路.ppt

上传人:yzhqw888 2017/12/5 文件大小:10.58 MB

下载得到文件列表

运维思路.ppt

相关文档

文档介绍

文档介绍:运维职责
什么是运维?
运维职责
互联网运维工作始终以服务为中心,以保证产品的稳定、安全、高效运行为目标
•指产品向用户提供服务的可用性、准确性、完整性,访问速
度及用户体验符合产品的设计与预期
稳定
•指产品运行在安全,可控的状态下,包括用户访问安全,抵
御恶意攻击,网络故障,数据安全等抗风险能力符合产品的
服务要求
安全
•指系统运营的效率、以较小的资源投入带来最大的用户价
值,如单机负载、资源利用率、数据传输效率、更新周期等
高效
运维职责
运维的工作有哪些?
运维职责
故障
管理
数据
备份
监控
安全
扫描
日志
统计
系统
安装
机器
采购
网络
管理
故障处理
IDC
管理



访问
质量
标准
制定
LVS
nginx
hadoop
服务变更
域名
管理
CDN
资产
管理
预案
整理
硬件
测试
压力
测试
工具
开发
cron
ntp
运维工作
系统运维
IDC、网络、CDN和基础设施(lvs,ntp,dns等)建设、资产管理平台和服务器采购、安装、上架和维修
应用运维
日常业务运维工作,参与服务变更、监控、容灾和数据备份,每日服务排查,故障应急处理以及常规运维工具开发
工作
DBA
负责数据库设计、优化,以及类SRE的变更、监控、数据备份和报警处理工作。还负责数据库管理平台、中间件开
发以及数据库安全工作
运维研发
运维平台开发工作,如监控、服务管理等各种运维自动化系统/平台。
运维安全
安全体系加固,入侵检测,安全事件处理,常规安全扫描,渗透测试
应用运维
系统运维
DBA








网络
IDC
安全
内核
CDN
虚拟化
资产管理、采购
运维部
测试部
运维工作
NSRD
NSQA
NSOP
ECOMRD
ECOMQA
ECOMOP
PSRD
PSQA
PSOP
INFRD
INFQA
INFOP
DBA
OPED(运维平台研发)
OPTC(运维技术委员会)
系统部
SYSTC(系统技术委员会)
运维工作——应用运维 1
设计评审
参与RD发起的产品设计评审,从线上部署和运维的角度提出评审意见。
服务变更
编制或审核上线步骤、回滚方案
确认是否可以触发变更及变更效果是否符合预期
紧急情况下控制回滚
服务管理
掌握所负责的服务及服务间关联关系、服务各种资源
能够发现服务上的缺陷,能及时通报并推进解决
理解运维相关文档,及时更新运维相关文档。
机器管理
熟悉服务器资源状况,机房分布情况,不出现机器遗漏或丢失的情况
合理使用服务器资源,根据不同服务的需求,安排不同配置的服务器,不浪费机器资源
保证服务器正常运行,对服务器硬件添加或变更来解决资源不足问题
例行检查
理解例行检查列表的内容、检查项的含义以及可能引发的问题
按照例行检查表,定期检查系统状态,发现异常立即通报并推进解决
定期检查线上服务模块,排除可疑进程, 发现问题及时通报
理解监控和统计报表的各项含义,每天定时检查报表,发现异常立即通报并推进解决
制定服务例行检查要点和方法,部署执行并不断完善,避免检查的盲点
运维工作——应用运维 2
预案管理
确定服务所需的各项监控、系统指标的阀值或境界点,以及出现该情况后处理预案
建立和更新服务预案文档,并跟据日常故障情况不断补充完善,提高预案完备性
能够制定和评审各类预案,安排预案的演练,提高可执行性
数据备份
按线上数据备份规范来进行数据备份工作
保证数据备份可用性和完整性
制定数据备份策略,根据备份要求及时变更
定期完成数据恢复性测试
监控与统计
执行监控配置,并完善监控内容,提高报警准确度
完成服务的各种监控、运维报表开发,并不断完善
故障处理
熟悉服务日常故障处理方法和预案执行要点
对已知线上故障能按流程进行通报并按预案执行
及时处理并回复相关的服务报警信息
能透彻分析报警原因,并推动报警问题解决
能发现服务隐患,总结处理方法和提出预案改进建议
运维工作——应用运维 3
预算管理
熟悉服务模块的极限压力数据和评估方法
清楚了解服务预算公式和各种考虑因素(如内存、硬盘等)
协调相关RD/PM, 定期修订服务预算公式,并编制产品线硬件预算
参与新型硬件设备的调研、测试及产品线硬件的选型
服务优化
发起或参与针对现有服务性能调优工作,并总结形成优化方法
针对新模块、新服务,能提出优化的部署方案并安排实施
根据业务需要,制定服务调整、迁移方案
不断完善和优化程序和系统的功能、效率,提高运行质量
制定服务稳定性指标及准入标准
某公