1 / 31
文档名称:

大数据运维管理平台说明书.pdf

格式:pdf   大小:3,307KB   页数:31页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

大数据运维管理平台说明书.pdf

上传人:辞言 2021/5/23 文件大小:3.23 MB

下载得到文件列表

大数据运维管理平台说明书.pdf

相关文档

文档介绍

文档介绍:碧茂大数据运维管理平台说明书


版本控制
作者 日期 版本 备注
任大勇 2020 年 3 月 5 日 初始创建
任大勇 2020 年 3 月 18 日 修订
任大勇 2020 年 4 月 21 日 修订
目 录
简介 ....................................................................................................................................................... 3
功能详细介绍 .................................................................................................................................... 3
配置管理.............................................................................................................................................. 6
集群监控............................................................................................................................................ 11
告警系统............................................................................................................................................ 17
巡检 ..................................................................................................................................................... 20
知识库 ................................................................................................................................................ 24
简介
碧茂运维管理平台是针对大数据分布式集群系统设计的自动化运维管理平台,核心功能包括
集群资产管理,监控系统,告警系统,系统巡检和运维知识库系统等。详细如下:
一、 资产管理
提供可视化界面实现对主机和集群资源的统一配置和管理,对各项监控管理任务进行调度配
置、监控和管理。方便运维人员能随时掌握系统全貌,集群服务角色分布情况,硬件资源分
配情况,能根据管理需求进行定制化定时任务调度。
二、 监控系统
1、 主机的健康性能的监控
2、 集群服务的端口、健康性能指标的监控
3、 集群参数的监控,并自动给出调优建议
4、 集群日志的监控预警,自动化收集汇总集群进程和应用日志,并对错误日志进行预警
三、 告警系统
1、 选择任意监控的指标和阈值,进行邮件告警
四、 系统巡检(特色功能)
对系统和集群进行健康和性能检查,自动化生成巡检报告。分为基础巡检和深度巡检。
基础巡检指的是根据需求可以灵活选择需要巡检的服务、指标、参数,自动化生成巡检报告。
深度巡检指的是对不同服务的结构对象进行