监控概述
初级
- 识别监控对象(分级)
- 理解监控对象(理论知识)
- 细分监控对象的指标
- 确定告警的基准线
预中级
- 工具化和监控分离
- 监控对象的分类
- 硬件监控(方法:机房巡检、IPMI、SNMP)
- 系统监控(对象:CPU、内存、IO【磁盘、网络】)
- 服务监控(对象:各类服务[Nginx|Tomcat|RabbitMQ|OpenStack|MySQL|*])
- 日志监控(方法:Elastic Stack)
- 网络监控(方法:第三方、Smokeping)
- APM应用性能管理(工具:PINPoint)
- 流量监控(工具:Piwik、XX统计、XX分析)
- 其他监控(APP监控、安全监控、业务监控、舆论监控、XX监控等等)
- 掌握一个监控工具:比如Zabbix
中级
- 标准化监控(标准化的脚本、模块、。。。)
- 分布式监控(主动、被动、分布式)
- 自动化监控(自动发现、主动注册【Agent主动注册、Server主动添加(API)】)
- 性能优化(数据采集、数据存储、数据查询)
- 二次开发(定制报表、API调用、XXX)
进阶(从精通到放弃)
- 告警阈值动态化
- 智能告警
- 告警去重
- 依赖
- 故障自愈(事件驱动、主动控制)
- 大规模
原文地址:https://www.cnblogs.com/ElegantSmile/p/12327062.html
时间: 2024-10-12 11:41:37