关于监控内容定义

监控是运维工程师避不开的环节,在灾难即将发生的时候可以有效的预防,例如磁盘空间的监控。

再者就是当问题出现的时候可以快速的定位,快速响应,解决问题。下面就监控的项目进行了简单

的分类整理,监控系统目前主流大家都使用的是zabbix,当然小米的也有在使用的。

监控项目:

系统健康监控:
系统层面:

1. 基础监控.

cpu指标: CPU使用率阀值70% 则报警
系统负载:阀值5 则报警 (业务量增加后适当调大)
内存:物理内存使用阀值 80% swap使用率阀值:20%

磁盘:各个分区监控阀值空间使用率阀值80%。
inode 节点阀值 80%
磁盘IO监控: 监控硬盘读写速度,繁忙 >70%报警

网卡监控: 网卡流量大于 300M

Tcp监控:
监控TCP连接状态数状态,TIME_WAIT > 2w 报警
ESTABLISHED > 6k 报警

2. 硬件监控:

使用ipmi工具获取温度传感器数据,大于60度告警
获取CPU,主板温度状态,大于60度。 防止温度过高引起宕机
获取磁盘温度状态,大于60度。 防止温度过高引起宕机

3. 网络设备: 交换机各个端口流量是否监控,交换机状态(CPU使用率)
路由器CPU使用率等状态

应用级别:
1.应用服务监控; zabbix agent
Java接口监控,nginx,redis状态监控等
mysql数据库监控

2.性能监控:
页面资源数量,DNS解析时间,首屏时间,加载最慢的资源
加载产生阻塞的JS
日志监控: elk elasticsearch + logstash + kibana)

业务监控:
每分钟的订单,每分钟注册,日活跃用户,短信使用量
网站的整体PV是多少?现在访问最多的页面是哪个?
Java接口调用次数

流量监控分析: 需要如何来做。

数据的可视化.很好的反映出业务的波动

时间: 2024-08-01 20:32:02

关于监控内容定义的相关文章

[Monitor] 监控规则定义

系统监控规则: [Monitor] 监控规则定义,布布扣,bubuko.com

jconsole监控内容和CPU情况

jconsole监控内容和CPU情况 本地:开始--运行--cmd--jconsole,弹出选择框: 查看本地内存和CPU使用情况: 选择本地进程,选择并点击一下sun.tools.jconsole.JConsole这一行,然后点击连接,就可以查看我们的内存和CPU的使用情况了. 服务器内存和CPU信息: 远程进程,在文本框中输入我们需要测试的服务器的IP地址:端口,然后在下面输入用户名和密码,点击连接,就能测服务器内容等情况

vue 实现 点击取消监控内容是否发生修改 若修改提示 是否需要保存

<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>vue对象变化测试</title> <script src="http://cdn.bootcss.com/vue/1.0.28/vue.js"></script> <script src="htt

Druid 配置及内置监控,Web页面查看监控内容

1.配置Druid的内置监控 首先在Maven项目的pom.xml中引入包 <dependency> <groupId>com.alibaba</groupId> <artifactId>druid</artifactId> <version>${druid-version}</version> </dependency> 2.引入包后配置spring的配置文件 <!--读取配置文件--> <

支持万台服务器分布式监控系统原始手稿

作者:付炜超 如果你本来打算做一个特别牛的东西,最终不管什么原因没做到,但是你实现的也够cool了! 需求分析: 随着现在的企业不断的发展壮大,大多数的企业都出现了分公司.办事处这类的分支机构,由于总公司还要求对下面子公司的网络设备.主机等资源的状态有着相关的了解,所以就要求IT运维部门对不在同一地域的网络.主机等资源都要进行监控. 功能分析: 1.一个监控系统往往需要集成资产管理,可以从逻辑上展示业务和功能的信息,通过对其进行数据分析,做到对投资与回报的一个反馈展示,为资产的合理规划与使用提供

Nagios监控远程主机

p.MsoNormal,li.MsoNormal,div.MsoNormal { margin: 0cm; margin-bottom: .0001pt; line-height: 150%; font-size: 13.5pt; font-family: "Calibri", "sans-serif" } h1 { margin-top: 17.0pt; margin-right: 0cm; margin-bottom: 16.5pt; margin-left:

nagios之监控

监控系统需要监控: 1.本地资源:负载(uptime),cpu(top.sar),磁盘(df),内存(free),IO(iostat),RAID,温度,passwd文件的变化,本地所有文件指纹识别 2.网络服务:端口,URL,丢包,进程数,网络流量 3.其他设备:路由器,交换机端口流量,打印机,windows 4.业务数据:用户登录失败次数,用户登录网站次数,输入验证码失败的次数 某个API接口流量并发,电商网站订单,支付交易的数量 5.监控软件本身仅仅是一个平台,想要监控内容,理论上只要在服务

运维监控 ——Nagios

Nagios是一款开源监控软件.利用Nagios可以监控本地或远程主机资源,如磁盘空间.系统负载等情况,也可以监控各种应用服务,例如HTTP服务.FTP服务等.当主机或服务出现故障时,Nagios还可以通过邮件.手机短信等形式在第一时间通知系统维护人员.      一. Nagios综述     作为一名运维人员或系统管理员,难免会遇到主机或服务异常的情况,遭遇故障并不可怕,可怕的是故障出现后,系统管理人员不知道.由于没有及时发现故障,不但解决问题时存在困难,而且可能带来很大的损失.因此,一个能

监控之Nagios

NAGIOS Nagios是一款开源的免费网络监视工具,能有效监控Windows.Linux和Unix的主机状态,交换机路由器等网络设置,打印机等.在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知. 一.Nagios概述 1.简介 Nagios是插件式的结构,它本身没有任何监控功能,所有的监控都是通过插件进行的,因此其是高度模块化和富有弹性的.Nagios监控的对象可分为两类:主机和服务.主机通常指的是物理主机,如服务器.路由器.工作站和打印