监控需求总结

监控类型

- 基础监控

- 应用监控

- 业务监控

基础监控 :               触发器值

系统负载           大于服务器CPU核数

cpu使用         大于百分之八十

cpu负载

cpu_io等待

内存使用        剩于300M

磁盘使用        按照默认

网卡出入流量

IO每秒读写次数

IO使用率         大于百分之八十

应用监控:

TCP各连接状态监控

java程序监控

Tomcat性能监控

PHP-FPM各状态监控

Redis各装态监控

Nginx各状态监控

MySQL各参数监控

MySQL性能监控

程序端口号监控

程序端口号连接监控

业务监控(如):

游戏用户玩家金币消耗监控

游戏用户玩家金币获得监控

游戏用户玩家碎片消耗监控

游戏用户玩家碎片获得监控

游戏用户在线玩家人数监控

时间: 2024-10-06 13:04:06

监控需求总结的相关文章

分布式监控开发 01 需求

为什么要做监控? zabbix已经这么强大了,为什么要写一个监控 –熟悉IT监控系统的设计原理. 自己写的时候肯定有很多事更zabbix相匹配的. –开发一个简版的类Zabbix监控系统.为以后团队写监控做准备 zabbix在2K以上数量机器的时候,明显会吃力.小米也正是由于这个自己写了open-falcon.那么如果以后我们遇到大数量的服务器的时候,完全也会基于公司的业务去写一个监控. 那么现在练练手也是完全OK的. –掌握自动化开发项目的程序设计思路及架构解藕原则. 监控系统需求讨论 1.可

分布式监控系统开发【day30】:需求讨论

本节内容 为什么要做监控? 常用监控系统设计讨论 监控系统架构设计 监控表结构设计 为什么要做监控? –熟悉IT监控系统的设计原理 –开发一个简版的类Zabbix监控系统 –掌握自动化开发项目的程序设计思路及架构解藕原则 常用监控系统设计讨论 Zabbix Nagios 监控系统需求讨论 1.可监控常用系统服务.应用.网络设备等 2.一台主机上可监控多个不同服务.不同服务的监控间隔可不同 3.同一个服务在不同主机上的监控间隔.报警阈值可不同 4.可以批量的给一批主机添加.删除.修改要监控的服务

Nagios利用NSClient++监控Windows主机(4)

在Nagios的libexec下有check_nt这个插件,它就是用来检查windows机器的服务的.其功能类似于check_nrpe.不过还需要搭配另外一个软件NSClient++,它则类似于NRPE.我们需要下载NSClient合适的版本,然后安装在被监控的windows主机上. Overview of NRPE NSClient++的原理如下图: 可以看到NSClient与nrpe最大的区别就是: NRPE: 被监控机上安装有nrpe,并且还有插件,最终的监控是由这些插件来进行的.当监控主

zabbix自动发现与监控内存和CPU使用率最高的进程

监控需求 某项目的应用服务器CPU和内存使用率的监控,通过zabbix系统监控记录应用服务器上进程的CPU和内存的使用情况,并以图表的形式实时展现,以便于我们分析服务器的性能瓶颈. 监控方式 利用zabbix监控系统的自动发现功能,首先编写shell脚本获取服务器的CPU和内存资源使用率最大的进程,以json的格式输出,然后对这些进程的CPU和内存资源使用情况进行监控.(本文监控的进程为Linux服务器中资源使用率最高的10个进程.) 缺点 不适用于监控固定的进程 首先使用top命令查看进程状态

阿修罗监控系统AsuraMonitor

Monitor是一个功能强大.灵活的监控系统.系统安装简单,配置简单,相比zabbix, nagios,cacti,小米监控等都使用相当简单.只需要会写脚本,语言不限就可以实现任意监控需求. 软件已开源: 托管地址:https://github.com/AsuraTeam/monitor 它具有以下特点: 1.数据采集免配置: agent自发现.agent主动推送, 任何数据自定义脚本 2.可扩展性, 扩展简单,随时扩,随心扩3.历史数据查询, 可以秒级返回全年数据趋势图, 多个指标数据, 趋势

使用iostat和LLD实现zabbix监控IO性能

最近有一个需求是对系统的IO进行监控,最后决定从iostat获取数据. iostat -x -d -m 1 3 参数简单解析: -x     Display  extended statistics -d     Display the device utilization report -m     Display statistics in megabytes per second instead of blocks or kilobytes per second 那么为什么要 1 3呢?

Zabbix基于Proxy分布式部署实现Web监控

前言 在日常运维工作中,难免会遇到这样或那样的故障,如何能在第一时间发现故障,并及时定位故障原因,保证业务不受影响,我想这应该是做好一个运维必须要掌握的技能.但人力不可能实时掌控系统的变化,于是监控系统应运而生,监控便是运维的眼睛,把监控和性能管理做好后,运维就是一件很轻松的事情.目前比较流行的开源监控工具有Cacti.Nagios(Icinga).Zabbix等.本文带来的是Zabbix基于Proxy分布式部署实现Web监控. Zabbix 简介 Zabbix是一个基于Web界面提供分布式系统

Zabbix监控之一----zabbix基础和安装

一.Zabbix基本概念 1.zabbix是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案.它能监视各种网络参数,保证服务器系统的安全运营:并提供柔软的通知机制以让系统管理员快速定位/解决存在的各种问题. zabbix由2部分构成,zabbixserver与zabbix agent. 1.Zabbix Server:部署在主控机,通过SNMP,zabbix agent,ping,端口监视等方法提供对远程服务器/网络状态的监视,负责接收Agent发送报告信息的核心组件

【爱维云】连锁店模式链路监控解决方案

场景描述-1: 大家好,我是苦逼运维工程师一枚,工作在一个运维服务公司,为广大财主们提供优质的运维服务.有一天,老板为我分配了三家连锁店客户,老板要求我必须比用户先发现问题,把危机化解在用户投诉之前,就这样,我的苦逼生活由此变得更为苦逼了. 事 情是这个样子滴,单就实时监控需求来说需求很简单,就是监控全国各地分店的服务器是否可用,网络是否通畅的流量是否正常,且要有明确的标记每台服务器属于 哪个分店,再简单一点,翻译成我们运维技术语言,就是别的不用管,分清哪个店的哪台服务器能不能ping通以及监测