常见监控简介

一 监控架构

1.1 组成

客户端:数据采集部分

服务端:数据存储分析告警展示

1.2 采集模式

被动模式:服务器端到客户端采集数据,对服务器的开销较大,适合小规模的监控环境。

主动模式:客户端主动上报数据到服务器端,对服务器的开销较小,适合大规模的监控环境。

1.4 协议

专用客户端采集

公用协议采集:SNMP/SSH/Telnet

1.5 架构

C/S架构:被监控节点较少,产生的数据较少。

C/P/S架构:被监控节点较多,监控类型复杂,产生的数据和网络连接开销很大,跨地域等环境下。

二 常见监控软件

流量监控:MTRG、Cacti、SmokePing、Graphite等

性能告警:Nagios、Zabbix、Zenoss、Core、Ganglia、OpenTSDB等

三 常见监控内容


监控项目

描述

主机监控

CPU、内存、磁盘的剩余空间/利用率和I/O、SWAP使用率、系统UP时间、进程数、负载

网卡监控

Ping的往返时间及包成功率、网卡流量,包括流入/流出量和错误的数据包数

文件监控

监控文件大小、Hash值,匹配查询、字符串存在与否

URL监控

监测制定URL访问过程中的返回码、下载时间及文件大小,支持内容匹配

应用程序

端口和内存使用率、CPU使用率、服务状态、请求数、并发连接数、

消息队列的字节数、Client事务处理数、Service状态等


数据库

指定的表空间、游标数、Session数、事务数、死锁数、缓冲池命中率、库Cache命中率、

当前连接数、进程的内存利用率等性能参数


日志

错误日志匹配,特定字符串匹配

硬件

温度、风扇转速、电压等

四 其他需求

4.1 时间需求

监控系统应根据实际情况,实时/非实时的采集和展示数据,包括历史趋势数据展示、分析,容量报表、可用性报告等。

4.2 告警需求

支持多种方式,邮件、短信、IM和其他接口,具有可定制化功能。

只是对告警内容分析自动处理,防止误报、漏报、抖动等。

原文地址:https://www.cnblogs.com/liujunjun/p/12254857.html

时间: 2024-10-25 04:09:31

常见监控简介的相关文章

001.常见监控简介

一 监控架构 1.1 组成 客户端:数据采集部分 服务端:数据存储分析告警展示 1.2 采集模式 被动模式:服务器端到客户端采集数据,对服务器的开销较大,适合小规模的监控环境. 主动模式:客户端主动上报数据到服务器端,对服务器的开销较小,适合大规模的监控环境. 1.4 协议 专用客户端采集 公用协议采集:SNMP/SSH/Telnet 1.5 架构 C/S架构:被监控节点较少,产生的数据较少. C/P/S架构:被监控节点较多,监控类型复杂,产生的数据和网络连接开销很大,跨地域等环境下. 二 常见

mysql常见监控503错误的软件

mysql常见监控软件:iis7服务器监控工具可以直接监控503错误监控,所以当503错误出现的时候可以直接发现:那我们应该监控MySQL的那些状态呢? 1.MySQL服务运行状态 约定所有MySQL服务都必须以ip1(内网ip)来绑定,每个机器只有一个ip1,可以有多个端口,即多个MySQL Server.采集程序读取ip端口信息文件来判断server是否存在. sockParam=ps aux | grep -P "mysqld.*--port=${port}" | grep -o

常见保护方式简介

●DEP(Date Execution Prevention)数据执行保护: DEP通过处理器的(No eXecute)功能,查找内存中没有明确包含可执行代码的数据,找到这些数据后,NX将它们都标记为“不可执行”. 以后如果某程序在内存中,试图执行这些带“不可执行”标记的代码,SP2将会自动关闭该程序.因此,假如你运行了一个已经染毒的软件, DEP就会把病毒代码标记为“不可执行”,这样就能阻止病毒在内存中运行,保护电脑中的文件免受蠕虫.病毒的传染破坏. ●ASLR(Address Space L

零售行业常见数据分析简介

1.财务分析 1)分析企业的财务状况,了解企业资产的流动性.现金流量.负债水平及企业偿还长短期债务的能力,从而评价企业的财务状况和风险. 2)分析企业的资产管理水平,了解企业对资产的管理状况,资金周转情况. 3)分析企业的获利能力. 4)分析企业的发展趋势,预测企业的经营前景. 同时,系统还应该按照部门.人员.商品.供应商.时间等各个维度综合分析各项财务指标,如:成本.毛利.利润.库存.结算.盈亏平衡点.销售数量.销售金额.市场占有率等等. 2.销售分析 主要分析各项销售指标,例如毛利.毛利率.

J2EE学习 ——J2EE常见英文缩写简介【我的第一篇随笔】

作为JAVA的企业版开发平台,JAVAEE以其良好的跨平台性.开放性.稳定性赢得了众多开发者的喜爱.在入门过程中,经常会遇到一些常见的英文缩写,作为刚刚入门JAVAEE的菜鸟,我把这些常见的缩写都记录下来以增强记忆. JDBC(Java Data Base Connectivity):JDBC与ODBC类似,为访问不同的数据库提供了一种统一的途径,对数据库的访问具有平台无关性的特点: JNDI(Java Name and Directory Interface):JNDI被用于执行名字和目录服务

Prometheus监控??简介

文档目录: ? prometheus是什么?? prometheus能为我们带来些什么? prometheus对于运维的要求? prometheus多图效果展示 1) Prometheus是什么prometheus 是?个开源系统监控和报警的?具集合,由SoundCloud创建(http://soundcloud.com/ ),?从2012诞?之后,?今已经有许多公司和组织开始使?它了,这个开源项?拥有?量的积极参与开发和建设的研发?员以及社区?户.?前已经是?个独?运?的开源的由各公司??维护

Linux下监控简介

1.磁盘IO监控工具 iotop 输入命令:iotop   主要查看程序使用的磁盘IO的信息 安装:yum -y install iotop 第一行:10:01:23 - 当前系统时间126 days, 14:29 - 系统已经运行了126天14小时29分钟(在这期间没有重启过)2 users - 当前有2个用户登录系统load average: 1.15, 1.42, 1.44 - load average后面的三个数分别是1分钟.5分钟.15分钟的负载情况. 第二行:Tasks - 任务(进

liunx服务器常见监控指标

1. CPU Utilization 英文翻译就是CPU的利用率75%以上就比较高了(也有说法是80%或者更高).有的博客上说除了这个指标外,还要结合Load Average和Context Switch Rate来看,有可能CPU高是因为后两个指标高导致的. 在Linux/Unix下,CPU利用率分为用户态.系统态和空闲态, 分别表示CPU处于用户态执行的时间,系统内核执行的时间,和空闲系统进程执行的时间,其中有些小的指标1)用户时间(User time) 官方英文为user cpu time

机器学习算法简介

欢迎大家前往腾讯云社区,获取更多腾讯海量技术实践干货哦~ 作者:吴懿伦 导语: 本文是对机器学习算法的一个概览,以及个人的学习小结.通过阅读本文,可以快速地对机器学习算法有一个比较清晰的了解.本文承诺不会出现任何数学公式及推导,适合茶余饭后轻松阅读,希望能让读者比较舒适地获取到一点有用的东西. 引言 本文是对机器学习算法的一个概览,以及个人的学习小结.通过阅读本文,可以快速地对机器学习算法有一个比较清晰的了解.本文承诺不会出现任何数学公式及推导,适合茶余饭后轻松阅读,希望能让读者比较舒适地获取到