Spring Boot Actutaur + Telegraf + InFluxDB + Grafana 构建监控平台之应用数据分析

本节将引入完美的granafa仪表板,在上节的基础上,并提出自己的一些监控数据的总结和看法

你可以有一个类似于这个的Dashboard,会引入监控Zimbra协作

  本节环境采用的是centos7系统,配置跟上节介绍的一样,但是Telegraf是企业级监控加入很多可靠的监控插件,非常有用的一些参数,随之也给自

己的监控数据分析带来了复杂度。

  • Telegraf:它负责收集我们通过配置文件传递的所有数据,Telegraf收集我们配置的输出结果,例如CPU / RAM / LOAD或Nginx,MariaDB等服务。
  • InfluxDB:这是Telegraf发送所有这些信息的地方,InfluxDB专门设计用于高效存储大量信息,此外,可以定义信息保留期以防万一出现性能问题
  • Grafana:它是仪表板,负责显示InfluxDB存储在数据库中的所有信息

在Grafana中导入仪表板  

  你可以从这里下载:https://grafana.com/dashboards/2846/        导入它们的步骤如下,转到我们的仪表板,然后按导入

  输入Zimbra仪表板的ID:2846,我们将自动显示以下内容,选择我们的数据源并将其提供给导入

  几分钟后,我们可以开始看到一个生动的仪表板,如下所示

数据分析

  Grafana将系统和应用程序的的数据展示出来,就要开始分析数据的意图。

  1. 应用程序数据:SpringBoot Actutaur中的metrics收集到的数据指标,通过jolokia拉取数据到telegrafa上代理转给输入到时间序列数据库中(我尝试过直接将指标存入influxdb中,但未找到解决方案,有知道的伙伴可以给我留言)    

   

  补充:jolokia是一个JMX-HTTP桥梁,可替代JSR-160连接器。它是一种基于代理的方法,支持许多平台。

   除了基本的JMX操作外,它还通过独特的功能(如批量请求和细粒度的安全策略)增强了JMX远程处理能力,应用程序的监控直接扩展到jvm。

  

  特别注意:代理模式只能在需要时使用。代理servlet自身比代理模式更强大,因为它消除了增加整体复杂性和性能的附加层。此外,在代理模式下,某些功能(如合并MBeanServers)也不可用。

在telegrafa中,开启对应的数据,jolokia采用拉取数据,所以都会在[inputs.jolokia]更改

   [[inputs.jolokia.metrics]]
     name = "类加载次数"
     mbean  = "java.lang:type=ClassLoading"
     attribute = "LoadedClassCount,UnloadedClassCount,TotalLoadedClassCount"
   [[inputs.jolokia.metrics]]
        name = "metrics数据"
        mbean="org.springframework.boot:type=Endpoint,name=metricsEndpoint"
        attribute = "Data"

  grafana中在数据库中查到的就会有对应由jolokia拉去的数据做下拉列表

  • 系统信息:包括处理器数量processors、运行时间uptime和instance.uptime、系统平均负载systemload.average。
  • mem.*:内存概要信息,包括分配给应用的总内存数量以及当前空闲的内存数量。这些信息来自java.lang.Runtime。
  • heap.*:堆内存使用情况。这些信息来自java.lang.management.MemoryMXBean接口中getHeapMemoryUsage方法获取的java.lang.management.MemoryUsage。
  • nonheap.*:非堆内存使用情况。这些信息来自java.lang.management.MemoryMXBean接口中getNonHeapMemoryUsage方法获取的java.lang.management.MemoryUsage。
  • threads.*:线程使用情况,包括线程数、守护线程数(daemon)、线程峰值(peak)等,这些数据均来自java.lang.management.ThreadMXBean。
  • classes.*:应用加载和卸载的类统计。这些数据均来自java.lang.management.ClassLoadingMXBean。
  • gc.*:垃圾收集器的详细信息,包括垃圾回收次数gc.ps_scavenge.count、垃圾回收消耗时间gc.ps_scavenge.time、标记-清除算法的次数gc.ps_marksweep.count、标记-清除算法的消耗时间gc.ps_marksweep.time。这些数据均来自java.lang.management.GarbageCollectorMXBean。
  • httpsessions.*:Tomcat容器的会话使用情况。包括最大会话数httpsessions.max和活跃会话数httpsessions.active。该度量指标信息仅在引入了嵌入式Tomcat作为应用容器的时候才会提供。
  • gauge.*:HTTP请求的性能指标之一,它主要用来反映一个绝对数值。比如上面示例中的gauge.response.hello: 5,它表示上一次hello请求的延迟时间为5毫秒。
  • counter.*:HTTP请求的性能指标之一,它主要作为计数器来使用,记录了增加量和减少量。如上示例中counter.status.200.hello: 11,它代表了hello请求返回200状态的次数为11。
  • double asterisks(star-star)来自与Spring MVC匹配的请求/**(通常是静态资源)
  • /trace:该端点用来返回基本的HTTP跟踪信息
  • /dump:该端点用来暴露程序运行中的线程信息。

  在应用层面只能监控到接口的200,response,400的状态,时间响应上,需要的信息量还不足。可以在telegraf.conf中开启net监控网络等,使用正确的插件帮助我们实现监控需求。

  以上都是我个人在实践中的总结和资料整理,如有疑问可以给我留言,我会及时回复您的。

原文地址:https://www.cnblogs.com/zhikou/p/8576891.html

时间: 2024-10-10 03:52:31

Spring Boot Actutaur + Telegraf + InFluxDB + Grafana 构建监控平台之应用数据分析的相关文章

Spring Boot Actutaur + Telegraf + InFluxDB + Grafana 构建监控平台

完成一套精准,漂亮图形化监控系统从这里开始第一步 Telegraf是收集和报告指标和数据的代理 它是TICK堆栈的一部分,是一个用于收集和报告指标的插件驱动的服务器代理.Telegraf拥有插件或集成功能,可直接从运行的系统获取各种指标,从第三方API获取指标,甚至通过StatsD和Kafka消费者服务来收听指标.它还具有输出插件,可将指标发送到各种其他数据存储,服务和消息队列,包括InfluxDB,Graphite,OpenTSDB,Datadog,Librato,Kafka,MQTT,NSQ

用Nginx+Telegraf+Influxb+Grafana构建高逼格Nginx集群监控系统

日常生产环境搭建了Nginx集群后,就需要继续深入研究的就是日常Nginx监控. Nginx如何监控?相信百度就可以找到:nginx-status 通过Nginx-status,实时获取到Nginx监控数据后,如何和现有监控系统集成?一个很好的解决方案: Nginx+Telegraf+Influxdb+Grafana 即通过Telegraf监控插件定时收集Nginx的监控状态,存储到时序数据库Influxdb中,然后通过Grafana展现即可. 一.Nginx启用nginx-status功能 源

使用Telegraf + Influxdb + Grafana 监控SQLserver服务器的运行状况

使用Telegraf + Influxdb + Grafana 监控SQLserver服务器的运行状况 前言 本文在Debian9下采用Docker的方式安装Telegraf + Influxdb + Grafana对服务器进行监控. 首先我们需要在一台Server上安装Debian9作为监控主机,这个监控主机可以配置为可监控多台Server. 安装Docker 如果之前已经安装过旧版本的Docker,先移除旧版本的安装 sudo apt-get remove docker docker-eng

telegraf+influxdb+grafana环境初探

Telegraf+Influxdb+Grafana环境初探 简介 Part1:写在最前 Grafana,一个非常好用的开源监控(应该说是出图)软件.各类个性化定制非常易用,像常见的cpu,mem,mysql常用监控项都已经内置.grafana并未被我用在生产,本着学习交流的原则,来写这篇文章吧. 安装 Part1:环境准备 环境: HE3: mysql所在服务器,被监控机 ip 192.168.1.250 mysql port 3306 部署telegraf HE4: grafana serve

jmeter+influxdb+grafana性能测试监控

背景: 话说Jmeter原生的监控确实太丑了,听大佬们在讨论Jmeter+InfluxDb+Grafana的监控,于是,为了有一个漂亮的测试报告,就手动开始进行部署. 安装步骤: 1.influxdb下载安装: [[email protected] ~]# wget https://dl.influxdata.com/influxdb/releases/influxdb-1.7.0.x86_64.rpm --no-check-certificate [[email protected] ~]#

使用telegraf+influxdb+grafana监控ceph集群

telegraf是一个收集监控项的agent,有支持收集多种数据的插件比如ceph,apache,docker,haproxy,system等,同时有支持多种输出的插件比如influxdb,graphite等. influxdb是时序数据库,多用于监控场景 grafana是很棒的绘图工具 这三者的结合有三个主要过程: 1.安装在ceph集群所有节点(包括mon和osd节点)上的telegraf通过ceph_input插件收集ceph集群信息,这里踩了两个坑,ceph_input插件报了两个错,一

Spring Boot 中 10 行代码构建 RESTful 风格应用

RESTful ,到现在相信已经没人不知道这个东西了吧!关于 RESTful 的概念,我这里就不做过多介绍了,传统的 Struts 对 RESTful 支持不够友好 ,但是 SpringMVC 对于 RESTful 提供了很好的支持,常见的相关注解有: @RestController @GetMapping @PutMapping @PostMapping @DeleteMapping @ResponseBody ... 这些注解都是和 RESTful 相关的,在移动互联网中,RESTful 得

基于Prometheus和Grafana的监控平台 - 环境搭建

相关概念 微服务中的监控分根据作用领域分为三大类,Logging,Tracing,Metrics. Logging - 用于记录离散的事件.例如,应用程序的调试信息或错误信息.它是我们诊断问题的依据.比如我们说的ELK就是基于Logging. Metrics - 用于记录可聚合的数据.例如,队列的当前深度可被定义为一个度量值,在元素入队或出队时被更新:HTTP 请求个数可被定义为一个计数器,新请求到来时进行累.prometheus专注于Metrics领域. Tracing - 用于记录请求范围内

[docker] 用influxDB & Grafana & Telegraf & Jmeter搭建服务监控平台

原文地址:https://www.cnblogs.com/allbetter/p/11072813.html