Kubernetes资源监控探索

搭建kubernetes集群，有一个默认的dashboard，但是这个dashboard比较简陋，不能将自定义展示。所以打算使用Grafana+Heapster+Influxdb构建一个一体化监控平台

首先呢？从https://github.com/kubernetes/heapster获取源码，在heapster/deploy/kube-config/influxdb文件夹下将所有的yaml文件，使用kubectl create，这样就分别的到

了heapster,grafana,influxdb三种不同类型的pod。

比较重要的是：heapster.yaml中--source和--sink的配置:

https://github.com/nefuddos/heapster/blob/master/docs/sink-configuration.md

https://github.com/nefuddos/heapster/blob/master/docs/source-configuration.md

碰到的问题：

由于heapster收集集群信息需要一些时间，所以在dashboard上看到的cpu和mem信息会慢一些。

还有一次错误日志：

2017-09-16T02:45:40.136702919Z E0916 02:45:40.136411 1 influxdb.go:150] Failed to create infuxdb: failed to ping InfluxDB server at "monitoring-influxdb:8086" - Get http://monitoring-influxdb:8086/ping: dial tcp: lookup monitoring-influxdb on 10.254.0.2:53: server misbehaving

根据后面的信息，dial tcp xxx，说明heapster所在的pod访问kube-dns出现问题。查了一下，在kube-dns所在的那个机器上，所有的pod节点都不可访问。

于是将kube-dns.yaml手动制定一个可以访问的node节点上就可以了。

heapster结构图：

时间： 2025-01-05 12:39:43

Kubernetes资源监控探索的相关文章

k8s资源监控metrics-server

简述: 在k8s早期版本中,对资源的监控使用的是heapster的资源监控工具. 但是从 Kubernetes 1.8 开始,Kubernetes 通过 Metrics API 获取资源使用指标,例如容器 CPU 和内存使用情况. 这些度量指标可以由用户直接访问,例如通过使用kubectl top 命令,或者使用集群中的控制器. Metrics API: 通过 Metrics API,您可以获得 node 或 pod 当前的资源使用情况(但是不存储). metres-server比 heapst

jmeter资源监控插件

地址为: http://jmeter-plugins.org/wiki/PerfMon/ jmeter资源监控插件,布布扣,bubuko.com

大开测试：性能-如何实现对Web应用程序服务器资源监控（连载25）

7.25 如何实现对Web应用程序服务器资源监控 1．问题提出如何实现对Web应用程序服务器资源监控? 2．问题解答可以使用LoadRunner的Web应用程序服务器资源监控器,在场景或会话步骤运行期间监控Web应用程序服务器,并隔离应用程序服务器性能瓶颈. Web应用程序服务器资源监控器提供了场景或会话步骤执行过程中,有关Ariba.ATG Dynamo.BroadVision.ColdFusion.Fujitsu INTERSTAGE.iPlanet (NAS).Microsoft A

容器和实时资源监控的必知要素

您是否实时监控您的容器资源?如果没有,那意味着您可能没有对之进行有效监控.在快速变化的.动态的微服务环境中,即使是几秒钟以前的监视数据也可能不再可行.为了防止中断,您需要实时监控. 在这篇文章中,我解释了为什么对容器资源进行实时监控是很重要的,以及实时监控中您应该关注的容器指标. 首先要明确的是,这篇文章并非在为哪个特定的容器监控产品站台.虽然现在有很多可供容器使用的实时监控平台,但我认为最好的做法,还是充分了解容器监控的基本要素,而不是只关注特定产品的某些特性.如果您知道为保证容器基础设施正常

C#监控-机器资源监控：CPU、内存、C盘、D盘资源监控及邮件预警

针对CPU.内存.C盘.D盘资源监控及邮件预警,要实现在页面上配置资源监控选项,并且页面上能看到资源使用情况,超出阈值,邮件预警,效果图如下: 配置监控列表页 2. 配置监控详情页 3. 实时监控信息展示页 4. 监控信息图标展示 5. 超出阈值发送预警邮件实现详情: 处于性能上的优化,每个监控都写成了个单例,并且通过多线程来取得各个监控数据 CPU监控通过PerformanceCounter("Processor", "% Processor Time", &

UNIX资源监控

UNIX资源监控(Windows操作系统同理)中指标磁盘交换率(Disk rate),如果该参数值一直很高,表明I/O有问题.可考虑更换更快的硬盘系统 UNIX资源监控中指标内存页交换速率(Paging rate),如果该值偶尔走高,表明当时有线程竞争内存.如果持续很高,则内存可能是瓶颈.也可能是内存访问命中率低. CPU相关指标 ? CPU utilization(System mode CPU utilization +User mode CPU utilization ) ——CPU利用

服务器资源监控指标

内存:1 UNIX资源监控中指标内存页交换速率(Paging rate,使用称为“页面”的单位,将固定大小的代码和数据块从 RAM 移动到磁盘的过程,其目的是为了释放内存空间),如果该值偶尔走高,表明当时有线程竞争内存.如果持续很高,则内存可能是瓶颈.也可能是内存访问命中率低.2 Windows资源监控中,如果Process/Private Bytes计数器和Process/Working Set计数器的值在长时间内持续升高,同时Memory/Available bytes计数器的值持续降低,则

深度解析Tengine的调试与资源监控方法论

摘要: Tengine是由淘宝网发起的Web服务器项目.它在Nginx的基础上,针对大访问量网站的需求,提供更强大的流量负载均衡能力.全站HTTPS服务.安全防×××.链路追踪等众多高级特性.团队的核心成员来自于淘宝.搜狗等互联网企业,从2011年12月开始,Tengine成为一个开源项目,团队在积极地开发和维护着它,最终目标是打造一个高效.稳定.安全.易用的Web平台. 阿里云CDN现在服务超过24万家客户,Tengine作为接入层提供高性能Web Server服务,是CDN系统最核心的组件之

深入理解Kubernetes资源限制：CPU

写在前面在上一篇关于Kubernetes资源限制的文章我们讨论了如何通过ResourceRequirements设置Pod中容器内存限制,以及容器运行时是如何利用Linux Cgroups实现这些限制的.也分析了requests是用来通知调度器Pod所需资源需求和limits是在宿主机遇到内存压力时帮助内核限制资源二者的区别. 在本文中,我会继续深入探讨CPU时间的requests和limits.你是否阅读过第一篇文章并不会影响本文的学习,但是我建议你两篇文章都读一读,从而得到工程师或者集群管理