从监控数据做分析DELL服务器 RAID卡 BBU 放电情况

从2015-12-27 18:02 预警距离下次开始进入Leam_Cycle 时间<48小时 ,在2015-12-29 10:06便开始提示已经开始进入Leam_Cycle  其实我这监控得是第一阶段得状态,意思已经进入Leam_Cycle得第一阶段了

从进入第一阶段得时间到“距离下次开始进入Leam_Cycle 时间<48小时”这个告警得恢复时间来看,2015-12-29 10:06 - 2015-12-29 13:11  整个过程是三个小时完成,也就是从第一阶段到整个过程完成是三个小时。

从上面监控图中能看到BBU在9点得时候电池容量在上升,上升到最大值,正好就是10:06分,也就是Leam_Cycle 进入第一阶段的时间,从此可知整个BUU放电得规律,整个在要进入的BBU放电过程是4个小时完成;得到第二个信息,BBU放电得规律是上升最大值然后放电,放到可承受范围最小值然后再上升到最大值,而最大值却减少, 可见锂电池放电得寿命在减少。这可看出BBU电池寿命的变化。(当然这个数据不是最准确得,因为我采集数据得密度是1小时1次,但是整个过程还是可以看到的,采集粒度已经调整1分钟一次,继续观察或许能发现更有趣得东西呢~)

但是从“预警距离下次开始进入Leam_Cycle 时间<48小时"这个预警来看他应该是48小时完成恢复,时间应该是2015-12-29 18:02,从开始得时间到它预计结束得时间整个过程应该需要8小时(10:06-18:02),但是他在2015-12-29 13:11这个问题就恢复了,从上面第二个图看是从13:11这个时间点重新开始计算的,他提前5个小时完成了,加上之前从9点就开始充电了,算起来提前4个小时完成了。为什么会出现这样得情况呢?以下是我提出得猜想:

1、在进入第一阶段之前他会进入充电状态,直到最大值。但是当前容量剩余电池容量是不是每一次都一样的,这次是从500mAh到550mAh 用了大概一个小时,下次当电池剩余容量可能会更少,由此我推出我猜想,他得预计8小时是根据他得设计得罪小最大值,从最小值到最大值需要多长时间,从最大值到最小值需要多长时间然后再充满得时间,也是说8小时是他设计的最保守得时间。

由此得出结论:如果要避开服务器高峰期手动进入BBU放电得童鞋,要将这8小时考虑进去,然后规划手动进入BBU放电时间得真正时间。

========================================================================

如果你觉得该篇文章写的不错,并且在你的工作或者生活中带来了帮助,那么你愿意在生活中给予我帮助吗?如果你愿意,为我写博客添加一些动力,可以扫下面得二维码给予我少量得赞助。

(不管再小得赞助都是你对我得肯定,这会是我一直坚持下去得动力~! 谢谢!)

这是我的微信:

时间: 2024-10-06 12:28:57

从监控数据做分析DELL服务器 RAID卡 BBU 放电情况的相关文章

【转】MegaSAS RAID卡 BBU Learn Cycle周期的影响

http://ju.outofmemory.cn/entry/140 背景 最近遇到有些带MegaSAS RAID卡的服务器,在业务高峰时突然IO负载飚升得很高,IO性能急剧下降,查了日志及各种设置最后才发现是RAID卡的Cache写策略由WriteBack变成WriteThrough了.更深入的原因是BBU进入了Learn Cycle周期,自动把Cache策略改为WriteThrough. WriteBack和WriteThrough 在开始之前,我需要提到两个词: WriteBack, Wr

mysql磁盘IO%util 居高不下之RAID卡 BBU Learn Cycle周期

最近遇到一个奇怪的问题 收到短信报警说磁盘IO很高 复制延迟 iostat -x 1 10 信息如下: QPS 如下: 负载很低  压力很低 这就很无解了. 只有一个MYSQL 其实这是个硬件问题 ,就是 MegaSAS RAID卡 BBU Learn Cycle周期 背景 最近遇到有些带MegaSAS RAID卡的服务器,在业务高峰时突然IO负载飚升得很高,IO性能急剧下降,查了日志及各种设置最后才发现是RAID卡的Cache写策略由WriteBack变成WriteThrough了.更深入的原

zabbix企业应用之定时获取监控数据做报表

最近某项目突然提出一个新需求,需要每周五14点,获取他们监控项目每天20-24点监控平均数据,以小时为单位的,输出文件是excel的,要求以每天为单位单独一个sheet,汇总邮件转给业务. 他们主要是做业务使用量报表,每周周报使用,虽然需求困难,但作为运维也得解决,下面是邮件的效果图. 可以看到邮件标题是带有项目名称与时间,收集人是业务与我. 下面是excel的格式 每天一个sheet,获取这些项目自己每天20-24点的监控平均数据,以小时为单位. 主要是使用sql查看上面的监控数据,并通过py

华为服务器RAID卡电池报错

前些天来的华为服务器 RH2288 H V2RAID卡没有电池,或者说没有电容,会报下面这样的错: 拍的有些模糊,但还是可以看清的. 有2种方法查服务器有没有带电池或者电容: 服务器上有一根ESN号,在服务器上有一个小标签,上面写着ESN:XXXXXXXXXX,把这个号给华为售后的说一下,他们能在后台给你看,这台服务器出厂的时候,有没有带电池. 第2种方法,在服务器启动的时候,按ctrl+H  进入RAID 配置界面,然后找到 Controller  properties  这个选项,点进去,然

服务器RAID卡有什么用

在租用服务器时,常常看到服务器配置中有RAID卡选项,那么究竟什么是RAID卡?RAID卡有什么用呢? 什么是RAID卡?RAID是英文Redundant Array of Independent Disks的缩写,即为独立磁盘冗余阵列,简称磁盘阵列.简单的说,RAID是一种把多块独立的硬盘(物理硬盘)按不同方式组合起来形成一个硬盘组(逻辑硬盘),从而提供比单个硬盘更高的存储性能和提供数据冗余的技术.在服务器整个系统中, RAID 被看作是由两个或更多磁盘组成的存储空间,通过并发地在多个磁盘上读

服务器Raid卡电池自动充电

1 介绍 服务器上的Raid卡电池,简称BBU,是个很重要的组件,它对于磁盘的I/O性能影响很大,但一般的BBU电量只能用90天,电用完后系统会自动给其充电,但因充电一般需要几个小时,在充电期间,Raid卡的cache状态是处于write through的,即不带缓存功能.所以为了保证服务器处于正常运行状态,就需要手工进行BBU的充放电,通常把充放电时间定在夜里面,也就是服务器负载最小的时候. 2 过程 Cron里写入: #!/bin/sh #yes, 1 really does mean of

Dell服务器iDRAC卡重置密码,忘记密码

Dell服务器iDRAC重置,忘记密码环境:Dell R630服务器(也适用于R720.R730.R620.R420.R530)问题:Dell R630服务器iDRAC忘记密码.说明:13代机器默认iDRAC账号密码为:root/calvin.14代机器默认iDRAC账号为root.密码在机器前小抽拉卡片的背面[iDRAC password]上.两代的机器重置密码的方式皆一致:解决步骤:1.开机时F2进入BIOS,选择DRAC settings.2.选择user configuration,可在

DELL服务器数据恢复成功-浦口电视台RAID5数据恢复恢复完成

服务器:DELL服务器 raid级别:raid5 5块盘 西部数据WD500G 故障:损坏2块盘,raid崩溃 数据恢复:这台服务器在南京通过两家数据恢复公司历时6天修复均未成功,最后通过介绍找到我们,难点在于其中一块盘磁头物理损坏,固件区也有很大的问题. 恢复结果:通过西数科技的努力,采用西数固件修复技术,将损坏的硬盘成功修复,最后数据100%通过raid5重组成功. 原文地址:https://blog.51cto.com/14462851/2422483

联想Lenovo服务器RAID阵列数据恢复

服务器作为数据集中存储和管理的地方,一旦其发生故障,会给用户和企业带来非常大数据损失.联想作为目前比较热门的服务器品牌,被很多企业所使用,也伴随着越来越多联想服务器数据恢复问题的出现.其中一种就是服务器raid卡损坏的数据恢复问题.那么,有没有方法能够解决联想Lenovo服务器RAID阵列数据恢复呢? 引起联想服务器数据丢失的常见故障有6种:lenovo联想服务器RAID阵列信息丢失,造成整台服务器无法启动:lenovo联想服务器硬盘一块硬盘掉线,报红灯,系统服务无法启动:将lenovo联想服务