MegaCli监控RAID磁盘健康信息

首先有必要先介绍一下有关RAID卡的使用,有关Cache问题也有个人理解:生产系统上的物理机磁盘配置大多都是RAID5,之前会经常性的遇到磁盘IO在某个时间极度的跟不上节奏,稍微写入量,磁盘utils就能够飙到80%多;最后发现是RAID卡的模式改变导致的性能影响;一般RAID卡的电池都会进行充放电的操作来进行电池的保护,一般时间在90天进行一次充放电,放电时间不一(没有验证过这个,感觉有1-2小时)。RAID卡电池放电时有默认策略会关闭RAID模式“Write Back”使用“Write through”

Write Back:在系统与磁盘的数据交互中启用RAID的Cache,在写入数据开启时,其性能能够提高是一个数量级的(一般RAID卡都配备有512M、1G缓存)

Write Throug:不启用RAIDcache,直接有磁盘进行数据交互;但是在读取性能上较好;电池放电启用此功能 是为了防止在 write back下并且无RAID卡电池的情况中,系统断电导致数据丢失

最终,考虑IDC机房情况我们都开启了电池放电状态下也强制开启缓存的策略,以解决短时间性上在写入性能的过分差距

查看是否是目前模式,如下是Write Throug

强制开启方法
强制开启步骤
强制修改RAID卡由writethrough到writeback 方法
# /opt/MegaRAID/MegaCli/MegaCli64 -LDSetProp CachedBadBBU -Lall -aALL
Set Write Cache OK if bad BBU on Adapter 0, VD 0 (target id: 0) success
若是放电关闭缓存 强制设置电池放电依然开启缓存方法
# /opt/MegaRAID/MegaCli/MegaCli64 -LDSetProp WB -Lall -aALL
Set Write Policy to WriteBack on Adapter 0, VD 0 (target id: 0) success
查看是否成功
# /opt/MegaRAID/MegaCli/MegaCli64 -LDGetProp -Cache -L0 -a0
Adapter 0-VD 0(target id: 0): Cache Policy:WriteBack, ReadAheadNone, Direct, Write Cache OK if bad BBU

开启后

Esxi下使用MegaCli
esxcli software vib install -v /tmp/vmware-esx-MegaCli-8.07.07.vib --no-sig-check
/opt/lsi/MegaCLI/MegaCli  -LDInfo -Lall -aALL

强制修改RAID卡为WB:

cd /opt/lsi/MegaCLI/

/opt/lsi/MegaCLI/MegaCli  -LDSetProp CachedBadBBU -Lall -aALL

/opt/lsi/MegaCLI/MegaCli  -LDSetProp WB -Lall -aALL

/opt/lsi/MegaCLI/MegaCli  -LDGetProp -Cache -L0 -a0

时间: 2024-08-03 19:25:56

MegaCli监控RAID磁盘健康信息的相关文章

MegaCli 监控raid状态

MegaCli是一款管理维护硬件RAID软件,可以通过它来了解当前raid卡的所有信息,包括 raid卡的型号,raid的阵列类型,raid 上各磁盘状态,等等.通常,我们对硬盘当前的状态不太好确定,一般通过机房人员巡检来完成,有没有通过软件的方式来检查确定这个问题呢.MegaCli就可以做到,一般通过 MegaCli 的Media Error Count: 0 Other Error Count: 0 这两个数值来确定阵列中磁盘是否有问题:Medai Error Count 表示磁盘可能错误,

ESXI 监控raid状态

为了保证服务器上的数据安全,一般阵列卡会做raid5,或者raid6等等.但是这避免不了可能存在某个磁盘损坏的情况. ESXI 6以前的版本可以用 MegaCli监控raid状态 [[email protected]:~] esxcli software vib install -v /tmp/vmware-esx-MegaCli-8.07.07.vib --no-live-install (安装发现有冲突)[DependencyError]File path of '/opt/lsi/Mega

MegaCli 采集raid的基本信息

命令使用:MegaCli -LDInfo -Lall -aALL 查raid级别MegaCli -AdpAllInfo -aALL 查raid卡信息MegaCli -PDList -aALL 查看硬盘信息MegaCli -AdpBbuCmd -aAll 查看电池信息MegaCli -FwTermLog -Dsply -aALL 查看raid卡日志 MegaCli常用参数介绍MegaCli -adpCount [显示适配器个数]MegaCli -AdpGetTime –aALL [显示适配器时间]

megacli组建raid

由于需要将磁盘划分为两个raid,一是raid 1用于安装操作系统,另一个是raid 5用于存放大量数据,由于Dell powerEdge R730xd,不支持开机界面组建多raid,只能进入系统使用megacli来操作 查看已有raid 信息,目前是针对操作系统做了一个raid 1 [[email protected] ~]# megacli -LDInfo -Lall -aALL Adapter 0 -- Virtual Drive Information:Virtual Drive: 0

shell编程之【nagios自定义监控系统磁盘脚本】

之前写了一篇文章主要介绍nagios的搭建使用 http://msiyuetian.blog.51cto.com/8637744/1704346 下面这篇文章主要介绍nagios自定义监控系统磁盘的脚本实现. Nagios可以识别4种状态返回信息,即 0 表示状态正常(OK).1 表示出现警告(WARNING).2 表示出现非常严重的错误(CRITICAL),3 表示未知错误(UNKNOWN).Nagios根据插件返回来的值,来判断监控对象的状态,并通过web显示出来.我们就可以利用上面这个特性

Spring Boot 揭秘与实战(九) 应用监控篇 - HTTP 健康监控

文章目录 1. 内置 HealthIndicator 监控检测 2. 自定义 HealthIndicator 监控检测 3. 源代码 Health 信息是从 ApplicationContext 中所有的 HealthIndicator 的 Bean 中收集的, Spring Boot 内置了一些 HealthIndicator. 内置 HealthIndicator 监控检测 Name Description CassandraHealthIndicator Checks that a Cas

python 监控windows磁盘空间和备份大小

#!/usr/bin/env python # Version = 3.5.2 # __auth__ = '无名小妖' import os import time import sendmail import psutil import collections disk_used = collections.OrderedDict() cur_time = time.time() # current_day = cur_time - cur_time % 86400 root_dir = ["D

突然断电造成RAID磁盘阵列卡信息的丢失如何恢复

现在很多企业单位都有自己的服务器,raid类服务器就是最为广泛使用的一类服务器.有时候服务器会出现raid磁盘阵列卡信息丢失的情况,比如说突然断电造成RAID磁盘阵列卡信息的丢失, 要怎么处理呢? Raid信息丢失,一般是指是指raid管理的硬盘信息丢失导致raid报错.除了突然断电,电源电压不稳导致raid信息丢失之外,硬盘物理故障(如坏道,磁盘出错,raid 5损坏超过2个盘以上), 在硬盘顺序弄错后启动系统或者更改配置的操作对阵列磁重新配置RAID信息等,这些都有可能使阵列卡或者RAID套

Redhat6.4 软raid磁盘更换

Redhat6.4 软raid磁盘更换 由下图可知/dev/md10的raid级别为10,raid成员为4块硬盘,正在工作的却只有3块,其中一块故障丢失. 添加一块新硬盘,创建分区为fd(Linux raid autodetect)模式 添加新硬盘为故障阵列raid10的热备 热备盘添加成功后会自动顶替raid10中故障硬盘位置,自动Rebuild同步,等待同步完成. Rebuild完成,状态正常. 注:若系统创建/etc/mdadm.conf开机自动挂载软raid文件,需将此文件中故障盘符更改