一次HP 阵列卡排障

公司使用的是HP gen8机器,用的是p420i阵列卡,同时在系统的另一端,nagios监控系统配合nrpe脚本check_hpasm定期检测硬件健康。

最近为了让机器更带劲,加上了SSD硬盘,机械硬盘仅用作大容量存储,在感受速度与激情的同时,悲剧接踵而至。

nagios 监控报警,硬件出错:

CRITICAL - da controller 1 in slot 1 needs attention, System: ‘proliant dl3x0e gen8‘, S/N: ‘CN74xxxxx‘, ROM: ‘P73 12/20/2013‘
Performance Data:	pc_1=65 fan_5=27% fan_6=27% fan_7=27% fan_8=27% temp_1_ambient=23;42;42 temp_2_cpu#1=40;70;70 temp_4_memory_bd=24;87;87 temp_6_memory_bd=25;80;80 temp_7_memory_bd=26;80;80 temp_8_memory_bd=26;80;80 temp_9_memory_bd=25;80;80 temp_10_memory_bd=25;80;80 temp_11_memory_bd=26;80;80 temp_12_system_bd=35;60;60 temp_13_system_bd=44;105;105 temp_14_system_bd=33;95;95 temp_17_power_supply_bay=26;80;80 temp_18_power_supply_bay=25;80;80 temp_19_system_bd=25;110;110 temp_20_system_bd=21;110;110 temp_21_system_bd=24;110;110 temp_22_system_bd=26;110;110 temp_23_system_bd=21;65;65 temp_26_system_bd=35;100;100 temp_28_system_bd=28;90;90 temp_29_i/o_zone=85;100;100 temp_31_i/o_zone=32;80;80 temp_32_i/o_zone=25;80;80 temp_33_system_bd=32;80;80 temp_34_system_bd=30;80;80 temp_35_system_bd=30;80;80 temp_36_system_bd=31;80;80 temp_37_system_bd=29;80;80

由于报警内容非常含糊,像是一颗***,根本不敢将机器正式投入运营,不得不将机器从机房运回来仔细测试。感觉是硬件故障,但是替换了阵列卡甚至重装了N次操作系统之后,依然报相同的错误。如果不用SSD,只使用普通硬盘,就不会报错。

最终的问题定位到了HP 阵列卡里的HP SSD smart path 功能,该功能可以加速SSD盘读写,有点混合硬盘的味道,即当作机械硬盘的缓存。但是很抱歉,如果你使用SSD硬盘安装操作系统的话,会有上面的报错。

解决办法:

yum install http://downloads.linux.hp.com/SDR/downloads/MCP/CentOS/7/x86_64/10.0/hpssacli-2.0-22.0.x86_64.rpm http://downloads.linux.hp.com/SDR/downloads/MCP/CentOS/7/x86_64/10.0/hpssa-2.0-22.0.x86_64.rpm-y 
/usr/sbin/hpssacli controller slot=1 array a modify ssdsmartpath=disable

hpssacli-2.0-22.0.x86_64.rpm ,经过测试,这个包centos 6/7 都适用。

也可以开机根据提示按F5进入阵列卡的图形管理界面来禁用该功能。

时间: 2024-08-08 22:05:46

一次HP 阵列卡排障的相关文章

cobbler initrd.img引导镜像中添加HP DL388 Gen8 B320i阵列卡驱动

1.利用cobbler安装HP DL388 Gen8服务器时不能成功,报错提示找不到可用的硬盘,和HP售后沟通了解到HP DL388 Gen8服务器的raid卡的型号是B320i.centos6或7系统的initrd.img中没有B320i阵列卡的驱动,如果想把Gen8装上centos或redhat的系统,需要先在官网下载B320i阵列卡的驱动,CentOS7的下载地址如下: 阵列卡驱动下载 http://h20564.www2.hp.com/hpsc/swd/public/detail?sp4

dell服务器各类raid 和磁盘在阵列卡上的实验

听很多人说,做好阵列的硬盘从阵列上移除后,重新从硬盘导入阵列信息的时候不能打乱位置,昨天用两台Dell R710,四块sas 300G HP硬盘做实验,实验步骤如下: 一.dell R710首先用三块硬盘做raid 5 另外的一块做全局热备盘 二.在dell R710上安装red hat linux 6.5 64位 三.清除另外一台dell R710上的阵列信息 四.将拆下来的四块硬盘按照硬盘位对应顺序插上去 ID                      # 000              

使用命令行工具对LSI阵列卡进行高效管理

LSI公司(LSI Corporation)(NASDAQ:LSI)(中文:艾萨华)是一家总部位于加利福尼亚州米尔皮塔斯 (Milpitas) 的半导体和软件领先供应商,其主要产品包括:RAID控制器.SSD控制器.ReadChannel.Preamp.Axxia网络处理器和定制ASIC等,为加速数据存储中心与移动网络性能提供了许多领先的解决方案. 在目前各大知名品牌服务器厂商:IBM.DELL.HP.华为.联想.宝德.浪潮.中科曙光等服务器都使用LSI品牌的阵列卡作为服务器存储控制器,而且其性

    排障思路--------杀毒

一.尽可能搞清楚问题的前因后果 不要一下子就扎到服务器前面,你需要先搞明白对这台服务器有多少已知的情况,还有故障的具体情况.不然你很可能就是在无的放矢. 必须搞清楚的问题有: 故障的表现是什么?无响应?报错? 故障是什么时候发现的? 故障是否可重现? 有没有出现的规律(比如每小时出现一次) 最后一次对整个平台进行更新的内容是什么(代码.服务器等)? 故障影响的特定用户群是什么样的(已登录的, 退出的, 某个地域的-)? 基础架构(物理的.逻辑的)的文档是否能找到? 是否有监控平台可用? (比如M

常用PC服务器LSI阵列卡配置

通常,我们使用的DELL/HP/IBM三家的机架式PC级服务器阵列卡是从LSI的卡OEM出来的,DELL和IBM两家的阵列卡原生程度较高,没有做太多封装,可以用原厂提供的阵列卡管理工具进行监控:而HP的阵列卡一般都做过封装了,因此需要使用自身特有的管理工具来监控. 本文以几种常用的阵列卡为例,展示其阵列卡及硬盘监控的方法. DELL SAS 6/iR卡,全称LSI Logic SAS1068E,只支持RAID 0, RAID 1, RAID 1+0, 不支持RAID 5等高级RAID特性,不支持

秒开缓存系统支持的硬件阵列卡

秒开缓存系统支持的硬件阵列卡列表(不限于以下型号) 目前可以确认完美支持的有: HP/惠普 Smart Array 系列阵列卡(如P400/P410/P800等) Dell/戴尔 PowerEdge PERC4/PERC5 RAID 阵列卡 Promise PDC20XXX/40XXX系列阵列卡 LSI Logic / Symbios Logic MegaRAID SAS 2208 [Thunderbolt] 阵列卡 LSI Logic / Symbios Logic SAS1068E PCI-

意外断电造成RAID 5阵列卡数据故障的恢复方法

由于技术的不断进步,不同型号的服务器出现RAID 5故障后,处理方法也不同.现在大型应用程序的网络拓朴结构,一般都采用C/S结构或B/S结构,至少需要一台装有大型数据库的服务器安放于中心机房.基于对服务器安全性与可靠性的考虑,通常会对服务器的磁盘采用磁盘阵列RAID(Redundant Array of Inexpensive Disk)进行磁盘冗余备份.其中RAID 5阵列级别为无独立校验磁盘的奇偶校验磁盘阵列,采用数据分块和独立存取技术,能在同一磁盘上并行处理多个访问请求,同时允许阵列中的任

SERVERAID 8K和8K-L阵列卡在添加新硬盘时会丢失阵列配置信息

客户有一台IBM X3400需要扩容本地硬盘,去之前以为和IBM x3650M4等服务器类似,就没有多查资料,到现场后发现阵列卡型号是SERVERAID 8K,整个配置界面与x3650M4 的webbios配置阵列卡完全不同,没敢贸然操作,上网查了查资料,一些注意的地方和大家分享一下. 使用ARC配置ServeRAID_8k-l8k8i图文手册,已经上传到这里http://down.51cto.com/data/1357299 适用机型: 所有System x3400; 所有System x35

使用RAID阵列卡制作RAID 10 和RAID 5 步骤

公司最近进了几台带有RAID阵列卡的测试机,对于我们公司产品来说,这几台服务器的性能倒是非常不错的了.而我也终于有幸接触到了带有硬件RAID卡的服务器,所以立马倒腾了一下硬RAID的制作. 我选择了其中一台服务器做测试.这里先说一下这台服务器的硬件,当然是我们实验所需要的硬件.服务器带有4块2T的企业级硬盘和1块240G的SSD硬盘,服务器支持板载RAID,当然也有一块带有512M缓存的RAID卡. 我本想使用4块硬盘制作RAID5,这样的话,就可以有7.6T*(3/4)的实际可存储空间,但是在