案例:
抛出一个做过RAID,开机出现问题的案例。当然这里只是其中一个现象。
从中可以得到三个信息。
1、Adapter RAID BLOS V5.2-0 //可能和RAID有关
2、press<ctrl><A>for ibm serveRAID configuration utility! //ctal+A进入BLOS配置
3、controller monitor initializing... //控制器监视初始化…
遇到这样的问题,一般人可能会不淡定了,不知道如何有效的,最小损失的解决问题。
在这里,我谈一下个人的经验和看法,希望可以帮助到一些人。出现上述问题,处理步骤可见下:
###############################################################
谈谈本人对于做RAID 后期维护的经验:
1、RAID的选择:
1.1)RAID5
1.2)RAID+热备
1.3)RAID10
1.4)其他
其中上面三种方式用的颇多,用RAID之前,要知道其中的不同,如果你是做RAID5的话,要注意定期机房查看,或者通过监控检测(不过还是觉得定期机房查看为好),不过这里要明白,至少坏多少盘磁盘阵列会出现问题。这也是一些人用RAID5之后,加了个热备盘的原因。至于RAID10,用的也比较多,而且风险要比RAID5小一些。因此,RAID的选择很重要。
2、数据的备份
你始终要明白,做RAID是为了更好的确保数据的安全性,但是你更要明白,数据备份才是王道,即使做了RAID,数据也要定期备份,如果数据十分重要,一点也不可以丢失,那选择一种实时备份尤为重要。
3、RAID数据盘和系统盘区分
我本人还是比较建议RAID和系统区分开的,比如系统盘做RAID1,数据库盘单独做别的RAID,合理化管理。当然如果不喜欢这种方式也可以。
4、RAID卡报错,处理步骤如下:
4.1)首先检查物理服务器磁盘是否出现黄灯或者红灯现象,一般先是黄灯的偏多。
4.2)黄灯情况,坏的盘理论不影响数据
4.2.1)要先想想是否数据进行了备份,如果没有,尽快备份。
(此考虑是在系统并没有关机,只是监控报警发现RAID卡出现问题)
4.2.2)如果系统不慎关机,发现此现象,那先考虑是否有售后,数据备份有没有备份,如果有,先恢复当前业务为主,然后将磁盘拿到售后进行处理。
4.3)如果没有售后且红灯且理论影响数据,尽可能挽救损失。
4.3.1)尝试此服务器换个系统(系统不能在RAID卡),然后启动系统,尝试挂载RAID阵列,备份数据
4.3.2)如果由于一般原因(比如松动,磁盘内部发生报错),可尝试是把服务器的RAID卡抠出来再放进去一般就能解决了,如果此方法不能解决的话则有可能是RAID卡有了问题。
4.3.3)出现问题的磁盘不要直接使用(除非磁盘坏道修复,没有其它)
5、RAID卡出现问题注意事项
5.1)不要随意插拔硬盘
5.2)不能搞乱RAID卡顺序
5.3)如果是一块RAID卡出现问题,可换一块磁盘即可。
总结:数据为大,选好RAID卡阵列,定期数据备份,平时机房监控查看,懂得尽可能挽救RAID阵列里的数据,尽可能避免损失。
本文完全博主就RAID问题个人经验总结,如有问题,欢迎指出。