意外断电造成RAID 5阵列卡数据故障的恢复方法

由于技术的不断进步,不同型号的服务器出现RAID 5故障后,处理方法也不同。
现在大型应用程序的网络拓朴结构,一般都采用C/S结构或B/S结构,至少需要一台装有大型数据库的服务器安放于中心机房。基于对服务器安全性与可靠性的考虑,通常会对服务器的磁盘采用磁盘阵列RAID(Redundant Array of Inexpensive Disk)进行磁盘冗余备份。其中RAID 5阵列级别为无独立校验磁盘的奇偶校验磁盘阵列,采用数据分块和独立存取技术,能在同一磁盘上并行处理多个访问请求,同时允许阵列中的任何一个硬盘出现故障。
实际应用中,由于某些不可避免的客观原因,可能会造成一些阵列故障。最常出现的状况就是硬盘自行脱机,联机状态显示为DDD(Defunct Disk Drive,无效磁盘驱动器),硬盘出现物理故障或逻辑故障。如果是物理故障,只有进行硬盘更换;如果是逻辑故障,可以通过有针对性的技术修复,恢复硬盘的在线状态,继续保持其原始阵列中的硬盘数据条带化分布状态,延续数据存储体系的一致性。
但是,对HP的一些老服务器(如HP LH6000)数据的恢复与新服务器(如HP ProLian系列服务器)的数据恢复是不同的。所以不同的服务器对RAID 5故障的处理也是不同的。笔者曾接触过两台服务器因意外断电而造成的RAID 5阵列卡数据故障,由于采用了不同的策略而解决了问题。

故障修复
一台是在2000年购买的HP LH6000的服务器,4块18GB的硬盘做成RAID 5磁盘阵列,其阵列卡是NetRaid;另一台是2006年购买的HP ProLian 文明用语370服务器,4块146GB的硬盘做成RAID 5磁盘阵列,其阵列卡是Smart Array 642并带有热备份硬盘(Hot Spare)。两者操作系统都为Window 2000,数据库是Server 2000。
HP LH6000的故障如下: 一块硬盘红灯闪亮,机器还在正常运行,但没有多久,系统就不能正常运行,这时才发现另一块硬盘的红灯也在闪亮。

解决办法如下:
1.启动服务器,自检至阵列时按Ctrl+M进入NetRaid管理程序。查看阵列信息,发现硬盘状态为Failed,运用修改配置将一硬盘强行设置成OnLine。重新启动服务器,在进入系统前的硬件自检时无效,启动失败。
2.启动服务器,自检至阵列时按Ctrl+M进入NetRaid管理程序。选择磁盘阵列,将原来OnLine挂起来的硬盘手工Fail掉,然后再把另一块Failed的硬盘手工设置成OnLine,重新启动服务器就可以进入系统了。
3.查看系统及数据库都运行正常后,再进阵列配置工具把Failed的硬盘手工设置成Rebuild,100%完成重建后再重启服务器,所有的阵列及系统都恢复原状了。

笔者所在单位另一台运行ERP系统的服务器(HP ProLiant 文明用语370),由4块146GB热插拔硬盘通过RAID卡(Smart array阵列卡)配置成一台具有RAID 5级的磁盘阵列。其中一块硬盘在运行过程中突然出现故障。服务器RAID 5自动启用热备份硬盘(Hot Spare),对损坏硬盘进行逻辑替代。整个硬盘的数据访问任务仍然完整地运行在原来的读写进程序列中,应用程序和数据库没有发生影响。
通过HP自带的ACU工具查看硬盘状态进行检查,发现红灯示警的硬盘处于脱机状态。如果HP ProLiant服务器中的Raid 5有两块硬盘出现亮红灯时,表明系统已经崩溃,数据库也就不能访问,但系统不会自动关机。当第二块硬盘亮红灯后,用常规的手段是不能恢复数据的,只有付费找专业的第三方数据恢复公司恢复数据。

因此,对惠普老型号HP LH6000系列服务器来说,阵列的设计方面与现在HP ProLiant系列服务器的阵列有很多不同。就操作方法看,HP LH6000服务器的阵列操作方法有很多可选项,包括阵列失败后可以重新删除阵列并重建等,初始化也是手工选择的。但是HP ProLiant系列服务器阵列的初始化是在配置阵列后自动在后台执行的,所以ProLiant系列服务器在阵列出错后是不能重配阵列的。

原文地址:http://blog.51cto.com/sun510/2069415

时间: 2024-10-09 21:52:30

意外断电造成RAID 5阵列卡数据故障的恢复方法的相关文章

磁盘阵列RAID与阵列卡(原理知识)

我们今天来了解磁盘阵列,下期将给大家带来RAID5.RAID6等配置实操,请多多捧场. 一.RAID磁盘阵列介绍 ■RAID是英文Redundant?Array?of?Independent?Disks的缩写,中文简称为独立冗余磁盘阵列 ■RAID是把多块独立的物理硬盘按不同的方式组合起来形成一个硬盘组(逻辑硬盘),从而提供比单个硬盘更高的存储性能和提供数据备份技术 ■组成磁盘阵列的不同方式称为RAID级别(RAID?Levels),常用的RAID级别有以下几种:?RAIDO,?RAID1,RA

三种VMware数据备份和恢复方法

服务器虚拟化,尤其是VMware形式的服务器虚拟化使IT人员获益良多,这么说一点也不为过.据我们所见,服务器虚拟化能解决服务器扩张.资源消耗.服务器扩张.能源消耗.高可用性等相关问题.服务器虚拟化也使我们有更多的时间解决其它的迫切问题,如企业资源预案升级.存储项目再三迁移. 尽管VMware提供封装技术和抽象技术,使我们受益匪浅,但数据保护领域发生的基本变革也带来了各项挑战.即使出现了VMware虚拟化,备份人员依然是牢骚最多的IT人员.最大的挑战在于保证数据的一致性,解决VMware物理资源过

Linux 平台下 误删 oracle 数据文件的恢复方法

1  问题描述 之前写过一篇删除oracle home目录的blog,参考: Linux 平台误删 home oracle 根目录的解决方法 http://blog.csdn.net/tianlesoftware/article/details/43794273 本篇是这边的引深,本来应该是年前整理的,拖到年后了. 模拟现状: 数据库在正常运行,误操作,直接rm 掉了数据文件. 测试环境: [[email protected] trace]$ cat /etc/redhat-release Re

固态硬盘数据误删的恢复方法介绍

固态硬盘有什么好处? 1.启动快,没有电机加速旋转的过程.2.不用磁头,快速随机读取,读延迟极小.3.无噪音.因为没有机械马达和风扇 ,工作时噪音值为0分贝.4.经久耐用.防震抗摔.内部不存在任何机械活动部件,不会发生机械故障,也不怕碰撞.冲击.振动.5.工作温度范围更大.典型的硬盘驱动器只能在5到55摄氏度范围内工作.而大多数固态硬盘可在-10~70摄氏度工作,一些工业级的固态硬盘还可在-40~85摄氏度,甚至更大的温度范围下工作.6.低容量的固态硬盘比同容量硬盘体积小.重量轻 固态硬盘怎么选

常用PC服务器LSI阵列卡配置

通常,我们使用的DELL/HP/IBM三家的机架式PC级服务器阵列卡是从LSI的卡OEM出来的,DELL和IBM两家的阵列卡原生程度较高,没有做太多封装,可以用原厂提供的阵列卡管理工具进行监控:而HP的阵列卡一般都做过封装了,因此需要使用自身特有的管理工具来监控. 本文以几种常用的阵列卡为例,展示其阵列卡及硬盘监控的方法. DELL SAS 6/iR卡,全称LSI Logic SAS1068E,只支持RAID 0, RAID 1, RAID 1+0, 不支持RAID 5等高级RAID特性,不支持

突然断电造成RAID磁盘阵列卡信息的丢失如何恢复

现在很多企业单位都有自己的服务器,raid类服务器就是最为广泛使用的一类服务器.有时候服务器会出现raid磁盘阵列卡信息丢失的情况,比如说突然断电造成RAID磁盘阵列卡信息的丢失, 要怎么处理呢? Raid信息丢失,一般是指是指raid管理的硬盘信息丢失导致raid报错.除了突然断电,电源电压不稳导致raid信息丢失之外,硬盘物理故障(如坏道,磁盘出错,raid 5损坏超过2个盘以上), 在硬盘顺序弄错后启动系统或者更改配置的操作对阵列磁重新配置RAID信息等,这些都有可能使阵列卡或者RAID套

定制带RAID阵列卡驱动的WINPE3.0系统

最近一个朋友的服务器出现了问题,经了解他的服务器是组装的,且配置了RAID5阵列,目前无法正常启动系统,且中间一盘电源系统掉了,对数据进行了损坏,RAID正在进行数据修复中,但复制完成后发现系统无法启动,且重新安装系统也会报需要格式化磁盘,这时候如果直接安装又怕数据损坏,但是他需要将数据备份出来,于是想到了用WINPE系统,但是就目前而言百度能找到的PE系统都是无RAID阵列卡驱动的,或都阵列卡驱动不对的,为此我需要自己定制一个PE系统来解决这一问题,在这里将PE系统定制的方法说一下,希望以后遇

使用RAID阵列卡制作RAID 10 和RAID 5 步骤

公司最近进了几台带有RAID阵列卡的测试机,对于我们公司产品来说,这几台服务器的性能倒是非常不错的了.而我也终于有幸接触到了带有硬件RAID卡的服务器,所以立马倒腾了一下硬RAID的制作. 我选择了其中一台服务器做测试.这里先说一下这台服务器的硬件,当然是我们实验所需要的硬件.服务器带有4块2T的企业级硬盘和1块240G的SSD硬盘,服务器支持板载RAID,当然也有一块带有512M缓存的RAID卡. 我本想使用4块硬盘制作RAID5,这样的话,就可以有7.6T*(3/4)的实际可存储空间,但是在

dell服务器各类raid 和磁盘在阵列卡上的实验

听很多人说,做好阵列的硬盘从阵列上移除后,重新从硬盘导入阵列信息的时候不能打乱位置,昨天用两台Dell R710,四块sas 300G HP硬盘做实验,实验步骤如下: 一.dell R710首先用三块硬盘做raid 5 另外的一块做全局热备盘 二.在dell R710上安装red hat linux 6.5 64位 三.清除另外一台dell R710上的阵列信息 四.将拆下来的四块硬盘按照硬盘位对应顺序插上去 ID                      # 000