服务器raid常见故障分析 附数据恢复方案

Raid磁盘阵列是一种将多块物理硬盘整合成一个虚拟存储的技术,raid模块相当于一个存储管理中间层,上层接收并执行操作系统及文件系统的数据读写指令,下层管理数据在各个物理硬盘上的存储及读写,相对于单独的物理硬盘,raid可以为用户提供更大的独立存储空间,更快的读写速度,更高的数据存储安全及更方便的统一管理模式。Raid磁盘阵列的正常运转是保障服务器中数据正常读写的关键所在。

服务器raid损坏的常见特征:

1.Raid磁盘阵列中有多快物理硬盘指示灯报警。
2.磁盘阵列中显示多块硬盘呈离线状态或丢失状态
3.Raid信息丢失、所有物理硬盘不再是online状态
4.无法进入raid管理界面或查看raid相关信息时死机。

磁盘阵列出现故障的可能原因分析:

1.磁盘阵列中的单块硬盘出现物理故障,可能导致服务器内数据出现一定损坏。
2.Raid数据传输通道不畅或者数据传输模块老化,可能导致服务器内数据出现不一致情况。
3.因服务器系统更新、重启或服务器意外断电导致raid信息丢失或raid模块损坏。这种情况下可能导致服务器数据受到一定破坏。
4.Raid模块升级或重装系统导致raid信息丢失或被重新创建,可能导致服务器数据受到严重破坏。
5.错误插拔磁盘阵列中的物理硬盘或者强制硬盘online/rebuild/frombyte可能导致服务器数据遭到完全损坏。

数据恢复解决方案:

首先将磁盘阵列中所有运行状态良好的非热备盘完整备份到带有冗余功能的安全存储中,对于存在物理故障的硬盘必须首先按照相应故障类型的解决方案进行恢复,然后尽最大可能将故障物理硬盘中的数据同样备份至安全存储中。
然后对完整备份的所有硬盘镜像进行分析,确定故障raid的原结构参数,(raid级别、条带块大小、硬盘盘序、数据校验方式frombyte等),同时判断故障raid中各硬盘的离线情况。
根据分析所得的raid参数及硬盘离线情况在只读环境中构建raid数据,并对所构建的虚拟raid进行基本的逻辑校验,确定文件系统大体结构无误后将raid阵列生成完整镜像。
最后对备份生成的raid镜像进行完整的逻辑分析和校验,若文件系统仍存在不一致的情况则依据相应文件系统损坏情况的解决方案记性修复,直至迁移出所需数据。

Raid磁盘阵列故障后数据保护建议:

1.切忌使硬盘再次受到磕碰,服务器中任何一块硬盘对于数据恢复来说都非常重要,如果关键硬盘出现严重物理损坏,数据恢复工作将变的异常艰难甚至无法完成。
2.切忌重新创建raid或者强制online/rebuild,若服务器中有提早离线硬盘或上线同步选择错误,此时的数据恢复工作将异常艰难甚至无法完成。
3.切忌非专业人士对故障存储的主要模块进行拆卸、更换等操作,不当的操作会对服务器内部的数据造成严重影响,甚至永久性的破坏服务器数据。

原文地址:http://blog.51cto.com/sun510/2096088

时间: 2024-10-05 16:04:56

服务器raid常见故障分析 附数据恢复方案的相关文章

联想Lenovo服务器RAID阵列数据恢复

服务器作为数据集中存储和管理的地方,一旦其发生故障,会给用户和企业带来非常大数据损失.联想作为目前比较热门的服务器品牌,被很多企业所使用,也伴随着越来越多联想服务器数据恢复问题的出现.其中一种就是服务器raid卡损坏的数据恢复问题.那么,有没有方法能够解决联想Lenovo服务器RAID阵列数据恢复呢? 引起联想服务器数据丢失的常见故障有6种:lenovo联想服务器RAID阵列信息丢失,造成整台服务器无法启动:lenovo联想服务器硬盘一块硬盘掉线,报红灯,系统服务无法启动:将lenovo联想服务

HP EVA4400服务器RAID信息丢失数据恢复方法

[服务器数据恢复故障分析] 在数据恢复行业中经常会遇到因为意外断电导致raid模块硬件损坏或者riad管理信息丢失等raid模块损坏导致数据丢失的情况.正常情况下服务器的raid阵列一旦创建完成后就不再对管理模块中的信息进行更改,不过raid管理模块的信息其实是可修改信息,一次或多次的意外断电是可能造成这部分信息被篡改或丢失的,断电次数过多时甚至可能导致raid卡上的元器损坏.间接导致主机失去对多块物理硬盘进行RAID管理的中间层模块.今天这个服务器就属于这种情况. [服务器数据恢复故障描述]

IBM DS4800服务器RAID信息丢失数据恢复方法

[服务器数据恢复故障描述] 客户服务器属于IBM品牌DS 4800型号服务器,服务器底层共有5块硬盘组成raid5阵列,单块硬盘为3TB.SAS硬盘.Windows操作系统.服务器在工作中遭遇意外断电,管理员重启服务器时由于机房供电故障导致服务器再次断电.再次重启服务器后raid阵列提示"无法找到存储设备",尝试进入raid管理模块查看信息但每次进入raid管理模块时都会导致服务器死机,尝试很多次依然是死机状态,管理员只好联系数据恢复公司进行服务器数据恢复. [服务器数据恢复方案] 1

某服务器RAID5阵列数据恢复方案及过程

第一部分:数据恢复方案 [故障描述]:某公司的一台服务器组了一个raid5磁盘阵列有两块磁盘先后掉线,服务器崩溃.故障服务器的操作系统为linux redhat 5.3,应用系统为构架于oracle的一个oa,数据重要,时间很急.因oracle已经不再对本oa系统提供后续支持,用户要求尽可能数据恢复+操作系统复原.[初检结论]:热备盘完全无启用,硬盘无明显物理故障,无明显同步表现.数据通常可恢复[恢复方案]:1.保护原环境,关闭服务器,确保在恢复过程中不再开启服务器.2.将故障硬盘标好序号,确保

Raid5磁盘阵列数据恢复,服务器raid数据恢复步骤和方法

[磁盘阵列数据恢复故障描述]客户的一台HP DL380 G4服务器,服务器使用hp smart array控制器挂载了一台国产磁盘阵列,磁盘阵列由14块146G SCSI硬盘组成一组RAID5.操作系统为LINUX,构建了NFS+FTP,作为公司内部文件服务器使用.由于服务器机房进行搬迁,搬迁过程中管理员顺便打扫了一下服务器和磁盘阵列设备,随后在新机房链接线路后服务器无法识别RAID,未做初始化. [对raid5阵列的初检结果]工程师对设备进行简单的初检,发现数据丢失的原因为raid信息丢失,H

服务器Raid数据恢复成功案例和raid 5数据恢复算法原理

服务器Raid 5数据恢复案例本次分享的案例是一台服务器中的raid磁盘阵列,磁盘阵列中有12块磁盘,单盘容量500G,ext3文件系统,系统平台为Linux平台.Raid中2号盘和6号盘两块硬盘报黄灯,管理人员检查后对6号盘进行了强制上线操作,强制上线后发现多数目录打不开,可以打开的目录中有部分目录中出现文件丢失情况.客户联系到北亚数据恢复中心进行raid磁盘阵列的数据恢复. 1.首先分析原raid结构,将强制上线的6号盘去掉,将2号盘加入进去,通过虚拟环境搭建raid平台.2.然后通过软件进

HP FC MSA2000服务器raid数据恢复成功案例

一.服务器数据恢复案例背景: HP FC MSA2000服务器空间由8块450GB SAS硬盘组成raid5磁盘阵列,一块热备盘.服务器在使用中先后有两块硬盘离线,导致服务器瘫痪,lun无法正常使用.服务器数据恢复工程师分别对服务器中所有磁盘进行物理检测和坏道检测,均无异常. 二.服务器数据恢复备份 考虑到数据的安全性以及可还原性,在做数据恢复之前需要对所有源数据做备份,以防万一其他原因导致数据无法再次恢复.使用dd命令或winhex工具将所有磁盘都镜像成文件.备份完部分数据如下图: 三.服务器

服务器RAID配置全程与RAID基础知识

服务器RAID配置全程 一.RAID介绍 RAID是Redundent Array of Inexpensive Disks的缩写,直译为“廉价冗余磁盘阵列”,也简称为“磁盘阵列”.后来RAID中的字母I被改作了Independent,RAID就成了“独立冗余磁盘阵列”,但这只是名称的变化,实质性的内容并没有改变.可以把RAID理解成一种使用磁盘驱动器的方法,它将一组磁盘驱动器用某种逻辑方式联系起来,作为逻辑上的一个磁盘驱动器来使用. RAID的优点 1. 传输速率高.在部分RAID模式中,可以

主板常见故障分析

主板常见故障分析 一.开机无显示 微机开机无显示,首先我们考虑的是BIOS.主板的BIOS中储存着重要的硬件数据,也是主板中比较娇嫩的部分,极易受到破坏,一旦受损就会导致系统无法运行,出现此类故障一般是因为主板BIOS被CIH病毒破坏造成(当然也不排除主板本身故障导致系统无法运行.).一般BIOS被病毒破坏后硬盘里的数据将全部丢失,所以我们可以通过检测硬盘数据是否完好来判断BIOS是否被破坏,如果硬盘数据完好无损,那么还有三种原因会造成开机无显示的现象: 1.因为主板扩展槽或扩展卡有问题,导致插