raid阵列常见故障解决方案分享

Raid磁盘阵列是一种将多块物理硬盘整合成一个虚拟存储的技术,raid模块相当于一个存储管理中间层,上层接收并执行操作系统及文件系统的数据读写指令,下层管理数据在各个物理硬盘上的存储及读写,相对于单独的物理硬盘,raid可以为用户提供更大的独立存储空间,更快的读写速度,更高的数据存储安全及更方便的统一管理模式。Raid磁盘阵列的正常运转是保障服务器中数据正常读写的关键所在。

服务器raid损坏的常见特征:

1.Raid磁盘阵列中有多快物理硬盘指示灯报警。
2.磁盘阵列中显示多块硬盘呈离线状态或丢失状态
3.Raid信息丢失、所有物理硬盘不再是online状态
4.无法进入raid管理界面或查看raid相关信息时死机。

磁盘阵列出现故障的可能原因分析:

1.磁盘阵列中的单块硬盘出现物理故障,可能导致服务器内数据出现一定损坏。
2.Raid数据传输通道不畅或者数据传输模块老化,可能导致服务器内数据出现不一致情况。
3.因服务器系统更新、重启或服务器意外断电导致raid信息丢失或raid模块损坏。这种情况下可能导致服务器数据受到一定破坏。
4.Raid模块升级或重装系统导致raid信息丢失或被重新创建,可能导致服务器数据受到严重破坏。
5.错误插拔磁盘阵列中的物理硬盘或者强制硬盘online/rebuild可能导致服务器数据遭到完全损坏。

数据恢复解决方案:

首先将磁盘阵列中所有运行状态良好的非热备盘完整备份到带有冗余功能的安全存储中,对于存在物理故障的硬盘必须首先按照相应故障类型的解决方案进行恢复,然后尽最大可能将故障物理硬盘中的数据同样备份至安全存储中。
然后对完整备份的所有硬盘镜像进行分析,确定故障raid的原结构参数,(raid级别、条带块大小、硬盘盘序、数据校验方式等),同时判断故障raid中各硬盘的离线情况。
根据分析所得的raid参数及硬盘离线情况在只读环境中构建raid数据,并对所构建的虚拟raid进行基本的逻辑校验,确定文件系统大体结构无误后将raid阵列生成完整镜像。
最后对备份生成的raid镜像进行完整的逻辑分析和校验,若文件系统仍存在不一致的情况则依据相应文件系统损坏情况的解决方案记性修复,直至迁移出所需数据。

Raid磁盘阵列故障后数据保护建议:

1.切忌使硬盘再次受到磕碰,服务器中任何一块硬盘对于数据恢复来说都非常重要,如果关键硬盘出现严重物理损坏,数据恢复工作将变的异常艰难甚至无法完成。
2.切忌重新创建raid或者强制online/rebuild,若服务器中有提早离线硬盘或上线同步选择错误,此时的数据恢复工作将异常艰难甚至无法完成。
3.切忌非专业人士对故障存储的主要模块进行拆卸、更换等操作,不当的操作会对服务器内部的数据造成严重影响,甚至永久性的破坏服务器数据。

原文地址:http://blog.51cto.com/sun510/2163988

时间: 2024-07-30 01:19:53

raid阵列常见故障解决方案分享的相关文章

阵列箱故障解决方案

故障解决方案 1.打开网页,输入127.0.0.1:81进入管理界面. 如果进不去管理界面需要安装最新的Areca驱动(官方下载) 快速关闭报警的方法:1.按ESC按钮   2.进入管理界面,手动关闭 2.输入用户名密码及驱动下载   用户名:admin   密码:  0000   进入areca官方网站 www.areca.com.tw下载驱动 3.查看日志/关闭报警(手动)  进入管理界面后,点击System Controls里面的View Events/Mute Beeper,进行查看日志

RAID磁盘阵列常见故障以及修复方法

服务器数据安全有着至关重要的意义,目前大多数服务器都采用了RAID磁盘阵列技术.受服务器自身硬件局限和技术人员的操作因素,服务器无阵列无法做到100%的无故障发生.那么RAID磁盘阵列故障有哪些?RAID磁盘阵列如何进行数据恢复? 导致磁盘阵列RAID数据丢失的故障原因分为RAID逻辑层故障,RAID物理层故障以及RAID坏道层故障. 对于逻辑层故障,例如误删除,误格式化,误分区,RAID阵列信息丢失, RAID阵列信息混乱, 重新配置RAID阵列信息导致数据丢失, RAID阵列内磁盘顺序出错等

raid阵列崩溃后对物理硬盘做完整镜像的步骤

磁盘阵列(DiscArray)是由许多台磁盘机或光盘机按一定的规则,如分条(Striping).分块(Declustering).交叉存取(Interleaving)等组成一个快速,超大容量的外存储器子系统.它在阵列控制器的控制和管理下,实现快速,并行或交叉存取,并有较强的容错能力.从用户观点看,磁盘阵列虽然是由几个.几十个甚至上百个盘组成,但仍可认为是一个单一磁盘,其容量可以高达几百-上千千兆字节,因此这一技术广泛为多媒体系统所欢迎.因此raid阵列数据恢复的市场需求也很大,本文主要为大家详细

联想Lenovo服务器RAID阵列数据恢复

服务器作为数据集中存储和管理的地方,一旦其发生故障,会给用户和企业带来非常大数据损失.联想作为目前比较热门的服务器品牌,被很多企业所使用,也伴随着越来越多联想服务器数据恢复问题的出现.其中一种就是服务器raid卡损坏的数据恢复问题.那么,有没有方法能够解决联想Lenovo服务器RAID阵列数据恢复呢? 引起联想服务器数据丢失的常见故障有6种:lenovo联想服务器RAID阵列信息丢失,造成整台服务器无法启动:lenovo联想服务器硬盘一块硬盘掉线,报红灯,系统服务无法启动:将lenovo联想服务

如果RAID阵列崩溃你能想到哪些好的补救方式,学会这一步颠覆你以往认知。

一.存储故障概述1.故障环境两组分别由4块600G容量的SAS硬盘组成的raid5阵列,并且两组阵列划分LUN,组成LVM结构,并格式化为EXT3文件系统.2.故障分析一块硬盘意外离线,热备盘上线,顶替离线硬盘.但在热备盘上线过程中,又一块硬盘离线,导致热备盘同步失败,两组raid阵列中的一组崩溃,LVM结构不完整,文件系统无法正常使用.对两块离线硬盘进行检测,发现先离线硬盘无法识别,初步推断是硬件故障,需要进行开盘修复操作,另一块硬盘可以识别.二.解决方案概述根据前期的故障分析结果,总结出以下

RAID阵列

RAID阵列 一. RAID简介 RAID全称为Redundant Array of Disks,是"独立磁盘冗余阵列"(最初为"廉价磁盘冗余阵列")的缩略语.1987年由Patterson,Gibson和Katz在加州大学伯克利分院的一篇文章中定义.RAID阵列技术允许将一系列磁盘分组,以实现为数据保护而必需的数据冗余,以及为提高读写性能而形成的数据条带分布.RAID最初用于高端服务器市场,不过随着计算机技术的快速发展,RAID技术已经渗透到计算机遍布的各个领域.

使用RAID阵列卡制作RAID 10 和RAID 5 步骤

公司最近进了几台带有RAID阵列卡的测试机,对于我们公司产品来说,这几台服务器的性能倒是非常不错的了.而我也终于有幸接触到了带有硬件RAID卡的服务器,所以立马倒腾了一下硬RAID的制作. 我选择了其中一台服务器做测试.这里先说一下这台服务器的硬件,当然是我们实验所需要的硬件.服务器带有4块2T的企业级硬盘和1块240G的SSD硬盘,服务器支持板载RAID,当然也有一块带有512M缓存的RAID卡. 我本想使用4块硬盘制作RAID5,这样的话,就可以有7.6T*(3/4)的实际可存储空间,但是在

老男孩教育每日一题-2017年4月28日- MySQL主从复制常见故障及解决方法?

MySQL主从复制常见故障及解决方法? 1.1.1故障1:从库数据与主库冲突 show slave status; 报错:且show slave status\G Slave_I/O_Running:Yes Slave_SQL_Running:No Seconds_Behind_Master:NULL Last_error:Error 'Can't create database 'xiaoliu'; database exists' on query. Default   database:'

NFS服务的简介及常见故障解决方法

NFS服务的简介及常见故障解决方法 1.NFS基本介绍 (1)NFS简介 NFS 是Network File System的缩写,即网络文件系统.一种使用于分散式文件系统的协定,由Sun公司开发,于1984年向外公布.功能是让客户端通过网络访问不同主机上磁盘里的数据,主要用在类Unix系统上实现文件共享的一种方法.NFS在文件传送或信息传送过程中依赖于RPC协议. (2)NFS服务需要安装的软件 nfs-utils-* :包括基本的NFS命令与监控程序 rpcbind-* :支持安全NFS RP