12.文件系统——磁盘管理之RAID概述

一、什么是RAID

从上个世纪80年代起，主流的硬盘接口主要有两类：

A.IDE：用于桌面系统

B.SCSI：用于工业系统（因为转速高，平均巡道时间短，性能较IDE好）

SCSI的性能虽然优于IDE，但其成本约是IDE的五倍以上，故无法广泛应用。人们为了节省成本的同时保持性能，于是设计出了一种方案，即将很多廉价的IDE设备联合起来，当做一块硬盘使用。这种将多块廉价IDE设备并行联合使用的模式就是RAID——廉价冗余磁盘阵列（Redundent Array ofInexpensive Disk）。

RAID能够让多块廉价的硬盘并行工作，在一定程度上提供了高效、可靠的特点。但它需要在IDE控制器之上再提供一种逻辑更高的控制器，这种控制器即为RAID控制器。IDE设备虽然廉价，但是RAID控制器本身非常昂贵，且RAID模式所提供的可靠性不足以满足人们的需要，所以后来在工业级别的应用上，人们将SCSI联合起来组成了RAID，这种RAID得到了更广泛的应用。此时RAID廉价的特性已经不明显了，于是其含义变成了：RedundentArray of Independent Disk——独立冗余磁盘阵列。当让无论RAID的名称如何变化，它体现的思想都是一致的，即将底层的物理磁盘在更高层次的架构上组织起来，使它们能像一块完整的物理设备那样工作。

在没有RADI之前，每一个单独的设备，其控制器是直接连接到主板的总线上的，这个控制器可以和CPU及其他设备进行通信；而有了RAID级别的概念之后，需要在原有控制器之上附加一个更高级别的总控制器，该控制器会对其他低级别的控制器进行集中控制，然后再连接到内存、CPU或其他设备的总线上。

在没有使用RAID之前，CUP会将每一个设备识别为一个单独的个体，而有了RAID之后，CPU会认为这几个设备是一个整体，即由RAID控制器抽象出来的设备。对RAID的管理，就是对总控制器（RAID的芯片）的管理，这个芯片可能是内嵌在主板上的，也可能是个独立的卡片——适配器，通过PCI-E的插槽连接到一个存储设备上，该存储设备称为DAS设备（直接附加存储设备）。

二、RAID的级别

RAID的目的主要有两个方面：

A、高性能：所谓高性能指的是读写性能，有的场景要求读性能高，有的场景要求写性能高，还有一些场景需要同时兼顾读写的性能

B、可靠性（冗余）：频繁的读写操作容易损坏磁盘，可靠性就意味着即使某一块磁盘坏掉了，也不会影响数据的使用（有备份硬盘），这种概念即为冗余。

为了满足不同高性能和可靠性的需求，RAID提供了不同的级别，而区分不同RAID级别的方式，就是在RAID后面加上不同的数字，即从Raid0,Raid1,...Raid7这8种；而后来随着RAID的进一步发展，产生了不同的RAID级别的组合方式，即Raid10,Raid50等等。

RAID的级别本身没有高低上下之分，也就意味着Raid1并不会优于Raid0，它们只是用来描述多块磁盘的组合方式。下面来逐一介绍不同RAID级别的组合方式：

（1）Raid0

Raid0也称为条带设备，即将多块设备并联起来提供高性能的方式。RAID0以条带的形式将数据均匀分布在阵列的各个磁盘上，D0、D1...个数据块并不是指的Block，数据块要大得多。每个数据块会按照顺序分别存储到对应的硬盘数据块上，故在RAID0上存储数据，是将数据平均分布到磁盘上，从而实现了并行存取，因此（读写）性能得到了极大的提升。

RAID0的特性

（2）Raid1

Raid1也称为镜像，镜像顾名思义就是将一份数据存储多份，以镜像为冗余方式，对虚拟磁盘上的数据做多份拷贝，放在成员磁盘上。如果一块物理磁盘坏了，另一块还能继续提供服务。对于Raid1来说，它仍然需要将数据切割为数据块。对于镜像设备来说，两个或多个磁盘上的位（扇区），都是一一对应的。

如果其中一块磁盘坏掉了，将由另一块磁盘继续提供服务；为了防止备份磁盘也坏掉，就需要马上将已经坏掉的磁盘用一块好的新盘替换掉，而当新磁盘替换上来后，它会马上和正在工作的磁盘做一次同步（Sync），即和原有磁盘建立对应关系，并将原有磁盘上的数据按位复制过来。所以做镜像服务的磁盘，需要时时监控。现在有很多RAID1提供热备份，即在镜像磁盘之外还有一块热备份磁盘，时时监控正在工作的镜像磁盘，一旦发现其中任何一块磁盘坏了，就自动顶替上来，从而保证可靠性。

RAID1的特性