• 产品更新

什么是 RAID?RAID 有哪些不同的模式?

什么是 RAID?RAID 有哪些不同的模式?

目录

当企业需要构建容错服务器基础设施时,RAID阵列不可或缺。仅使用单块硬盘作为存储设备存在安全隐患——任何机械设备都可能在工作中突然故障,尤其在最关键的时刻。若数据全部丢失,企业该如何应对?有人会说备份,这固然正确,但从备份中恢复丢失数据的过程漫长而复杂。正因如此,人们发明了RAID阵列,确保数据始终处于可用状态。

何为RAID?

首先需明确RAID的定义。简言之,RAID即独立磁盘冗余阵列,通过将独立硬盘以特定方式排列,实现数据交错存储,从而在物理上不同的驱动器上生成冗余数据。

当物理磁盘发生故障时,若阵列配置得当,数据依然安全。RAID无法抵御病毒攻击,但能延长存储硬件及其所含数据的寿命。它保护数据免受机械损坏,而数据备份则能以可编程方式保存数据。初期投资更多磁盘总比仅配置单一存储阵列更稳妥——后者一旦发生故障,极可能导致所有数据永久丢失

RAID有哪些类型?

在RAID技术发展三十年间,企业不断向工程师提出特定容错需求,由此催生出应对不同任务的多种RAID类型。

RAID 0

RAID 0阵列并非真正的RAID,因其不含冗余信息,故无法保护存储数据(单个成员故障即导致数据丢失)。该模式仅将独立设备组合为逻辑整体,容量等于所有成员总和。连接方式分为两种:串联(即线性)与条带化:

  • 串联 (JBOD)

串联模式下,数据按顺序存储于多个磁盘。首个磁盘满载后,数据将依次存储至第二个、第三个磁盘。其优势在于可通过添加成员轻松扩展容量,且当某个成员故障时部分文件可能不受影响。

  • 交错存储

采用交错存储时,数据以循环方式(交替存储,见右侧示意图)分布于磁盘。存储空间被划分为固定大小的块,因此读写较长数据段时需调用多个磁盘。当磁盘发生故障时,几乎所有文件都将受损。交错存储能加速大块数据的读写操作,因为可同时从一个磁盘读取(或写入)一块数据,从另一个磁盘读取(或写入)下一块数据。理论上其读取速度提升幅度应低于RAID 1,但在实际应用中,RAID 0的读写速度显著快于RAID 1。在家庭环境中,顺序读取性能提升通常约为50%(即使用两块顺序读取速度为100 MB/s的硬盘,磁盘阵列的读取速度通常可达约150 MB/s)。当然,50%的提升并不意味着性能减半,因为RAID 0模式不会降低访问时间。

本质上1TB+1TB=2TB并提升读写速度。单盘故障即导致系统完全瘫痪。

RAID 1

最简洁但高效的数据保护方案。通过镜像技术将数据同步写入两块磁盘。单盘故障时可立即调用副本。此技术可升级为双控制器架构。该技术称为双重化,同时具备抗控制器故障能力。理论上可显著提升读取速度并略微缩短响应时间,但实际效果取决于具体控制器(软件控制器通常完全不利用双磁盘读取能力)。由于相同数据存储在两块磁盘上,写入速度可能变慢。该技术极大增强了硬件故障导致的数据丢失防护能力,缺点是需要双倍磁盘容量。

  • RAID 0+1

是RAID 0与RAID 1的组合方案。我们将数据以交错方式(条带化)存储在两块磁盘(A、B)上,再对另外两块磁盘(C、D)重复相同操作。由此形成两个具有冗余内容的逻辑磁盘AB、CD。(若文件在条带化时被分割为两部分,则文件前半部分存储于磁盘A和C,后半部分存储于磁盘B和D。)该方案的优势在于:不仅将读写负载分散至多块磁盘,数据还以冗余形式存储,因此发生错误后可轻松恢复。缺点包括仅利用50%的总磁盘容量,且当四块磁盘中有任意一块故障时将丧失数据冗余性。

  • RAID 1+0

此方案反向组合RAID 0与RAID 1:先将相同数据存储于磁盘A、B,再存储于磁盘C、D。由此形成两个逻辑磁盘AB与CD,数据以条带化方式存储。(若文件在条带化时被分割为两部分,其前半部分存储于磁盘A和B,后半部分存储于磁盘C和D,这与RAID 0+1不同)其优势与RAID 0+1相似,且RAID 1+0对多磁盘故障的容错能力更强,故障后的数据恢复速度也更快。缺点仍是仅能使用50%的容量。

RAID 5 与 RAID 6

RAID 5 至少需要 3 个硬盘,其中一个硬盘的容量用于存储自修复校验码,这些校验码交替存储在各硬盘上。其优势在于可实现并行数据访问——较长的数据段分散存储于多个磁盘,因此读取速度显著提升。缺点是写入速度较慢(需计算自校验码)。可承受单盘故障。

RAID 10

其区别于RAID 0+1之处在于:数据先在磁盘阵列中镜像,再插入另一个RAID 0磁盘阵列以提升传输速率。每个阵列最多可承受单盘故障而不影响系统运行。此类型常用于高负载数据库应用。这是因为无需计算校验数据,从而提升整体速度(或降低成本)。

硬件RAID与软件RAID的对比

软件RAID

由操作系统自行创建、挂载并管理物理磁盘组成的RAID。操作系统会标记用于RAID的分区,创建虚拟设备并允许访问该存储空间。

该方案的缺点在于需占用服务器资源处理所有RAID相关任务,但其优势在于系统可靠性极高,几乎可媲美硬件RAID。就当前议题而言,绝大多数制造商(如Synology、QNAP、Thecus等)通常在SOHO及SMB级产品线采用此类系统(具体基于Linux),因此当NAS进行重要文件传输时,会因CPU负载显著增加导致其他进程运行变慢。

硬件RAID

这是高性能服务器中常见的RAID方案,通过专用控制器或卡实现RAID管理,这类控制器自带处理器和内存,能减轻数据服务器的CPU负担。硬件RAID可应用于SATA、SAS或SCSI硬盘(后者使用率日益降低)。

从逻辑上讲,这种实现系统是最可靠、最快捷的,因此价格也明显更高。可以几乎肯定地排除您计算机或NAS上安装的RAID采用此系统,因为其成本高达数千欧元。

在RAID 0、1和10工作模式下,此类RAID相较其他系统并无显著优势,因为控制器并未为系统执行重大卸载任务。

Share

关于作者


scale 1
Ready to scale?

Start for free and unlock high-performance infrastructure with instant setup.

Get started arrow button

帮助我们改进 — 分享您的反馈

您的意见有助于我们提供更好的服务。