• Productupdates

Wat is RAID en wat zijn de verschillende RAID-modi?

Wat is RAID en wat zijn de verschillende RAID-modi?

Inhoudsopgave

Wanneer bedrijven een fouttolerante serverinfrastructuur willen bouwen, kunnen ze niet zonder RAID-arrays. Het gebruik van één HDD als opslagapparaat is niet veilig, aangezien elk ander apparaat de kans heeft om midden in het werk, op het meest ongelegen moment, defect te raken. Wat moeten bedrijven doen als ze alle gegevens kwijt zijn? Back-ups maken, zou je zeggen, en je hebt gelijk, maar het terughalen van verloren gegevens uit back-ups is een langdurig proces. Daarom hebben mensen RAID-arrays uitgevonden, zodat de gegevens te allen tijde operationeel blijven.

Wat is RAID?

Eerst moeten we definiëren wat een RAID is. Kort gezegd is RAID een Redundant Array of Independent Disks, wat betekent dat het een reeks afzonderlijke harde schijven is die zo zijn gerangschikt dat het interleaven en opslaan van gegevens resulteert in redundante gegevens op een fysiek andere schijf.

In het geval van een fysieke schijfstoring met een correct geconfigureerde array, zijn de gegevens veilig. RAID kan u niet redden van virusaanvallen, het zorgt er alleen voor dat uw opslaghardware langer meegaat en de gegevens die erop staan. Het beschermt de gegevens tegen mechanische schade, terwijl gegevensback-up uw gegevens op een programmeerbare manier kan opslaan. Het is altijd beter om in eerste instantie in meer schijven te investeren dan in één opslagarray, waarbij bij een storing het risico groot is dat alle gegevens onherstelbaar verloren gaan

Wat zijn de soorten RAID?

Gedurende de 30 jaar dat RAID bestaat, hebben bedrijven ingenieurs de opdracht gegeven om bepaalde soorten fouttolerantie te ontwikkelen, wat heeft geresulteerd in verschillende RAID-types die bepaalde taken aankunnen.

RAID 0

Een RAID 0-array is eigenlijk geen echte RAID, omdat deze geen redundante informatie bevat en dus geen bescherming biedt voor de opgeslagen gegevens (een storing van een onderdeel betekent gegevensverlies). De afzonderlijke apparaten worden gewoon gecombineerd tot een logisch geheel, waardoor een capaciteit ontstaat die gelijk is aan de som van alle onderdelen. De verbinding kan op twee manieren worden geïmplementeerd: als een aaneenschakeling (d.w.z. lineair) en door middel van striping:

  • Aaneenschakeling (JBOD)

Bij aaneenschakeling worden gegevens sequentieel op meerdere schijven opgeslagen. Wanneer de eerste vol is, worden de gegevens op de tweede opgeslagen, vervolgens op de derde, enzovoort. Het voordeel is dat de capaciteit eenvoudig kan worden vergroot door een ander lid toe te voegen en dat sommige bestanden mogelijk niet worden beïnvloed wanneer een lid uitvalt.

  • Interleaving

Bij interleaving worden gegevens cyclisch (afwisselend, zie de afbeelding rechts) op de schijven opgeslagen. De ruimte wordt verdeeld in stukken van vaste grootte, zodat het schrijven of lezen van een langer gedeelte van de gegevens vanaf meerdere schijven plaatsvindt. In het geval van een schijfstoring is het onwaarschijnlijk dat er bestanden onbeschadigd blijven. Interleaving kan het lezen en schrijven van grotere gegevensblokken versnellen, omdat het mogelijk is om tegelijkertijd één blok van de ene schijf en het volgende blok van een andere schijf te lezen (schrijven). In theorie zou de leessnelheid lager moeten zijn dan bij RAID 1, maar in de praktijk zijn lezen en schrijven in RAID 0 aanzienlijk sneller dan in RAID 1. De prestatieverbetering bij sequentieel lezen ligt in een thuisomgeving meestal rond de 50% (d.w.z. bij gebruik van twee schijven met 100 MB/s sequentieel lezen, heeft de schijfarray (doorgaans) een leessnelheid van ongeveer 150 MB/s). Een verbetering van 50% betekent natuurlijk niet dat de prestaties gehalveerd worden, aangezien RAID 0 de toegangstijden niet verkort.

In principe geldt: 1 TB + 1 TB = 2 TB plus verbeterde lees-/schrijfsnelheid. Als één schijf uitvalt, valt alles uit.

RAID 1

De eenvoudigste maar zeer effectieve gegevensbescherming. Er wordt mirroring uitgevoerd. De inhoud wordt tegelijkertijd op twee schijven opgeslagen. Als één schijf uitvalt, is er onmiddellijk een kopie beschikbaar. Een vergelijkbare techniek kan een niveau hoger worden toegepast, waarbij twee afzonderlijke controllers worden gebruikt. Deze techniek wordt duplexing genoemd en is ook robuust tegen controllerstoringen. In theorie kan het de leessnelheid aanzienlijk verhogen en de responstijd enigszins verkorten, maar dit is afhankelijk van de specifieke controller (softwarecontrollers maken meestal helemaal geen gebruik van de mogelijkheid om van beide schijven te lezen). Schrijven kan langzamer zijn omdat dezelfde gegevens op twee schijven worden opgeslagen. De techniek verbetert de gegevensbeveiliging tegen verlies als gevolg van hardwarestoringen aanzienlijk. Het nadeel is dat er twee keer zoveel schijfcapaciteit nodig is.

  • RAID 0+1

Is een combinatie van RAID 0 en RAID 1. We slaan gegevens geïnterleaved (striping) op twee schijven (A, B) op en doen vervolgens hetzelfde met de andere twee schijven (C, D). Dit levert ons twee logische schijven AB, CD op, die redundante inhoud hebben. (Als we een bestand hebben dat bij striping in tweeën wordt gesplitst, staat het eerste deel van het bestand op schijf A en C, het tweede deel op schijf B en D.) Het voordeel van deze methode is dat we niet alleen de lees- en schrijfbelasting over meerdere schijven verspreiden, maar dat de gegevens ook redundant worden opgeslagen, zodat ze na een fout gemakkelijk kunnen worden hersteld. Nadelen zijn onder meer dat slechts 50% van de totale schijfcapaciteit wordt gebruikt en dat de gegevensredundantie verloren gaat wanneer een van de vier schijven defect raakt.

  • Een RAID 1+0

Is opnieuw een combinatie van RAID 0 en RAID 1, maar dan omgekeerd. Eerst slaan we dezelfde gegevens op schijf A, B en vervolgens op schijf C, D op. We krijgen twee logische schijven AB, CD, waarop de gegevens gestriped worden opgeslagen. (Als we een bestand hebben dat bij striping in twee helften wordt gesplitst, staat het eerste deel van het bestand op schijf A en B, het tweede deel op schijf C en D, in tegenstelling tot RAID 0+1). De voordelen zijn vergelijkbaar met RAID 0+1, maar RAID 1+0 is beter bestand tegen meerdere schijfstoringen en gegevensherstel verloopt veel sneller na een storing. Het nadeel is opnieuw dat slechts 50% van de capaciteit wordt gebruikt.

RAID 5 en RAID 6

RAID 5 vereist minimaal 3 harde schijven, waarbij de capaciteit van één schijf wordt ingenomen door zelfherstellende codes die afwisselend op de harde schijven worden opgeslagen. Het voordeel is dat parallelle gegevenstoegang kan worden gebruikt, omdat een langere reeks gegevens over meerdere schijven wordt verspreid, waardoor de leessnelheid veel hoger is. Het nadeel is een lagere schrijfsnelheid (waarvoor de zelfcorrigerende code moet worden berekend). Het is bestand tegen het uitvallen van één schijf.

RAID 10

Het verschilt van RAID 0+1 doordat de gegevens eerst worden gespiegeld in de schijfarrays voordat ze worden ingevoegd in een andere RAID 0-schijfarray voor snellere overdrachtssnelheden. Het maximale aantal harde schijven dat zonder gevolgen kan uitvallen, is één in elke array. Dit type wordt vaak gebruikt voor zwaar belaste databasetoepassingen. Dit komt omdat pariteitsgegevens niet hoeven te worden geteld, wat alles sneller (of goedkoper) maakt.

Hardware RAID versus software RAID?

Software RAID

Dit is de RAID die het besturingssysteem zelf creëert, monteert en beheert op een reeks fysieke schijven. Het is het besturingssysteem zelf dat de partities markeert die in de RAID moeten worden gebruikt, vervolgens het virtuele apparaat creëert en het mogelijk maakt om met deze ruimte te werken.

Het nadeel van dit systeem is dat er serverbronnen worden gereserveerd voor alle taken die verband houden met de RAID, maar aan de andere kant heeft het het voordeel dat het een betrouwbaar systeem is, bijna net zo betrouwbaar als een hardware-RAID. Wat het onderwerp betreft, werken de meeste fabrikanten, zoals Synology, QNAP, Thecus, enz., meestal met dit type systeem voor SOHO- en SMB-assortimenten (met name met Linux). Als uw NAS bijvoorbeeld belangrijke bestandsoverdrachten uitvoert, merkt u dat de andere processen vertragen naarmate de CPU-belasting aanzienlijk toeneemt.

Hardware-RAID

Dit is de RAID die wordt aangetroffen in krachtige servers. Het zijn systemen die zijn samengesteld dankzij controllers of kaarten die speciaal zijn bedoeld voor het beheer van de RAID, met hun eigen processors en geheugen, waardoor de CPU wordt ontlast voor het systeem dat als gegevensserver fungeert. Een hardware-RAID is te vinden voor SATA-, SAS- of SCSI-schijven, waarbij de laatste steeds minder wordt gebruikt.

Logischerwijs is dit implementatiesysteem het meest betrouwbaar, het snelst en dus ook aanzienlijk duurder, dus u kunt vrijwel zeker uitsluiten dat de RAID die u op uw computer of NAS hebt geïnstalleerd met dit systeem werkt, aangezien we het hier hebben over duizenden euro's aan kosten.

In de werkmodi RAID 0, 1 en 10 biedt dit type RAID geen grote voordelen ten opzichte van andere systemen, aangezien de kaarten geen belangrijke ontlastende taken voor het systeem uitvoeren.

Share

Over de auteurs


scale 1
Ready to scale?

Start for free and unlock high-performance infrastructure with instant setup.

Get started arrow button

Help ons verbeteren — deel je feedback

Jouw mening helpt ons een betere service te bouwen.