Werkstuk: RAID
Inleiding
RAID is een acronym voor Redundant Array of Independent Disks. RAID staat voor het gebruik van meerdere vaste schijven ter verhoging van snelheid en/of betrouwbaarheid. Sinds de introductie van de IDA-controller in 1989 heeft Compaq veel ervaring met Raidtechnologie opgebouwd. In de Compaq SMART SCSI Array controller is RAID volledig in de hardware geïmplementeerd. Fouttolerantie d.m.v. RAID is een essentieel onderdeel van de serveromgeving.
University of Californa
RAID is gedefinieerd door de University of California. Oorspronkelijk waren er zes RAID niveaus (RAID 0 t/m RAID 5). Later zijn daar nieuwe definities bijgekomen bijvoorbeeld RAID 10 en RAID 6. Deze aanvullingen zijn combinaties van de oorspronkelijke definities. Zo is RAID level 10 een combinatie van RAID level 0 en RAID level 1.
Korte omschrijving van de verschillende RAID-vormen:
RAID level 0: Striping.
De verschillende schijven in de kast krijgen ieder een deel van een bestand welke in elkaar gezet wordt wanneer het bestand binnengehaald wordt.
RAID level 1: Mirroring.
Alles wat op een schijf staat staat simpel gekopieerd op de andere schijven. Meest in samenwerking met level 0, dit garandeert beveiligingen en prestaties.
RAID level 2: Foutcorrectiecode (FCC) verspreidt over verschillende schijven.
Garandeert zelfs meer beveiliging van het opslaan van de FCC op verschillende schijven. Maar: prestatieproblemen met het herberekenen van de FCC.
RAID level 3: FCC op één schijf. (Pariteitschijf)
Er worden minder schijven gebruikt, maar je hebt meer toegang. De prestatie gaat achteruit wanneer de schijf vaak wordt aangeroepen.
RAID level 4: FCC op één schijf, grotere strips.
Hogere prestatie bij korte aanroepingen.
RAID level 5: FCC op alle schijven met data.
Pariteitblokken zijn verspreidt over alle schijven samen met de data. Er zijn nu geen pariteitversmallingen meer.
SAMENVATTING
RAID levels 3,4, & 5 hebben 20% meer schijfruimte nodig. RAID level 2 30% meer en RAID level 1 50% meer.
Voor- en nadelen van de verschillende RAID-vormen:
R.A.I.D. level 0
Voordelen : Snellere toegang door paralleliseren.
Nadelen : In het geval dat je problemen hebt met een of meer schijven: er is geen data toegankelijk.
R.A.I.D. level 1
Voordelen : Het garandeert veiligheid en prestatie.
Nadelen : De dataopslag is verdubbeld.
R.A.I.D. level 2
Voordelen : Het garandeert meer beveiliging van het opslaan van de FCC (Foutcorrectiecode).
Nadelen : Prestatieproblemen met herbereken FCC elke keer.
R.A.I.D. level 3
Voordelen : Er worden minder schijven gebruikt. Je hebt ook meer toegang.
Nadelen : Prestatie gaat achteruit wanneer de schijf vaak wordt aangeroepen.
R.A.I.D. level 4
Voordelen : FCC past op één schijf.
Nadelen : Je hebt grotere strips nodig.
R.A.I.D. level 5
Voordelen : Er zijn nu geen pariteitversmallingen meer.
Nadelen : Hiervoor zijn minstens drie schijven nodig. Een 'schijf' is niet te gebruiken voor gegevensopslag.
De kosten van RAID afgezet tegen de baten:
Inmiddels hebben de fouttolerante opslagsystemen hun weg gevonden in een deel van de markt. Voornamelijk financieel draagkrachtige en grotere ondernemingen hebben RAID omarmd en ook in gebruik.
Dat RAID afdoende bescherming tegen dataverlies biedt is inmiddels wel bewezen. Velen verkeren echter nog in de veronderstelling dat RAID erg duur is, omdat de diverse RAID levels genoegzaam bekend zijn geven we hier geen verhandeling over wat die levels nou voor specifieke voor- en nadelen hebben, maar lichten liever toe of een investering in een RAID-systeem voor u zinvol is.
Aan de hand van een `guldens-per-Megabyte' invalshoek wordt duidelijk dat RAID-systemen in eerste instantie weliswaar duurder zijn dan conventionele on-line opslag, maar dat dergelijke systemen de kans krijgen zichzelf terug te verdienen door lagere onderhoudskosten.
De gemiddelde harde schijf van vandaag heeft een aanschafwaarde van fl. 1, - per MB. Een duur RAID-systeem kost bij aanschaf zo'n fl. 8, - per MB, maar ook fl. 5, - per MB behoort tot de mogelijkheden. Toegegeven, een factor 8:1 is niet misselijk, maar er zijn nog meer kostenfactoren dan alleen de aanschafprijs. Een RAID systeem zorgt ervoor dat bij een enkelvoudige calamiteit (bijvoorbeeld een harde schijf defect) het systeem toch 100% beschikbaar blijft zonder veel verlies aan prestaties.
Reparatie van het RAID-systeem vereist over het algemeen geen downtime, doordat de defecte eenheden kunnen worden vervangen zonder dat het systeem uitgeschakeld dient te worden (hot-swap disks). Vergelijk dat eens met de toepassing van een `gewone' disk:
* Als er geen gebruik gemaakt wordt van RAID-technieken dan betekent het uitvallen van een schijfeenheid onherroepelijk het uitvallen van het systeem. Vanaf het moment dat een disk defect raakt is de server `down' en dus niet meer beschikbaar totdat de reparatie is uitgevoerd. Bedenk daarbij dat normaliter een nieuwe disk niet naast de server ligt te wachten, maar moet worden betrokken bij de handel. Het is dan nog te hopen dat de leverancier de vereiste schijfeenheid op voorraad heeft.
* Vervolgens moet na fysieke installatie van de schijf de backup-software geactiveerd worden om de meest recente backup terug te zetten. Er van uitgaande dat de meest recente backup `van gisteren is' en ook per direct beschikbaar is, is de server al gauw een hele dag buiten bedrijf.
* Veel bedrijven hebben geen parate kennis in huis is om `even een diskje te vervangen'. Laat staan dat de systeembeheerder voldoende kennis heeft om `even het besturingssysteem' opnieuw te installeren. Een backup kan over het algemeen pas terug worden gezet als het besturingssysteem weer operationeel is.
* De informatie die sinds de backup op het systeem is gewijzigd is verloren gegaan. De kosten die ermee gemoeid gaan om dat weer op te bouwen (of als verlies te accepteren) zijn per bedrijf verschillend, maar in het algemeen is de verliespost groter dan fl. 5.000, -. Als we dus niet alleen naar de aanschaf kijken maar ook naar de mogelijke kosten die bij calamiteiten optreden wordt al snel duidelijk dat een RAID-systeem veel eerder binnen bereik ligt dan algemeen aangenomen
RAID is een acronym voor Redundant Array of Independent Disks. RAID staat voor het gebruik van meerdere vaste schijven ter verhoging van snelheid en/of betrouwbaarheid. Sinds de introductie van de IDA-controller in 1989 heeft Compaq veel ervaring met Raidtechnologie opgebouwd. In de Compaq SMART SCSI Array controller is RAID volledig in de hardware geïmplementeerd. Fouttolerantie d.m.v. RAID is een essentieel onderdeel van de serveromgeving.
University of Californa
RAID is gedefinieerd door de University of California. Oorspronkelijk waren er zes RAID niveaus (RAID 0 t/m RAID 5). Later zijn daar nieuwe definities bijgekomen bijvoorbeeld RAID 10 en RAID 6. Deze aanvullingen zijn combinaties van de oorspronkelijke definities. Zo is RAID level 10 een combinatie van RAID level 0 en RAID level 1.
Korte omschrijving van de verschillende RAID-vormen:
RAID level 0: Striping.
De verschillende schijven in de kast krijgen ieder een deel van een bestand welke in elkaar gezet wordt wanneer het bestand binnengehaald wordt.
RAID level 1: Mirroring.
Alles wat op een schijf staat staat simpel gekopieerd op de andere schijven. Meest in samenwerking met level 0, dit garandeert beveiligingen en prestaties.
RAID level 2: Foutcorrectiecode (FCC) verspreidt over verschillende schijven.
Garandeert zelfs meer beveiliging van het opslaan van de FCC op verschillende schijven. Maar: prestatieproblemen met het herberekenen van de FCC.
RAID level 3: FCC op één schijf. (Pariteitschijf)
Er worden minder schijven gebruikt, maar je hebt meer toegang. De prestatie gaat achteruit wanneer de schijf vaak wordt aangeroepen.
RAID level 4: FCC op één schijf, grotere strips.
Hogere prestatie bij korte aanroepingen.
RAID level 5: FCC op alle schijven met data.
Pariteitblokken zijn verspreidt over alle schijven samen met de data. Er zijn nu geen pariteitversmallingen meer.
SAMENVATTING
RAID levels 3,4, & 5 hebben 20% meer schijfruimte nodig. RAID level 2 30% meer en RAID level 1 50% meer.
Voor- en nadelen van de verschillende RAID-vormen:
R.A.I.D. level 0
Voordelen : Snellere toegang door paralleliseren.
Nadelen : In het geval dat je problemen hebt met een of meer schijven: er is geen data toegankelijk.
R.A.I.D. level 1
Voordelen : Het garandeert veiligheid en prestatie.
Nadelen : De dataopslag is verdubbeld.
R.A.I.D. level 2
Voordelen : Het garandeert meer beveiliging van het opslaan van de FCC (Foutcorrectiecode).
Nadelen : Prestatieproblemen met herbereken FCC elke keer.
R.A.I.D. level 3
Voordelen : Er worden minder schijven gebruikt. Je hebt ook meer toegang.
Nadelen : Prestatie gaat achteruit wanneer de schijf vaak wordt aangeroepen.
R.A.I.D. level 4
Voordelen : FCC past op één schijf.
Nadelen : Je hebt grotere strips nodig.
R.A.I.D. level 5
Voordelen : Er zijn nu geen pariteitversmallingen meer.
Nadelen : Hiervoor zijn minstens drie schijven nodig. Een 'schijf' is niet te gebruiken voor gegevensopslag.
De kosten van RAID afgezet tegen de baten:
Inmiddels hebben de fouttolerante opslagsystemen hun weg gevonden in een deel van de markt. Voornamelijk financieel draagkrachtige en grotere ondernemingen hebben RAID omarmd en ook in gebruik.
Dat RAID afdoende bescherming tegen dataverlies biedt is inmiddels wel bewezen. Velen verkeren echter nog in de veronderstelling dat RAID erg duur is, omdat de diverse RAID levels genoegzaam bekend zijn geven we hier geen verhandeling over wat die levels nou voor specifieke voor- en nadelen hebben, maar lichten liever toe of een investering in een RAID-systeem voor u zinvol is.
Aan de hand van een `guldens-per-Megabyte' invalshoek wordt duidelijk dat RAID-systemen in eerste instantie weliswaar duurder zijn dan conventionele on-line opslag, maar dat dergelijke systemen de kans krijgen zichzelf terug te verdienen door lagere onderhoudskosten.
De gemiddelde harde schijf van vandaag heeft een aanschafwaarde van fl. 1, - per MB. Een duur RAID-systeem kost bij aanschaf zo'n fl. 8, - per MB, maar ook fl. 5, - per MB behoort tot de mogelijkheden. Toegegeven, een factor 8:1 is niet misselijk, maar er zijn nog meer kostenfactoren dan alleen de aanschafprijs. Een RAID systeem zorgt ervoor dat bij een enkelvoudige calamiteit (bijvoorbeeld een harde schijf defect) het systeem toch 100% beschikbaar blijft zonder veel verlies aan prestaties.
Reparatie van het RAID-systeem vereist over het algemeen geen downtime, doordat de defecte eenheden kunnen worden vervangen zonder dat het systeem uitgeschakeld dient te worden (hot-swap disks). Vergelijk dat eens met de toepassing van een `gewone' disk:
* Als er geen gebruik gemaakt wordt van RAID-technieken dan betekent het uitvallen van een schijfeenheid onherroepelijk het uitvallen van het systeem. Vanaf het moment dat een disk defect raakt is de server `down' en dus niet meer beschikbaar totdat de reparatie is uitgevoerd. Bedenk daarbij dat normaliter een nieuwe disk niet naast de server ligt te wachten, maar moet worden betrokken bij de handel. Het is dan nog te hopen dat de leverancier de vereiste schijfeenheid op voorraad heeft.
* Vervolgens moet na fysieke installatie van de schijf de backup-software geactiveerd worden om de meest recente backup terug te zetten. Er van uitgaande dat de meest recente backup `van gisteren is' en ook per direct beschikbaar is, is de server al gauw een hele dag buiten bedrijf.
* Veel bedrijven hebben geen parate kennis in huis is om `even een diskje te vervangen'. Laat staan dat de systeembeheerder voldoende kennis heeft om `even het besturingssysteem' opnieuw te installeren. Een backup kan over het algemeen pas terug worden gezet als het besturingssysteem weer operationeel is.
* De informatie die sinds de backup op het systeem is gewijzigd is verloren gegaan. De kosten die ermee gemoeid gaan om dat weer op te bouwen (of als verlies te accepteren) zijn per bedrijf verschillend, maar in het algemeen is de verliespost groter dan fl. 5.000, -. Als we dus niet alleen naar de aanschaf kijken maar ook naar de mogelijke kosten die bij calamiteiten optreden wordt al snel duidelijk dat een RAID-systeem veel eerder binnen bereik ligt dan algemeen aangenomen