Raid-Systeme - uni-kassel.de · 2015-10-02 · Raid-Level 0 Beim Raid-Level 0 handelt es sich - wie...

28
Raid-Systeme von Cyrus Massoumi und Nabil Sahli

Transcript of Raid-Systeme - uni-kassel.de · 2015-10-02 · Raid-Level 0 Beim Raid-Level 0 handelt es sich - wie...

Page 1: Raid-Systeme - uni-kassel.de · 2015-10-02 · Raid-Level 0 Beim Raid-Level 0 handelt es sich - wie die Null im Namen schon andeutet - nicht um ein redundantes Speicherverfahren.

Raid-Systeme

von

Cyrus Massoumi

und

Nabil Sahli

Page 2: Raid-Systeme - uni-kassel.de · 2015-10-02 · Raid-Level 0 Beim Raid-Level 0 handelt es sich - wie die Null im Namen schon andeutet - nicht um ein redundantes Speicherverfahren.

Inhaltsverzeichnis

Einleitung .............................................................................3

Geschichte ............................................................................4

Software-Raid vs. Hardware-Raid .........................................5

Anforderungen an die Festplatte ...........................................7

Raid-Controller ......................................................................8

Raid-Level 0 ..........................................................................9

Raid-Level 1 ........................................................................11

Raid-Level 0 vs. Raid-Level 1 ..............................................13

Raid 0 + 1 ...........................................................................14

Raid-Level 2 ........................................................................16

Raid-Level 3 ........................................................................18

Raid-Level 4 ........................................................................20

Raid-Level 5 ........................................................................21

Raid-Level 6 ........................................................................23

Raid-Level 7 ........................................................................24

Vergleich der einzelnen Raid-Level .....................................25

Zusammenfassung ..............................................................27

Quellenangaben ..................................................................28

Page 3: Raid-Systeme - uni-kassel.de · 2015-10-02 · Raid-Level 0 Beim Raid-Level 0 handelt es sich - wie die Null im Namen schon andeutet - nicht um ein redundantes Speicherverfahren.

Einleitung

Einleitend wird erläutert, was der Begriff Raid bedeutet und wie dasRaid-System funktioniert. Danach wird ein kurzer Überblick über dieGeschichte gelieferr, um darauf aufbauend sowohl die Funktionsweise als auchdie Unterschiede der einzelnen Raid-Systeme darzustellen.

Der Begriff Raid steht für Redundant Array of Independent Disks. Früher warauch oft der Begriff Redundant Array of Inexpensive Disks gebräuchlich.

Beim Einsatz von Raid werden mehrere unabhängige Festplattenzusammengeschaltet, um ein großes logisches Laufwerk (Array) zu bilden. Nebenden eigentlichen Nutzdaten werden in diesem Array auchRedundanzinformationen gespeichert. Die Redundanzinformationen können dieDaten selbst, oder aus mehreren Datenblöcken berechnete Paritätsdaten sein.Durch die Zusammenschaltung zu einem logischen Laufwerk greift dasBetriebsystem nicht mehr auf die einzelnen Festplatten, sondern auf das Array zu.Die Verwaltung des Arrays erfordert den gleichen Aufwand wie bei einer einzigenFestplatte.

Das eigentliche Ziel von Raid-Systemen ist es, die Verfügbarkeit von Daten zuerhöhen. Raid-Systeme schützen vor einem möglichen Datenverlust bei Ausfalleiner oder mehrerer Festplatten. Weiterhin bieten einige Raid-Varianten1 durchdie Parallelisierung der Festplattenzugriffe gegenüber Einzellaufwerken einenGeschwindigkeitsvorteil.

Gegen Datenverluste durch Diebstahl, Feuer und ähnliche Natureinflüsse oderunvorsichtige Benutzer bieten Raid-Systeme allerdings keinen Schutz, weshalb sieeine gute Backup Lösung nicht ersetzten können.

3 / 28

1 Eine detaillierte Erklärung der verschiedenen Raid-Varianten erfolgt auf den nächsten Seiten.

Page 4: Raid-Systeme - uni-kassel.de · 2015-10-02 · Raid-Level 0 Beim Raid-Level 0 handelt es sich - wie die Null im Namen schon andeutet - nicht um ein redundantes Speicherverfahren.

Geschichte

Als die Raid-Technologie vor weniger als 20 Jahren aus der Taufe gehoben wurde,war die Speicherung großer Datenmengen noch eine reichlich kniffligeAngelegenheit.

Die damals in Rechenzentren gebräuchlichen SLEDs (Single Large ExpensiveDisks) boten mit zwei bis drei Gigabyte zwar hohe Speicherkapazitäten, warenjedoch extrem teuer.

Im Jahre 1987 veröffentlichten D. A. Patterson, G. Gibson und R. H. Katz von derUniversität Berkely in Kalifornien ein Forschungspapier, um die damals langsamenFestplattenzugriffe zu beschleunigen und die MTBF2 (Mean Time BetweenFailures) zu erhöhen. Sie schlugen vor, die Daten auf vielen kleinen, billigenFestplatten anstatt auf wenigen großen und teuren zu speichern. Aus diesemGrund war die frühere Bezeichnung für Raid - als Gegenstück zu den damaligenSLED Systemen - auch Redundant Array of Inexpensive Disks.

In ihrer Studie definierten die drei Wissenschaftler fünf verschiedene Methoden,um die Festplatten miteinander zu verbinden. Diese so genannten Raid-Levelhaben bis heute Zuwachs erhalten und lassen sich auch in diversenKombinationen einsetzen. Leider sorgt der Begriff 'Level' immer wieder fürMissverständnisse. Es handelt sich hierbei nicht um stufenweise aufbauendeVerfahren, sondern um von einander völlig unabhängige Techniken.

Seit 1992 wird die Standardisierung von Raid durch das RAB (Raid AdvisoryBoard) geleitet. Das RAB besteht aus etwa 50 Firmen.

4 / 28

2 MTBF ist die mittlere Zeit zwischen zwei Fehlern. MTBF dient als Maß für die Zuverlässigkeitvon Geräten oder Anlagen. Je höher der MTBF-Wert, desto zuverlässiger sollte das Gerät sein.

Page 5: Raid-Systeme - uni-kassel.de · 2015-10-02 · Raid-Level 0 Beim Raid-Level 0 handelt es sich - wie die Null im Namen schon andeutet - nicht um ein redundantes Speicherverfahren.

Software-Raid vs. Hardware-Raid

Die Begriffe Hardware-Raid bzw. Software-Raid erscheinen etwas irreführend,da sowohl Hardware-, als auch Software-Raid zum Betrieb Software benötigen.Die Bezeichnungen stehen nur für unterschiedliche Implementierungen.

Software-Raid

Wenn Software-Raid zum Einsatz kommt übernimmt eine Software - die auf demRechner, in dem das Raid-Array arbeitet - installiert ist die Steuerung deslogischen Verbundes. In vielen Fällen wird die Software von dem Betriebssystemmitgeliefert. Software-Raid ist meist die kostengünstigste und einfachste Lösung.

Ein Nachteil ist, dass es eine relativ hohe CPU-Belastung verursacht undPlattform-, sowie Betriebssystemspezifisch ist. Wenn Software-Raid aufhandelsüblichen Computern eingesetzt wird hat man außerdem nur eine geringeAnzahl an Festplattenanschlüssen, was die mögliche Parallelisierung derFestplattenzugriffe und damit auch die Leistungsfähigkeit stark einschränkt.

Hardware-Raid

Beim Einsatz von Hardware-Raid übernimmt ein eigener Controller die Steuerungdes Raid-Arrays. Dies entlastet die CPU des Rechners und hat somit eine höhereLeistung zur Folge.

Ein Nachteil von Hardware-Raid ist, im Vergleich zu Software-Raid, der hohePreis. Hardware-Raid arbeitet plattformunabhängig, braucht aber zur Verwaltungebenfalls Software, die auch für ein bestimmtes Betriebssystem angepasst seinmuss.

Die Tabelle auf der folgenden Seite fasst die wesentlichen Unterschiede zwischenHardware- und Software-Raid nochmals zusammen.

5 / 28

Page 6: Raid-Systeme - uni-kassel.de · 2015-10-02 · Raid-Level 0 Beim Raid-Level 0 handelt es sich - wie die Null im Namen schon andeutet - nicht um ein redundantes Speicherverfahren.

Software-Raid vs. Hardware-Raid

Die wesentlichen Unterschiede nochmals im Überblick:

Bildquelle: http://www.tecchannel.de

6 / 28

Page 7: Raid-Systeme - uni-kassel.de · 2015-10-02 · Raid-Level 0 Beim Raid-Level 0 handelt es sich - wie die Null im Namen schon andeutet - nicht um ein redundantes Speicherverfahren.

Anforderungen an die Festplatte

Die einzelnen Festplatten werden an einen sogenannten Raid-Controllerangeschlossen. Diesen Controller gibt es entweder als zusätzliche Steckkarte fürdas Mainboard, oder – mitlerweile immer häufiger – bereits direkt auf demMainboard verbaut. Auf der folgenden Seite ist beispielhaft ein Raid-Controllerdargestellt.

Die Situation bei der Wahl des Anschlusses der Festplatte oder des Raid-Controllers hat sich in den letzten Jahren für die Benutzer stark verbessert. Nochvor wenigen Jahren galten strikte Regeln für die Wahl der Festplatten.

SCSI (Small Computer System Interface) war als Schnittstelle Pflicht und alleverwendeten Festplatten mussten identische Kapazitäten haben. Weiterhin kames sehr oft vor, dass in einem Raid-Array nur Festplatten der gleichen Bauserieverwendet werden durften.

Heutzutage hat der Benutzer bei der Wahl der Schnittstelle der Festplatte mehrFreiheiten. Zwar kommt im Serverumfeld aufgrund der hohen Leistung nach wievor SCSI zum Einsatz, aber im Heimbenutzerbereich, oder für kleinere Server undWorkstations werden mitlerweile häufig die Standardschnittstellen für FestplattenUltra-ATA (Advanced Technology Attachments), oder der immer günstigerwerdende Ultra-ATA Nachfolger Serial-ATA eingesetzt. Auf aktuellen Mainboardsist normalerweise ein Serial-ATA Controller mit mehreren Anschlüssen verbaut.

Auch ist ein Mix von Festplatten verschiedener Hersteller, Bauarten undKapazitäten gestattet. Dies hat allerdings den Nachteil, dass sich dadurch nichtimmer die gesamte Nettokapazität für das Raid-Array benutzen lässt.

Da Raid-Systeme gleich große Festplatten voraussetzen wird in einerMischkonfiguration jedes Laufwerk nur bis zur Kapazität der kleinstenvorhandenen Festplatte genutzt. Wenn man also beispielsweise eine 50 GigabyteFestplatte mit drei 250 Gigabyte Festplatten kombiniert, stehen nur viermal 50Gigabyte für das Raid-Array zur Verfügung.

7 / 28

Page 8: Raid-Systeme - uni-kassel.de · 2015-10-02 · Raid-Level 0 Beim Raid-Level 0 handelt es sich - wie die Null im Namen schon andeutet - nicht um ein redundantes Speicherverfahren.

Raid-Controller

Im Bild sieht man beispielhaft einen Raid-Controller. Die Anschlüsse für die Festplatten sind die beiden Steckplätze links,

sowieso die zwei schwarzen Steckplätze in der Mitte:

Bildquelle: http://www.happyware.de

8 / 28

Page 9: Raid-Systeme - uni-kassel.de · 2015-10-02 · Raid-Level 0 Beim Raid-Level 0 handelt es sich - wie die Null im Namen schon andeutet - nicht um ein redundantes Speicherverfahren.

Raid-Level 0

Beim Raid-Level 0 handelt es sich - wie die Null im Namen schon andeutet -nicht um ein redundantes Speicherverfahren. Es dient lediglich zur Beschleunigenvon Festplattenzugriffen.

Um dies zu realisieren fasst Raid 0 zwei oder mehr Festplatten zu einem logischenLaufwerk zusammen. Die Daten werden in aufeinanderfolgenden Blöcken (auchStripes genannt) gleichmäßig über alle Festplatten im Verbund verteilt. Ein Blockauf einer Festplatte besteht je nach verwendetem Dateisystem aus mehrerenKilobyte. Ein häufig benutzer Wert sind 64 Kilobyte. Raid 0 bezeichnet manumgangssprachlich auch einfach als Striping. Die Aufteilung ist auf der nächstenSeite dargestellt.

Durch das parallele Lesen und Schreiben auf mehreren Laufwerken steigert sichdie Datentransferrate. Den größten Nutzen hat man bei großen,zusammenhängenden Daten. Hier macht sich die Geschwindigkeitssteigerungbesonders bemerkbar, da Striping parallel auf allen Festplatten arbeitet unddadurch die Transferrate vervielfacht wird. Beim Lesen und Schreiben vielerkleiner Dateien ist die Zugriffszeit der Festplatten der limitierende Faktor. Indiesem Scenario erzielt man durch die Verteilung in etwa nur die Leistung einereinzelnen Festplatte.

Der Vorteil der höheren Datentransferrate muss mit der Sicherheit der Datenteuer erkauft werden. Wenn aus dem Verbund eine Festplatte ausfällt sind alleDaten verloren. Raid 0 wird häufig eingesetzt, wenn große Datenmengen abgearbeitet werdenmüssen. Weiterhin hat Raid 0 ein sehr einfaches Design und ist leicht zuimplementieren. Wie oben bereits erwähnt, gehen alle Daten verloren wenn eineFestplatte aus dem Verbund ausfällt. Daher sollte Raid 0 niemals in kritischenUmgebungen benutzt werden.

Bevorzugte Anwendungsbereiche sind Audio/Video Bearbeitung und allgemeinAnwendungen die einen hohen Datendurchsatz verlangen.

9 / 28

Page 10: Raid-Systeme - uni-kassel.de · 2015-10-02 · Raid-Level 0 Beim Raid-Level 0 handelt es sich - wie die Null im Namen schon andeutet - nicht um ein redundantes Speicherverfahren.

Raid-Level 0

Raid-Level 0 beschleunigt zwar den Festplattenzugriff, bietet aber keine redundante Speicherung der Daten.

Jeder Buchstabe steht für einen Block. Man erkennt die Aufteilung deutlich.

Der erste Block wandert auf die erste, der zweite Block auf die zweite Festplatte, usw..:

Bildquelle: http://www.overclockzone.com

10 / 28

Page 11: Raid-Systeme - uni-kassel.de · 2015-10-02 · Raid-Level 0 Beim Raid-Level 0 handelt es sich - wie die Null im Namen schon andeutet - nicht um ein redundantes Speicherverfahren.

Raid-Level 1

Das Raid-Level 1 trägt auch die Bezeichnung Mirroring (Spiegelung). DieserName sagt bereits aus, wie das Verfahren arbeitet. Alle Schreibzugriffe erfolgenparallel auf zwei Festplatten, so dass jede Festplatte ein Spiegelbild (daher dasenglische Wort mirroring) der anderen ist.

Der offensichtliche große Vorteil ist, dass alle Daten doppelt zur Verfügungstehen. Daraus resultiert, dass selbst nach einem kompletten Festplattenausfallalle Daten erhalten bleiben, da sie ja auf der anderen Festplatte zusätzlichgespeichert sind.

Ein großer Nachteil von Raid 1 ist allerdings, dass für die Speicherung von Datennur die Hälfte der tatsächlichen Speicherkapazität zur Verfügung steht. Wenn manbeispielsweise zwei identische Festplatten benutzt, kann man nur eine davon zureigentlichen Datenspeicherung nutzen. Auf der zweiten Festplatte werden keineneuen Daten, sondern nur eine 1:1 Kopie der Daten der ersten Festplattegespeichert.

Leseoperationen werden auf die beiden Laufwerke verteilt, so dass jedesLaufwerk nur noch etwa die Hälfte der Leseanforderungen zu bearbeiten hat.Allerdings müssen Schreiboperationen immer auf beiden Festplatten durchgeführtwerden. Deshalb sind Schreiboperationen höchsten so schnell wie bei einereinzelnen Festplatte.

Raid 1 wird häufig zusammen mit Raid 0 zu Raid 0+1 kombiniert. Auf Raid 0+1wird auf den folgenden Seiten eingegangen. Das ideale Einsatzgebiet von Raid 1sind Anwendungsbereiche in denen hohe Anforderungen an Datenverfügbarkeitgestellt werden, aber außerdem nur ein kleines Budget zur Verfügung steht.

11 / 28

Page 12: Raid-Systeme - uni-kassel.de · 2015-10-02 · Raid-Level 0 Beim Raid-Level 0 handelt es sich - wie die Null im Namen schon andeutet - nicht um ein redundantes Speicherverfahren.

Raid-Level 1

Raid 1 geht auf Nummer Sicher und erzeugt auf einer zweiten Festplatte eine identische Kopie der ersten:

Bildquelle: http://www.overclockzone.com

12 / 28

Page 13: Raid-Systeme - uni-kassel.de · 2015-10-02 · Raid-Level 0 Beim Raid-Level 0 handelt es sich - wie die Null im Namen schon andeutet - nicht um ein redundantes Speicherverfahren.

Raid-Level 0 vs. Raid-Level 1

In den jeweiligen Beschreibungen zu Raid 0 und Raid 1 wurden gewisse Aussagenüber die Lese- und Schreibleistungen gemacht. Im nun folgenden Vergleich derbeiden Varianten soll gezeigt werden, wieweit diese Vermutungen in der Praxiszutreffen. Zusätzlich wurde die Leistung einer einzelnen Festplatte in demVergleich berücksichtigt.

Der Test3 wurde mit zwei Hitachi Festplatten mit einer Einzelkapazität von 76Gigabyte durchgeführt. Die Blockgröße betrug 64 Kilobyte. Als Betriebssystemkam Windows XP zum Einsatz.

Bildquelle: http://www.tecchannel.de

Eine einzelne Festplatte erreichte eine Schreibgeschwindigkeit von ~24Megabyte/Sekunde. Das Stripeset (Raid 0) erzielte den sehr guten Wert von ~38Megabyte/Sekunde. Hier bestätigt sich die oben gemachte Aussage, dass dasparallele Schreiben auf mehreren Laufwerken die Datentransferrate steigert. Raid 1 liefert mit ~20 Megabyte/Sekunde den schlechtesten Wert. Dies bestätigtebenfalls, dass Schreiboperationen auf beiden Festplatten höchstens so schnellwie auf einem Einzellaufwerk sein können.

Beim Lesetest zeigt sich ein ähnliches Bild. Raid 0 liefert ähnlich gute Werte wieim Schreibtest. Es zeigt sich weiterhin, dass die Verteilung der Leseoperationenauf beide Festplatten von Raid 1 keinen Vorteil liefert. Der Wert liegt mit ~25Megabyte/Sekunde wieder knapp hinter dem des Einzellaufwerks. Dies ist jedochnicht repräsentativ zu verstehen. Je nach eingesetztem Raid-Controller kanndieser Wert auch leicht über dem eines Einzellaufwerks liegen.

Der Kopiertest bestätigt die beiden ersten Ergebnisse. Raid 0 ist der klare Sieger,gefolgt von der Einzelfestplatte. Raid 1 liegt wieder leicht dahinter.

13 / 28

3 Der Test wurde von TecChannel durchgeführt. www.tecchannel.de/hardware/1468/6.html

Page 14: Raid-Systeme - uni-kassel.de · 2015-10-02 · Raid-Level 0 Beim Raid-Level 0 handelt es sich - wie die Null im Namen schon andeutet - nicht um ein redundantes Speicherverfahren.

Raid 0 + 1

Das hier beschriebene Verfahren wird je nach Hersteller Raid 0+1, Raid 0/1oder auch Raid 10 genannt.

Raid 0+1 versucht das beste aus zwei Welten zu vereinen. Zum einen dasStriping von Raid 0 und die Spiegelung von Raid 1. Somit lassen sichDatensicherheit und Leistung gut kombinieren. Das Zusammenwirken vonAufteilung und Spiegelung lässt sich anhand des Bildes auf der nächsten Seite gutnachvollziehen.

Raid 0 erzielt durch das Zusammenschalten mehrerer Festplatten sowohl beimLesen als auch beim Schreiben eine Geschwindigkeitssteigerung gegenüber einereinzelnen Festplatte. Die zusätzliche Spiegelung auf weitere Festplatten von Raid1 sorgt für die Datensicherheit.

Die Realisierung eines Raid 0+1 Systems ist in zwei Varianten denkbar.Angenommen es stehen 6 Festplatten zur Verfügung. Nun lassen sich zuerst je 3Laufwerke stripen (Raid 0) und anschließend diese beiden logischen Laufwerkespiegeln (Raid 1). In diesem Fall hätte man nun zwei sogenannte Stripesets zurVerfügung. Die andere Variante wäre, zuerst je zwei Laufwerke zu spiegeln unddann die drei logischen Laufwerke zu einem Stripeset zu verbinden. BeideVarianten liefern dasselbe Ergebnis, denn bei beiden Methoden steht am Ende dieKapazität von drei Festplatten zur Verfügung.

Wenn man die beiden Methoden jedoch von dem Standpunkt der Datensicherheitbetrachtet, wird klar, dass das zweite Verfahren dem ersten vorzuziehen ist. Dieswird klar wenn man auf den Ernstfall blickt. Wenn zuerst eine Aufteilungvorgenommen wurde, ist nach einem Festplattenausfall das betroffene Stripesetkomplett unbrauchbar. Natürlich stehen die Daten weiterhin auf dem zweitenStripeset zur Verfügung, wenn jedoch eines der drei Laufwerke des zweitenVerbundes ausfällt, sind alle Daten verloren. Im umgekehrten Fall verliert eingespiegeltes logisches Laufwerk durch den Ausfall ebenfalls seine Redundanz,aber ein Datenverlust entsteht nur, wenn eine zweite Festplatte dieser Einheitausfällt. Die Wahrscheinlichkeit eines Totalausfalls sinkt somit auf ein Drittelgegenüber der ersten Methode.

Raid 0+1 ist für Anwendungsbereiche geeignet, die eine hohe Leistung verlangen,es aber verschmerzen können, wenn keine absolute Zuverlässigkeit erreicht wird.Durch Aufteilung und Spiegelung werden zur Implementierungen von Raid 0+1mindestens vier Festplatten benötigt.

14 / 28

Page 15: Raid-Systeme - uni-kassel.de · 2015-10-02 · Raid-Level 0 Beim Raid-Level 0 handelt es sich - wie die Null im Namen schon andeutet - nicht um ein redundantes Speicherverfahren.

Raid 0 + 1

Aufteilung und Spiegelung:Raid 0 + 1 vereint das beste aus zwei Welten.

Bildquelle: http://www.acnc.com

15 / 28

Page 16: Raid-Systeme - uni-kassel.de · 2015-10-02 · Raid-Level 0 Beim Raid-Level 0 handelt es sich - wie die Null im Namen schon andeutet - nicht um ein redundantes Speicherverfahren.

Raid-Level 2

Raid 2 bietet zusätzlichen Schutz gegen Fehler innerhalb der Festplatten, wirdaber aufgrund der aufwendigen Implementierung kaum eingesetzt. Es ist das'schwarze Schaf' der Raid Familie, weil es das einzige Raid-Level ist, dass keineStandardtechnik, wie Spiegelung, Striping oder Paritäten 4 benutzt.

Bei der Verwendung von Raid 2 werden die Daten bitweise aufgeteilt. Raid 2bietet neben einer Fehlerkorrektur gegen den kompletten Ausfall einer Festplatteals einziges Raid-Level Schutz vor inkonsistenten Daten durch Schreibfehler oderähnlichem. Alle anderen Raid-Level würden einen solchen Fehler zwar erkennen,aber es wäre unmöglich herauszufinden welche Festplatten aus dem Verbund diefalschen Daten geliefert hat. Eine Korrektur ist somit unmöglich.

Raid 2 verwendet deshalb neben 8 Bit für Daten noch 2 Bit für den ECC-Code5.Wie dies funktioniert lässt sich an dem Bild auf der folgenden Seitenachvollziehen. Dadurch lässt sich ein Fehler erkennen und zusätzlich seinePosition herausfinden. Raid 2 funktioniert damit wie der ECC-Ram, der bei einem1-Bit-Fehler nicht mit einem Paritätsfehler den Computer stoppt, sondern dasfalsche Bit korrigiert.

Durch die bitweise Verteilung auf eigene Festplatten sind nicht weniger als 10Festplatten im Verbund erforderlich.

Ein Vorteil von Raid 2 ist, dass sich durch die Möglichkeit des parallelen Zugriffsdie Lesegeschwindigkeit auf das achtfache erhöht, allerdings hat Raid 2 auch denNachteil, dass durch den ECC-Overhead die Leistung bei Schreiboperationen unterdie eines Einzellaufwerks sinkt.

Aus diesen und anderen Gründen ist Raid 2 das einzige der originalen Raid-Levelsaus Berkeley, dass heute kaum eingesetzt wird.

16 / 28

4 Paritäten werden auf den nächsten Seiten im Zusammenhang mit Raid 3 genauer erklärt.5 Error Correction Code: Verfahren zum Erkennen und Korrigieren von Bitfehlern.

Page 17: Raid-Systeme - uni-kassel.de · 2015-10-02 · Raid-Level 0 Beim Raid-Level 0 handelt es sich - wie die Null im Namen schon andeutet - nicht um ein redundantes Speicherverfahren.

Raid-Level 2

Das schwarze Schaf der Raid-Familie.Aufwendig zu implementieren und daher kaum eingesetzt.

Das Bild zeigt eine vereinfachte Implementierung mit 7 Laufwerken.

Bildquelle: http://www.overclockzone.com

17 / 28

Page 18: Raid-Systeme - uni-kassel.de · 2015-10-02 · Raid-Level 0 Beim Raid-Level 0 handelt es sich - wie die Null im Namen schon andeutet - nicht um ein redundantes Speicherverfahren.

Raid-Level 3

Raid 3 ist das erste Raid-Level das Paritäten verwendet. Im Gegensatz zu Raid 2, was auf Bitebene operiert, teilt Raid 3 die Daten in Bytes auf.

Durch die Verwendung von Paritäten wird eine bessere Leistung bei Lese- undSchreiboperationen erzielt. Dies liegt daran, dass die Nutzdaten über dieeinzelnen Festplatten aufgeteilt werden und nur eine einzige Festplatte zurSpeicherung der Paritäten benutzt wird.

Bei der Verwendung von Raid 3 treten jedoch Probleme auf, wenn nur kleineMengen an Daten übertragen werden. Dieser sogenannte Flaschenhals tritt auf,weil jedesmal, egal wie groß oder wie klein die Daten sind, die Parität neuberechnet werden muss. Wenn kleine Mengen an Daten übertragen werden, sinddie Daten schon lange gespeichert, bevor die Parität überhaupt berechnet wurde.Das ganze System muss also auf die Erstellung der Parität warten, bevor esweitere Arbeiten durchführen kann.

Bei Raid 3 muss eine Leseanforderung auf alle Datenplatten zugreifen um einenDatenblock zu rekonstruieren. Die Paritätsplatte wird beim Lesen nur inFehlerfällen verwendet. Wie oben bereits erwähnt, benötigt eineSchreibanforderung sowohl die Datenplatten als auch die Paritätsplatte um dieParitätsinformationen neu zu berechnen.

Durch das Auslagern der Paritätsinformationen auf eine extra Festplatte ist derAusfall einer Platte zu kompensieren. Wenn eine Festplatte ausfällt lassen sich dieInformationen durch Zuhilfenahme der Paritätsplatte zurückgewinnen. EineBeispielrechnung, in der gezeigt wird, wie sich die Daten nach einem Ausfall einerFestplatte zurückgewinnen lassen wird auf der nächsten Seite gezeigt.

Beim Lesen großer Dateien kann Raid 3 den Geschwindigkeitsvorteil desparallelen Zugriffs ausspielen. Aus diesem Grund wird Raid 3 vor allem bei derVerarbeitung großer zusammenhängender Datenmengen auf Einzelplatzrechnerneingesetzt.

18 / 28

Page 19: Raid-Systeme - uni-kassel.de · 2015-10-02 · Raid-Level 0 Beim Raid-Level 0 handelt es sich - wie die Null im Namen schon andeutet - nicht um ein redundantes Speicherverfahren.

Raid-Level 3

Auf dem folgenden Bild sieht man ein Raid 3 System bei dem vier Festplatteneingesetzt werden. Die Paritätsplatte ist gelb gekennzeichnet.

Die einzelnen Bytes einer Datei werden gleichmäßig über alle vier Datenplattenverteilt. Mit einem exclusiven Oder (XOR) verknüpft liefern die einzelnen Bytesjeder Festplatte die Paritätsinformationen.

Sollte nun die vierte Platte ausfallen, können die Daten mit Hilfe der ersten dreiFestplatten, sowie der Paritätsplatte zurückgewonnen werden. Dazu werden dieBytes der ersten drei Festplatten, sowie der Paritätsplatte wieder mit XORverknüpft. Das Ergebnis liefert genau die ausgefallene vierte Festplatte.

Quelle: Datenbanken Vorlesung Prof. Stumme, www.kde.cs.uni-kassel.de

19 / 28

Page 20: Raid-Systeme - uni-kassel.de · 2015-10-02 · Raid-Level 0 Beim Raid-Level 0 handelt es sich - wie die Null im Namen schon andeutet - nicht um ein redundantes Speicherverfahren.

Raid-Level 4

Wie Raid 3 verwendet Raid 4 für die Paritätsinformationen eine einzige,dedizierte Festplatte, wie im Bild weiter unten zu sehen ist. Im Gegensatz zu Raid 3 verteilt Raid 4 die Daten wieder in Blöcken auf die Festplatten.

Durch das blockweise Verteilen auf die Festplatten kann Raid 4 daher effizienterals Raid 3 mit kleinen Leseanforderung umgehen. Dies geht allerdings zu Lastenvon Schreibanforderung. Hier müssen sowohl der alte Inhalt des Datenblocks, alsauch der Paritätsblock gelesen werden. Anschließend werden der neue Inhalt desDatenblocks und die Parität geschrieben. Insbesondere nachteilig ist, dass jedeSchreiboperation auf die eine Paritätsplatte zugreifen muss.

Der Wechsel von Byte- zu Block-Striping verbessert verglichen mit Raid 3 dieZugriffszeit, aber die zentrale Paritätsplatte bleibt weiterhin der Flaschenhals.

Vorteile bietet Raid 4 in Umgebungen, in denen erheblich mehr Lese- alsSchreibzugriffe anfallen. Wegen der fest definierten Paritätsplatte, die wie beiRaid 3 den Flaschenhals darstellt wird in der Praxis fast immer Raid 5 bevorzugt.

Bildquelle: http://www.overclockzone.com

20 / 28

Page 21: Raid-Systeme - uni-kassel.de · 2015-10-02 · Raid-Level 0 Beim Raid-Level 0 handelt es sich - wie die Null im Namen schon andeutet - nicht um ein redundantes Speicherverfahren.

Raid-Level 5

Raid 5 ist eine der beliebtesten und im Serverbereich sehr häufig eingesetzteRaid-Variante. Im Gegensatz zu Raid 3 und Raid 4 verteilt Raid 5 die Paritätengleichmäßig über alle Laufwerke des Verbundes.

Beim Einsatz von Raid 4 konnten die Lese- und Schreiboperationen nicht alleFestplatten verwenden, da eine Platte für die Paritätsinformationen verwendetwurde. Dieser Flaschenhals durch die dedizierte Paritätsplatte ist durch diegleichmäßige Verteilung effektiv beseitigt, wie im Bild auf der nächsten Seite zusehen ist. Dadurch werden höhere Ausfallsicherheit und Fehlertolleranzgewährleistet. Fällt eine der Festplatten aus, werden die Nutzdaten durch dieParitätsinformationen dynamisch ersetzt.

Nach wie vor ist der Overhead von Schreiboperationen nicht zu vernachlässigen,da das Schreiben eines Datenblocks die Neuberechnung des zugehörigenParitätsblocks voraussetzt. Dazu müssen die alten Zustände des Daten- undParitätsblocks gelesen werden, der neue Paritätsblock aus dem alten und demneuen Zustand des Datenblocks und dem alten Zustand des Paritätsblocksberechnet werden und dann die neuen Zustände des Daten- und Paritätsblocksgeschrieben werden. Durch parallel schreibenden Zugriff auf kleinere Datenblöckewerden in einem Raid 5 System alle Festplatten gleichmäßig belastet. DieGesamtleistung des Systems wird somit wesentlich gesteigert. Es darf aber niemehr als eine Platte gleichzeitig ausfallen.

Bei der insgesamt nutzbaren Speicherkapazität gilt es zu berücksichtigen, dass fürdie Speicherung der Paritätsinformationen im Gesamten die Größe einerEinzelfestplatte benötigt wird. Wenn z.B. ein Raid 5 Array mit drei 150 GigabyteFestplatten benutzt wird, ergibt sich eine Kapazität von 450 GigaByte. Von diesenverbleiben aber nur 300 Gigabyte zur eigentlichen Datenspeicherung.

Raid 5 ist die konstengünstigste Möglichkeit, Daten auf mehr als zwei Festplattenmit Redundanz zu speichern. Es werden mindestens drei Festplatten benötigt.Wie oben bereits erwähnt darf nie mehr als eine Platte gleichzeitig ausfallen. DerAusfall einer zweiten Festplatte hat einen totalen Datenverlust zur Folge.

Die maximale Anzahl an Festplatten ist theoretisch unendlich, aber man solltebedenken, dass die Wahrscheinlichkeit, dass zwei Festplatten gleichzeitigausfallen, ernorm steigt, wenn sehr viele Festplatten benutzt werden.

21 / 28

Page 22: Raid-Systeme - uni-kassel.de · 2015-10-02 · Raid-Level 0 Beim Raid-Level 0 handelt es sich - wie die Null im Namen schon andeutet - nicht um ein redundantes Speicherverfahren.

Raid-Level 5

Allrounder: Raid 5 beschleunigt durch den Verzicht auf ein dediziertes Paritätslaufwerk die Schreibzugriffe.

Bildquelle: http://www.overclockzone.com

22 / 28

Page 23: Raid-Systeme - uni-kassel.de · 2015-10-02 · Raid-Level 0 Beim Raid-Level 0 handelt es sich - wie die Null im Namen schon andeutet - nicht um ein redundantes Speicherverfahren.

Raid-Level 6

Raid 5 ist das letzte Raid-Level, dass von den Entwicklern der Universität Berkeleyvorgeschlagen wurde. Einige Modifikationen durch verschiedeneImplementierungen resultierten in neuen Raid-Levels, die aber zum Teil keinoffizieller Raid Standard sind.

Raid 6 ist eine Erweiterung von Raid 5. Es stellt einen Versuch dar, gegenüberRaid 3 bis 5 die Ausfallsicherheit nochmals zu erhöhen. Bei diesen Verfahren darfnur eine Festplatte des Verbundes ausfallen, da sich sonst die Daten nicht mehrrekonstruieren lassen. Während ein Raid 5 System lediglich einen Satz anParitätsinformationen speichert, sind dies bei Raid 6 zwei. Durch die doppelteParitäten lässt sich ein Ausfall von bis zu zwei Festplatten kompensieren. Manspricht hier auch von einer zweidimensionalen Parität, was das weiter untenfolgende Bild verdeutlicht.

Diese zusätzliche Sicherheit hat den großen Nachteil, dass gegenüber Raid 3 undRaid 5 mit deutlich langsameren Schreibzugriffen zu rechnen ist. Durch seineextrem hohe Fehlertolleranz eignet sich Raid 6 sehr gut für kritischeAnwendungen, die eine maximale Datenverfügbarkeit verlangen.

Bildquelle: http://www.overclockzone.com

23 / 28

Page 24: Raid-Systeme - uni-kassel.de · 2015-10-02 · Raid-Level 0 Beim Raid-Level 0 handelt es sich - wie die Null im Namen schon andeutet - nicht um ein redundantes Speicherverfahren.

Raid-Level 7

Raid 7 ist kein offizieller Raid Standard. Es ist ein Produkt der Firma StorageComputer.

Raid 7 ist ähnlich wie Raid 4 aufgebaut, was sich auf dem Bild erkennen lässt. Dergrößte Unterschied ist, dass auf dem Raid-Controller ein lokalesEchtzeitbetriebssystem installiert ist, welches es den einzelnen Festplattenerlaubt unabhängig voneinander zu operieren und Raid 7 somit nicht das Problemdes von Raid 4 bekannten Flaschenhalses hat.

Neben mehreren großen Pufferspeichern werden in Raid 7 Systemen schnelleDatenbusse eingesetzt, die von der Datenübertragung entkoppeln sind. Dies führtzu einer deutlich schnelleren Datenübertragungsrate.

Wegen der extrem hohen Kosten ist Raid 7 in der Praxis allerdings unüblich undauf Spezialanwendungen beschränkt.

Bildquelle: http://www.overclockzone.com

24 / 28

Page 25: Raid-Systeme - uni-kassel.de · 2015-10-02 · Raid-Level 0 Beim Raid-Level 0 handelt es sich - wie die Null im Namen schon andeutet - nicht um ein redundantes Speicherverfahren.

Vergleich der einzelnen Raid-Level

Auf den vorherigen Seiten wurde jedes Raid-Level ausführlich erklärt. Nun folgteine Zusammenfassung, welche nochmals auf die Vor- und Nachteil jedeseinzelnen Raid-Levels eingeht.

Raid 0 bietet einen preiswerten Einstieg in die Raid-Technologie. DieHauptmerkmale sind gute Leistung und hoher Datendurchsatz. Nachteilig istjedoch, dass beim Defekt einer einzigen Festplatte der Datenbestand komplettverloren ist.

Raid 1 verwaltet 1:1 Kopien der beiden Festplatten. Beim Ausfall einer Platteübernimmt die zweite den Betrieb. Durch die Spiegelung der Festplatte sindjedoch nur 50 Prozent der vorhandenen Plattenkapazität nutzbar. Somitentstehen auch höhere Kosten bei der Anschaffung der Festplatten.

Aufgrund des hohen ECC-Overheads und der daraus resultierenden schwachenLeistung bei Schreiboperationen ist Raid 2 heutzutage kaum noch im Gebrauch.

Raid 3 und 4 sind die ersten Raid-Level, die Paritäten benutzen. Für dieParitätsinformationen verwenden sie eine einzige, dedizierte Platte. EinenGeschwindigkeitsvorteil erzielt man mit Raid 3 nur beim Lesen großer Dateien. EinNachteil von Raid 3 ist die schlechte Leistung bei kleinen Dateien. Raid 4 kanndurch die blockweise Verteilung besser mit kleinen Leseanforderung umgehen.Dies geht allerdings zu Lasten von Schreibanforderung. Wegen dem Flaschenhals(die Paritätsplatte) werden beide Raid-Level selten eingesetzt.

Eines der beliebtesten Raid-Level ist Raid 5. Es bietet optimaleFestplattenauslastung und sehr hohen Datendurchsatz. Raid 5 kann den Ausfalleiner Festplatte verkraften. Als Nachteil ist der hohe Kostenfaktor zu nennen.

Raid 6 versucht die Datensicherheit gegenüber Raid 5 durch Verwendung vonzweidimensionalen Paritäten nochmals zu erhöhen. Es kann den Ausfall von zweiFestplatten im Verbund kompensieren.

Raid 7 ist kein offizieller Raid Standard. Es basiert auf Raid 4, hat aber nichtdessen Nachteil des Flaschenhalses. Auf dem Raid-Controller ist ein lokalesEchtzeitbetriebssystem installiert.

Die Tabelle auf der folgenden Seite fasst nochmals die wichtigsten Eigenschaftender einzelnen Raid-Level zusammen. Jedes Raid Level hat spezifische Vor- undNachteile.

25 / 28

Page 26: Raid-Systeme - uni-kassel.de · 2015-10-02 · Raid-Level 0 Beim Raid-Level 0 handelt es sich - wie die Null im Namen schon andeutet - nicht um ein redundantes Speicherverfahren.

Vergleich der einzelnen Raid-Level

Die wichtigsten Eigenschaften jedes Raid-Levels fasst folgende Tablelle zusammen:

Bildquelle: http://www.tecchannel.de

(*) Als Faktor gegenüber einem Einzellaufwerk.(**) Worst-case-Angabe. Im günstigsten Fall können n/2 Laufwerke ohne Datenverlust ausfallen.

26 / 28

Page 27: Raid-Systeme - uni-kassel.de · 2015-10-02 · Raid-Level 0 Beim Raid-Level 0 handelt es sich - wie die Null im Namen schon andeutet - nicht um ein redundantes Speicherverfahren.

Zusammenfassung

Raid-Systeme, vor nicht einmal 20 Jahren an der Universität von Berkeley inKalifornien entwickelt, stellen seit langem den Standard für effiziente und sichereDatenspeicherung in Serversystemen dar. Durch den raschen Zuwachs anMainboards mit eingebauten Raid-Controllern wurden sie in den letzten Jahrenauch für Heimanwender immer interessanter.

Durch den Einsatz von Raid-Systemen lässt sich die Verfügbarkeit vonComputersystemen erheblich steigern. Nichtsdesto trotz kann ein Raid-Systemkein Allheilmittel gegen Datenverluste sein.

Für eine nahezu 100 prozentige Ausfallsicherheit müssten alle Komponenten einesComputersystems wie Prozessor, Netzteil, Lüfter usw. redundant ausgelegt sein.Solche Lösungen werden von der Industrie zwar angeboten, sind allerdings nichtpreiswert.

Zudem ereignen sich Ausfälle von Laufwerken und anderen Komponenten nichtimmer unabhängig voneinander. In der Praxis treten gelegentlich Situationen ein,durch die sich die Ausfallwahrscheinlichkeit des gesamten Raid-Arrays schlagartigerhöht.

Zu diesen Risiken gehören auch Naturkatastrophen wie durch Blitzeinschlägeverursachte Überspannungen, Überschwemmungen oder Brände. Weiterhin gehtheutzutage eine große Gefahr von Viren aus, die Computersysteme befallenkönnen.

Den größten – oftmals unterschätzten – Risikofaktor stellt weiterhin der Menschdar. Ein großer Anteil an Datenverlusten lässt sich auf Fehlverhalten vonBenutzern oder Administratoren zurückführen.

Gelöschte Daten sind auch auf Raid-Systemen verloren. Selbst für dasausgefeilteste Raid-System gilt deshalb: Den einzig wirklich zuverlässigen Schutzgegen Datenverluste bietet ein konsequent geplantes und vorgenommenesBackup!

27 / 28

Page 28: Raid-Systeme - uni-kassel.de · 2015-10-02 · Raid-Level 0 Beim Raid-Level 0 handelt es sich - wie die Null im Namen schon andeutet - nicht um ein redundantes Speicherverfahren.

Quellenangaben

--- Datenbanksysteme: Eine Einführung, Alfons Kemper & André Eickler http://www-db.in.tum.de/research/publications/books/DBMSeinf

--- Das Raid Kompendium http://www.pc-experience.de/wbb2/thread.php?threadid=7438

--- Redundant Array of Independent Disks http://en.wikipedia.org/wiki/Redundant_array_of_independent_disk

--- What is Raid? http://www.overclockzone.com/spin9/raid/en.html

--- Extremely detailed RAID guide http://www.pcguide.com/ref/hdd/perf/raid/index-c.html

--- Raid im Überblick http://www.tecchannel.de/hardware/708/index.html

--- Datenbanken Vorlesung Sommersemester 2004, Prof. Gerd Stumme http://www.kde.cs.uni-kassel.de/lehre/ss2004/datenbanken

--- RAID-Level im Überblick http://www.speicherguide.de/magazin/special0903.asp?theID=121

--- RAID Tutorial http://www.acnc.com/04_00.html

--- Enjoy the power of arrays of... drive letters! http://www.os2warp.be/index2.php?name=RAID

28 / 28