Opslagsystemen moeten flexibel, schaalbaar en betrouwbaar zijn. Het is dus niet meer dan logisch dat RAID-systemen en NAS-opslag heel populair zijn. In ons RAID recovery lab komen wekelijks diverse soorten RAID systemen binnen. Laten we beginnen met een inventarisatie.
Wat betekent het woord RAID eigenlijk?
Het staat voor “Redundant Array of Independent Disks”, letterlijk vertaald een “overbodige grote reeks van onafhankelijke harde schijven”. Het woord “overbodig” houdt in dat alle data minstens dubbel opgeslagen zijn over verschillende schijven, zodat het geheel van de opslag toch goed blijft functioneren als een harde schijf onverhoopt uitvalt.
Meestal resulteert dit ook in een verhoging van de snelheid van de lees-/schrijftoegang. Het belangrijkste doel bij het gebruik van een RAID is het verbeteren van de beschikbaarheid van gegevens. In de meeste gevallen is dit ter bescherming tegen het uitvallen van de harde schijf. Dit wordt bereikt door de gegevens “redundant” op te slaan op verschillende harde schijven die worden gecombineerd tot één logische schijf. Een RAID-niveau of redundantie niveau geeft aan hoeveel harde schijven kunnen uitvallen totdat de gehele RAID defect is. (Bron: Wikipedia)
Dus in plaats van één enkele harde schijf, werken in een RAID meerdere schijven van hetzelfde type in een netwerk. Afhankelijk van het ontwerp van het systeem kan dit de veiligheid van de gegevens verhogen, aangezien identieke bestanden op verschillende harde schijven kunnen worden gedistribueerd. Naast het aspect van een betere bescherming tegen gegevensverlies brengt dit ook snelheidsvoordelen met zich mee bij de toegang tot gegevens, waardoor RAID ook interessant is voor snelle netwerken. In de RAID context wordt ook vaak de term NAS gebruikt, d.w.z. een netwerkgebonden opslag (netwerkopslag) die toegankelijk is voor alle computers in het aangesloten netwerk. Network Attached Storage (NAS) verwijst naar bestandsservers die gemakkelijk te beheren zijn. In het algemeen wordt NAS gebruikt om zonder veel moeite onafhankelijke opslagcapaciteit in een computernetwerk te bieden.
OPMERKING: niet elke NAS is automatisch een RAID-systeem, want een NAS kan bijvoorbeeld ook uit één enkele harde schijf bestaan.
PRAKTIJK
RAID-systemen worden heel vaak gebruikt in bedrijven. De redenen hiervoor zijn :
- Sterk groeiende datavolumes hebben flexibele uitbreidingsmogelijkheden nodig
- Ze zorgen voor bestandssynchronisatie en interface tussen verschillende medewerkers, afdelingen of filialen.
- Ze combineren apparaten met cloud-diensten van andere aanbieders, wat belangrijk is voor hybride cloudoplossingen.
- Meerdere gebruikers en toegang op afstand toestaan
- Verhoogde betrouwbaarheid (redundantie)
- Verhoging van de gegevensoverdrachtsnelheid (prestatie)
- Structuur van grote logische aandrijvingen
- Vergroting van het geheugen (ook tijdens de werking)
- Ze combineren apparaten met de clouddiensten van andere aanbieders; dit is met name relevant voor hybride cloudoplossingen.
- De systemen zijn betaalbaar
Feiten
De grootste markt voor NAS-systemen is momenteel Europa, dat wordt gekenmerkt door een sterke middenklasse, gevolgd door Noord-Amerika en Azië. We hebben het over een aandeel van 25 procent van alle opslagmedia…
Marktaandeel/omzetgroei: Het huidige overzicht van de “Worldwide Consumer Network Storage Market” van In-Stat voorspelde al een omzetgroei van meer dan 30 procent in 2015. Tegen 2017 zal naar verwachting wereldwijd meer dan zeven miljard dollar worden verkocht met NAS-oplossingen.
De verkoop van NAS-systemen is de afgelopen drie jaar weer enorm gegroeid.
Wat zit er achter deze groei? In de eerste plaats zijn het de talrijke voordelen die bedrijven ertoe aanzetten om RAID-systemen te gebruiken.
Deze omvatten:
- Verhoging van de gegevensoverdrachtsnelheid (prestatie)
- Verhoogde betrouwbaarheid (redundantie)
- Structuur van grote logische aandrijvingen
- Vergroten van het geheugen
- Kostenbesparing door gebruik te maken van verschillende kleine, goedkope media
Ter vergelijking: de verschillende RAID-varianten:
Er zijn verschillende invalshoeken. Elk van hen maakt gebruik van de typische methoden van spiegeling en/of striping. De gegevens worden met behulp van een controller aan de harde schijven toegewezen. Deze controller past een specifiek algoritme toe dat bepaalt welke gegevens naar welke harde schijf worden geschreven en waar.
RAID-configuratie overzicht
De bekendste Raid configuraties zijn Raid 0 en Raid 1.
RAID 0
Raid 0 maakt gebruik van de techniek van striping. Dit betekent dat de gegevens na elkaar worden gestript en na elkaar op verschillende harde schijven worden opgeslagen. Een controller heeft dit algoritme opgeslagen en zorgt ervoor dat de gegevens in de juiste volgorde op de respectievelijke harde schijven worden opgeslagen.
Er is dus geen sprake van redundantie van de gegevens. Dit is in tegenspraak met de eigenlijke definitie van een RAID. Er is dus ook geen fouttolerantie. Met andere woorden, als een harde schijf defect is, dan zijn de gegevens niet meer volledig toegankelijk en gaan ze verloren. Alleen een professioneel data recovery bedrijf zoals Stellar® kan de gegevens herstellen.
Aanbeveling: Raid 0 is niet geschikt voor gegevenskritische situaties. Gebruikt op servers die nodig zijn voor besturingssystemen, databases, transactielogboeken, zou u snel in onaangename situaties terecht kunnen komen. RAID 0 kan worden gebruikt op snelle werkstations die snelle schijven nodig hebben, maar waar geen onbeveiligde gegevens aanwezig zijn.
RAID 1
Raid 1 maakt gebruik van spiegeling. Er worden minstens twee harde schijven gebruikt. Als er meer dan twee harde schijven worden gebruikt, moet het nummer altijd een even nummer zijn. De bestanden van de eerste stapel worden gedupliceerd en gelijktijdig met de eerste schijf op de tweede schijf opgeslagen.
Dit heeft als voordeel dat als een harde schijf defect is, de gegevens nog steeds beschikbaar zijn op de tweede harde schijf en toegankelijk zijn. Nadeel: de schrijf- en leestoegang wordt alleen uitgevoerd met een normale snelheid, d.w.z. zoals bij gebruik van een enkele harde schijf.
Aanbeveling: Gebruik Raid 1 voor harde schijven waarop het besturingssysteem zich bevindt, omdat het opnieuw installeren van dit systeem veel tijd in beslag neemt. Raid 1 is ook een goede keuze omdat het besturingssysteem meestal op een harde schijf kan worden opgeslagen.
Tip voor gebruik Raid 1 voor het transactielogboek. Meestal kan het SQL Server-transactielogboek op een harde schijf worden opgeslagen. Het transactielogboek voert ook de meeste sequentiële schrijfsels uit. Alleen rollback operaties zorgen ervoor dat het transactielogboek wordt gelezen. Daarom worden hoge prestaties bereikt wanneer het transactielogboek op een aparte raid 1 schijf staat.
RAID 5
Een Raid 5 vereist minstens 3 schijven.
De gegevens zijn op twee schijven gestreept. De derde harde schijf bevat de pariteitsgegevens, die worden bepaald aan de hand van de XOR-procedure van de bestaande gegevens. De toewijzing van originele en pariteitsdata aan de respectievelijke harde schijven gebeurt afwisselend.
Voordeel:
Als een gegevensdrager verloren gaat, kunnen de gegevens altijd worden hersteld met behulp van de XOR-methode.
Een ander voordeel van raid 5 is dat de beschikbare opslagruimte in dit raidniveau overeenkomt met n-1, waarbij n het aantal harde schijven in de array is. Op deze manier kan de opbergruimte van 9 stuks vanaf 10 harde schijven ter beschikking worden gesteld.
bron: http://searchstorage.techtarget.com/
Nadeel:
Er is een prestatieboete verbonden aan een Raid5. Er is een extra belasting nodig om de pariteitsdata te beheren. Bij het schrijven van gegevens naar een Raid5 moeten zowel de strepen van de doelschijf als de pariteitsstrepen worden gelezen, de pariteit wordt berekend en vervolgens beide strepen worden uitgeschreven.
Aanbeveling: Raid5 wordt niet aanbevolen voor alle gegevensdragers waarop meer dan 10 procent van de schrijfoperaties worden uitgevoerd, omdat een Raid 5 schrijfoperatie pas voltooid is als twee leesoperaties en twee schrijfoperaties zijn uitgevoerd. De reactietijd van de schrijfoperaties kan worden verbeterd door gebruik te maken van schrijfcaches. De schrijfcache is echter geen oplossing voor het overbelasten van de harde schijven. De bewerkingen en bewerkingen moeten binnen de capaciteit van de harde schijven liggen.
Conclusie: Raid 5 is economisch zinvol, maar gaat ten koste van de prestaties.
RAID 10
Raid 10 is een combinatie van RAID1 en RAID0. De gegevens worden gecontroleerd en gestreept. Dit combineert de voordelen van Raid 0 en Raid 1. Voor deze procedure zijn 4 harde schijven nodig.
bron: http://searchstorage.techtarget.com/
Er zijn twee verschillende opties, afhankelijk van de bestelling is het spiegelen of strepen. Beide hebben dezelfde opslagcapaciteit, maar de beveiliging van de gegevens is beter op 1+0 (d.w.z. in de praktijk – eerst spiegelen en dan strepen).
Het voordeel van Raid 10 is dat als twee harde schijven uitvallen, de gegevens kunnen worden hersteld. Het is ook schaalbaar en kan worden aangepast aan de hoeveelheid gegevens.
Bij de keuze van het juiste systeem zijn de categorieën van hoogste bescherming, beste prestaties en kostenoverwegingen relevant. Er zijn tal van andere RAID niveaus, die niet allemaal gestandaardiseerd zijn. Zie ook gerelateerde Infolinks
RAID-veiligheidsfactor
Verhoogt het toenemende gebruik van RAID- en NAS-systemen (Network Attached Storage) ook de veiligheid? Het feit dat onder andere een private cloud altijd invloed heeft op de bijbehorende hardware is iets wat veel gebruikers pas merken als er gegevens verloren gaan of geblokkeerd worden. Een RAID-systeem wordt door velen ten onrechte beschouwd als een absoluut veilig systeem, waarbij elke wijziging van de originele gegevens automatisch wordt overgebracht naar de reservekopie.
Voorzichtig! zegt Stellar® Data Recovery
Een RAID-systeem verhoogt alleen de beschikbaarheid van de gegevens, maar niet de veiligheid van de gegevens. Zie RAID-dataherstel.
Als u de procedure van een RAID nader bekijkt, zult u merken dat hier niet alleen gegevens worden gekopieerd. In plaats daarvan voert een RAID elke wijziging van de gegevens op elke deelnemende harde schijf uit. Dit geldt voor het verplaatsen, kopiëren of hernoemen van bestanden en het verwijderen van gegevens. Dus als gegevens per ongeluk worden verwijderd op een RAID-schijf, worden de gegevens ook automatisch verwijderd op alle andere RAID-schijven. Conclusie: Ondanks RAID zouden de gegevens in dit geval verloren gaan.
Een RAID-systeem kan worden beschouwd als een opslagsysteem met een back-up, waarbij elke wijziging van de originele gegevens automatisch wordt overgebracht naar de reservekopie. Als de originele gegevens beschadigd zijn, is de back-up ook automatisch beschadigd. Dit is natuurlijk niet het doel van een back-up. Aangezien de gegevens verspreid zijn over verschillende harde schijven en verschillende opslagalgoritmes hebben, is het meestal moeilijk om de gegevens te herstellen met behoud van de interne structuur van elk bestand en elke map.
Informatie over software RAID-systemen volgt in een apart artikel.
In de Stellar Expert Database vindt u interessante praktijkvoorbeelden in case R&D 1 en RAID R&D 2 (Research and Development).
Over Stellar
Stellar® Data Recovery is het enige ISO-gecertificeerde bedrijf ter wereld dat professionele datahersteldiensten aanbiedt in eigen cleanroomlaboratoria en gebruik maakt van eigen herstelsoftware. Voor speciale kennisgebieden wordt gewerkt in aparte laboratoriumunits. Er is ook een expertunit voor RAID-systemen. Dit team kan alle typische RAID-fouten behandelen, d.w.z. logische, firmware- en elektronische fouten, inclusief mechanische fouten; het kennisteam heeft verschillende krachtige tools en technieken voor RAID-dataherstel ontwikkeld.
- Praktische RAID-gevallen:stellar
- Meer informatie en een verklarende woordenlijst over de RAID-technologie: RAID - Redundant Array of Independent Disk
- Raid-niveau: http://www.speicherguide.de/wissen/glossar/r/
- https://www.speicherguide.de/storage-hardware/disk-subsysteme/raid-level-im-ueberblick-13981.aspx