Eén Grote RAID 10 – Een Nieuwe Standaard in Serveropslag

Eind jaren negentig was de standaard vuistregel voor het bouwen van een nieuwe server om het besturingssysteem op een eigen, kleine RAID 1-array te plaatsen en applicaties en data af te scheiden naar een aparte RAID 5-array. Dit werd om verschillende redenen gedaan, waarvan vele ons inmiddels zijn ontglipt, verloren in het zand der tijd. De belangrijkste drijvende factoren waren dat opslagcapaciteit buitengewoon duur was, schijven klein waren, bestandssystemen regelmatig corrupt raakten en fysieke harde schijven met een zeer hoog percentage faalden vergeleken met andere soorten storingen. Mensen werden gedreven door de noodzaak om zich te beschermen tegen fysieke schijfstoringen, zich te beschermen tegen corruptie van het bestandssysteem en voldoende capaciteit te verwerven om aan hun behoeften te voldoen.

Tegenwoordig is het opslaglandschap veranderd. Bestandssystemen zijn ongelooflijk robuust en corruptie door het bestandssysteem zelf is vrijwel ongehoord en kan, dankzij technologieën zoals journaling, vrijwel altijd snel en effectief worden gecorrigeerd, waardoor de eindgebruikers tegen gegevensverlies worden beschermd. Vrijwel niemand maakt zich tegenwoordig zorgen over corruptie van het bestandssysteem.

Moderne bestandssystemen kunnen ook veel meer capaciteit aan dan voorheen. Eind jaren negentig en begin jaren 2000 was het niet ongebruikelijk om gemakkelijk een schijfarray te kunnen maken die groter was dan welk afzonderlijk bestandssysteem ook aankon. Tegenwoordig is dat redelijkerwijs niet meer het geval, aangezien alle gangbare bestandssystemen ten minste vele terabytes aankunnen en vaak petabytes, exabytes of meer aan data.

Harde schijven zijn veel betrouwbaarder dan ze eind jaren negentig waren. De faalpercentages voor het volledig uitvallen van een schijf zijn zeer laag, zelfs bij goedkopere schijven. Zo laag zelfs dat het bij arraystoringen (gegevensverlies in de gehele RAID-array) primair gaat om falende arrays, en niet om het uitvallen van harde schijven. We vervangen harde schijven niet langer met wilde overgave. Het is niet ongehoord dat grote arrays hun gehele levensduur doorlopen zonder ook maar één schijf te verliezen.

Capaciteiten zijn dramatisch geschaald. In plaats van harde schijven van 4,3 GB installeren we schijven van 3 TB. Bijna duizend keer meer capaciteit op één enkele spindel vergeleken met minder dan vijftien jaar geleden.

Deze factoren komen samen en creëren een behoefte aan een dramatisch andere benadering van het ontwerp van serveropslag en een verandering van de “vuistregel” over waar te beginnen bij het ontwerpen van opslag.

De oude benadering kan worden geschreven als RAID 1 + RAID 5. De RAID 1-ruimte werd gebruikt voor het besturingssysteem, terwijl de RAID 5-ruimte, die vermoedelijk veel groter was, werd gebruikt voor data en applicaties. Dit ontwerp splitste de twee opslagvraagstukken op door maximale inspanning te steken in het beschermen van het besturingssysteem (dat zeer moeilijk te herstellen was in geval van een ramp en waarvan de data afhankelijk was voor toegankelijkheid) op zeer betrouwbare RAID 1. Het goedkopere RAID 5 werd, hoewel enigszins risicovoller, doorgaans gekozen voor data omdat de kosten van het opslaan van data op RAID 1 in de meeste gevallen te hoog waren. Het was een afweging die destijds zinvol was.

Tegenwoordig is, met onze zeer andere zorgen, een nieuwe benadering nodig, en deze nieuwe benadering staat bekend als “Eén Grote RAID 10” – wat een enkele, grote RAID 10-array betekent waarop besturingssysteem, applicaties en data allemaal samen worden opgeslagen. Uiteraard is dit slechts wat we zeggen om het handig te houden; in een systeem zonder de behoeften aan prestaties of capaciteit die de grenzen van een enkele schijf overschrijden, zouden we “Eén Grote RAID 1” zeggen, maar veel mensen rekenen RAID 1 tot de RAID 10-groep, dus het is gewoon gemakkelijker om het eerste te zeggen.

Om het nog handiger te maken, korten we dit af tot OBR10.

Omdat de kosten van opslag aanzienlijk zijn gedaald en deze, in plaats van schaars te zijn, tegenwoordig doorgaans in overvloed aanwezig is, omdat bestandssystemen ongelooflijk betrouwbaar zijn, omdat RAID 1 en RAID 10 dezelfde prestatiekenmerken delen en omdat arraystoringen die niet door schijfstoringen worden veroorzaakt zijn verschoven van achtergrondruis naar primaire oorzaken van gegevensverlies, is de overstap naar RAID 10 en het elimineren van het splitsen van arrays de nieuwe standaardbenadering geworden.

Met RAID 10 beschikken we nu over de zeer beschikbare en veerkrachtige opslag die voorheen alleen voor het besturingssysteem was gereserveerd, voor al onze data. We profiteren van de prestaties van gespiegelde RAID plus het voordeel van extra spindels voor al onze data. We krijgen een betere benutting van de schijfcapaciteit en prestaties die op die verbeterde benutting zijn gebaseerd.

Zelfs het traditionele splitsen van logbestanden dat normaal gesproken bij databases wordt gedaan (de beruchte RAID 1 + RAID 5 + RAID 1-benadering) is niet langer nodig, omdat RAID 10 de optimale prestatiekenmerken over alle data behoudt. Met RAID 10 elimineren we vrijwel alle factoren die ons ooit deden besluiten arrays te splitsen.

De enige significante factor die nog niet is genoemd en waarvoor gesplitste arrays traditioneel als voordelig werden gezien, is toegangsconflict (contention) – de behoefte van verschillende processen om gelijktijdig toegang te krijgen tot verschillende delen van de schijf, waardoor de schijfkop in een minder dan ideaal patroon heen en weer beweegt en de schijfprestaties afnemen. Contention was eind jaren negentig, toen de oude vuistregel werd ontwikkeld, een groot probleem.

Tegenwoordig bestaat schijfcontention nog steeds, maar wordt deze sterk verzacht door het gebruik van grote RAID-caches. Eind jaren negentig waren schijfcaches op zijn best een paar megabyte groot en vaak afwezig. Tegenwoordig is 256 MB een minuscule cache en worden gemiddelde servers uitgerust met 1-2 GB cache op alleen al de RAID-kaart. Sommige systemen beginnen aanvullende caches op basis van solid-state drives te integreren om een secundaire cache toe te voegen die verder gaat dan de geheugencache op de controller. Deze kunnen gemakkelijk honderden gigabytes aan extreem snelle cache toevoegen die vrijwel elke spindeloperatie kan bufferen, zodat deze zich geen zorgen hoeft te maken over contention. Het probleem van contention is dus in de loop der jaren op andere manieren opgelost, maar heeft ons, net als andere technologische veranderingen, effectief bevrijd van de traditionele zorgen die ons noodzaakten arrays te splitsen.

Net als bij arraycontention was een andere, veel minder gangbare reden om eind jaren negentig arrays te splitsen het verbeteren van de prestaties van de communicatiebus vanwege de beperkingen van de SCSI- en ATA-technologieën uit dat tijdperk. Ook deze zijn geëlimineerd met de overstap naar seriële communicatiemechanismen, SAS en SATA, in moderne arrays. We zijn niet langer beperkt tot de capaciteit van één enkele bus per array en kunnen veel groter groeien met veel meer flexibiliteit dan voorheen. Buscontention is vrijwel volledig geëlimineerd.

Als er behoefte is om ruimte af te scheiden voor bescherming, zoals voor de groei van logbestanden, kan dit worden bereikt door partitionering in plaats van door het fysiek splitsen van de array. Over het algemeen wilt u partitionering tot een minimum beperken, aangezien het de overhead verhoogt en het vermogen van de schijven om zichzelf af te stemmen verlaagt, maar er zijn gevallen waarin het de betere benadering is. Maar het vereist niet dat de onderliggende fysieke opslag wordt gesplitst zoals traditioneel het geval was. Nog beter dan partitionering, indien beschikbaar, is logisch volumebeheer, dat partitie-achtige scheidingen aanbrengt zonder de beperkingen van partities.

Dus aan het eind van de dag is de nieuwe vuistregel voor serveropslag “Eén Grote RAID 10.” Geen RAID 5 meer, geen splitsen van arrays meer. Het draait om betrouwbaarheid, prestaties, gebruiksgemak en redelijke kosteneffectiviteit. Zoals alle vuistregels geldt deze niet voor elk afzonderlijk geval, maar hij geldt veel breder dan de oude standaard ooit deed. RAID 1 + RAID 5 was als standaard altijd een poging om het “te rooien” met iets ongewensts en om het beste te maken van een slechte situatie. OBR10 is niet zo. De nieuwe standaard is een gewenste standaard – het is hoe we daadwerkelijk willen werken, niet iets waaraan we “vastzitten”.

Begin bij het ontwerpen van opslag voor een nieuwe server met OBR10 en stap er alleen van af wanneer dit specifiek niet aan uw technologische behoeften voldoet. U zou nooit hoeven te rechtvaardigen dat u OBR10 gebruikt, alleen rechtvaardigen waarom u het niet gebruikt.

Getagdpatterns raid

Meer om te lezen.

Wanneer een back-up geen back-up is

Het kantelpunt van software-RAID

Nieuwe hyperconvergentie, oude opslag