Inzicht in het Western Digital SATA-schijvenassortiment (2014)
Ik kies ervoor om het SATA-schijvenassortiment van Western Digital te categoriseren om verschillende redenen. Eén daarvan is dat WD momenteel marktleider is op het gebied van draaiende harde schijven, waardoor deze categorisering het nuttigst is voor het grootste aantal mensen; de “kleurgecodeerde” lijn is, op basis van anekdotisch bewijs, veruit de gekozen schijvenfamilie van de markt voor het midden- en kleinbedrijf, waar de beoordeling het belangrijkst is en SATA-schijven de grootste onderlinge verschillen in kenmerken en factoren behouden, waardoor het veel noodzakelijker is om ze goed te begrijpen. Hoewel het enige technische verschil tussen een SAS- (SCSI) en een SATA- (ATA) schijf, of zelfs een Fibre Channel- (FC) schijf, niets anders is dan het communicatieprotocol dat wordt gebruikt om ermee te communiceren, worden SAS- en FC-schijven in de praktijk alleen gemaakt in bepaalde, zeer betrouwbare configuraties en vereisen ze niet dezelfde mate van nauwkeurig onderzoek en brengen ze niet dezelfde extreme risico’s met zich mee als SATA-schijven. Inzicht in het SATA-schijvenaanbod is het belangrijkst voor praktische opslagbehoeften in de echte wereld.
WD heeft het bijzonder eenvoudig gemaakt om hun SATA-schijvenassortiment te begrijpen door kleurcodes toe te voegen aan het merendeel van hun SATA-schijvenaanbod – de schijven die als “consumenten”-schijven worden beschouwd – en een “E”-aanduiding op hun enterprise-SATA-schijven, plus één buitenbeentje: de hoogwaardige Velociraptor-schijven die de gangbare SAS-prestaties trachten te evenaren voor SATA-controllers. In totaal hebben ze zeven SATA-schijvenfamilies om te overwegen, die het volledige spectrum aan schijffactoren bestrijken. Hoewel deze beoordeling van toepassing is op het eenvoudig te begrijpen WD-assortiment, kunnen door hier de factoren te vergelijken met het aanbod van andere schijvenfabrikanten ook de toepassingen van hún schijven worden bepaald.
Bij het overwegen van SATA-schijven springen drie werkelijk cruciale factoren eruit als de belangrijkste om te overwegen (uiteraard buiten de prijs om).
URE-percentage: URE, oftewel Unrecoverable Read Error (onherstelbare leesfout), is een gebeurtenis die zich met enige regelmaat voordoet bij elektromechanische schijfopslagmedia, waarbij één enkele sector niet kan worden opgehaald. Bij een losstaande schijf gebeurt dit van tijd tot tijd, maar treft het doorgaans slechts één bestand, en gebruikers ervaren dit meestal als een verloren bestand (vaak een bestand dat hun niet opvalt) of mogelijk een beschadigd bestandssysteem dat al dan niet eenvoudig kan worden hersteld. Bij gezonde RAID-arrays (anders dan RAID 0) biedt het RAID-systeem mirroring en/of pariteit die dit sectorfalen kan opvangen en de data opnieuw kan opbouwen, waardoor we worden beschermd tegen URE-problemen. Wanneer een RAID-array zich in een gedegradeerde toestand bevindt, vormen UREs opnieuw een potentieel risico. In het ergste geval kan een URE op een gedegradeerde pariteitsarray in sommige gevallen leiden tot totaal verlies van een array (alle data gaat verloren). Het overwegen van UREs en hun implicaties bij elke schijfaankoop is dan ook uiterst belangrijk en is de voornaamste oorzaak van het kostenverschil bij schijven van uiteenlopende types. URE varieert van 10^14 aan de onderkant tot 10^16 aan de bovenkant. De getallen zijn zo groot dat ze altijd in wetenschappelijke notatie worden geschreven. Ik zal hier niet uitgebreid ingaan op URE-percentages, gevolgen en mitigatiestrategieën, maar inzicht in URE is van cruciaal belang voor de besluitvorming rond schijfaankopen, met name in het domein van SATA-schijven met grote capaciteit en lagere betrouwbaarheid.
Spindelsnelheid: Dit is voor de meeste gebruikers een van de grootste factoren; de spindelsnelheid correleert direct met IOPS en doorvoer. Hoewel metingen van schijfsnelheid op zijn best dynamisch zijn, is de spindelsnelheid de beste algemene manier om twee verder identieke schijven onder identieke belasting te vergelijken. Een schijf van 15.000 toeren per minuut levert bijvoorbeeld vrijwel exact het dubbele aan IOPS en doorvoer van een schijf van 7.200 toeren per minuut. SATA-schijven worden doorgaans geleverd in varianten van 5.400 en 7.200 toeren per minuut, met zeldzame hoogwaardige schijven die beschikbaar zijn op 10.000 toeren per minuut.
Error Recovery Control (ERC): Ook bekend als TLER (Time Limited Error Recovery) in WD-terminologie, is ERC een functie van de firmware van een schijf die configureerbare tijdslimieten voor lees- of schrijffouten mogelijk maakt. Dit kan belangrijk zijn wanneer een harde schijf in een RAID-array wordt gebruikt, aangezien foutherstel vaak op het niveau van de array, in plaats van op het niveau van de schijf, moet worden afgehandeld. Zonder ERC is de kans groter dat een schijf ten onrechte als defect wordt aangemerkt terwijl dat niet het geval is. Dit is het gevaarlijkst in op hardware gebaseerde pariteits-RAID-arrays en heeft uiteenlopende niveaus van effectiviteit, afhankelijk van de parameters van de individuele RAID-controller. Het is een belangrijke functie voor schijven die bedoeld zijn voor gebruik in RAID-arrays.
Naast deze sleutelfactoren vermeldt WD nog vele andere voor hun schijven, zoals cachegrootte, aantal processors, gemiddelde tijd tussen storingen, enzovoort. Deze zijn doorgaans veel minder belangrijk, met name MTBF en andere betrouwbaarheidscijfers, aangezien deze eenvoudig vertekend of verkeerd geïnterpreteerd kunnen worden en zelden het inzicht in de betrouwbaarheid van een schijf bieden dat we verwachten of hopen. Cachegrootte is niet erg significant voor RAID-arrays, aangezien deze om redenen van data-integriteit moeten worden uitgeschakeld. Buiten desktopgebruiksscenario’s wordt de grootte van de cache van een harde schijf dan ook over het algemeen als irrelevant beschouwd. Het aantal CPU’s zou eveneens misleidend kunnen zijn, aangezien enkele CPU’s krachtiger kunnen zijn dan dubbele CPU’s indien de CPU’s niet identiek zijn en de doeltreffendheid van de tweede CPU onbekend is. Maar WD vermeldt dit als een prominent kenmerk van sommige schijven, en er wordt aangenomen dat er een meetbare prestatiewinst is, hoogstwaarschijnlijk in de vorm van latentievermindering, door de toevoeging van de tweede CPU. Ik blijf dit echter behandelen als een triviale factor en vooral alleen nuttig als een wetenswaardigheid in plaats van als beslissingsfactor.
De schijven.
Alle kleurgecodeerde schijven (Blue, Green, Red en Black) delen één gemeenschappelijke factor – ze hebben de “consumenten”-URE-classificatie van 10^14. “Consument” is hier een slechte omschrijving, maar is min of meer de industriestandaard. Een betere omschrijving is “desktopklasse” of geschikt voor niet-pariteits-RAID-toepassingen. De enige werkelijk slechte toepassing van schijven met URE 10^14 is in pariteits-RAID-arrays, en zelfs daar kunnen ze hun plaats hebben mits ze goed worden begrepen.
Blue: WD Blue-schijven zijn het feitelijke basismodel voor het SATA-assortiment. Ze draaien op de “standaard” 7.200 toeren per minuut, missen ERC/TLER en hebben één processor. De schijfcache varieert tussen 16 MB, 32 MB en 64 MB, afhankelijk van het specifieke model. Blue-schijven zijn gericht op traditioneel desktopgebruik – als losse schijven met gematigde snelheidskenmerken, niet goed geschikt voor server- of RAID-gebruik. Blue-schijven zijn wat men “verwacht” aan te treffen in kant-en-klare desktops. Blue-schijven hebben op grote schaal aan populariteit ingeboet en zijn vaak niet beschikbaar in grotere formaten. Black- en Green-schijven hebben het gebruik van Blue-schijven grotendeels vervangen, in elk geval in scenario’s met grotere capaciteit.
Black: WD Black-schijven zijn een kleine verbetering ten opzichte van de Blue-schijven, waarbij niets verandert behalve een upgrade van één naar twee processors om de prestaties licht te verbeteren, terwijl ze daardoor niet helemaal even kosteneffectief zijn. Net als de Blue-schijven missen ze ERC/TLER en draaien ze op 7.200 toeren per minuut. Alle Black-schijven hebben de cache van 64 MB. Net als bij de Blue-schijven zijn Black-schijven het meest geschikt voor traditionele desktoptoepassingen waar schijven losstaand zijn.
Green: WD Green-schijven zijn, zoals hun naam nominaal impliceert, ontworpen voor toepassingen met een laag stroomverbruik. Ze lijken het meest op Blue-schijven, maar draaien op een tragere 5.400 toeren per minuut, wat minder stroom vereist en minder warmte genereert. Green-schijven zijn, net als Blue en Black, ontworpen voor losstaand gebruik, voornamelijk in desktops die minder schijfprestaties nodig hebben dan bij een gemiddelde desktop wordt verwacht. Green-schijven zijn zeer populair gebleken vanwege hun lage aanschaf- en bedrijfskosten. Tevens wordt aangenomen dat Green-schijven betrouwbaarder zijn dan hun sneller draaiende tegenhangers vanwege de geringere slijtage van de tragere spindels, hoewel ik niet op de hoogte ben van enig onderzoek dat dit aantoont.
Red: WD Red-schijven zijn uniek in het “kleurgecodeerde” WD-schijvenassortiment doordat ze ERC/TLER bieden en zijn ontworpen voor gebruik in kleine RAID-arrays en opslagapparaten voor “thuisgebruik” (zoals NAS en SAN). Onder de motorkap zijn de WD Red-schijven WD Green-schijven; alle specificaties zijn gelijk, inclusief de spindelsnelheid van 5.400 toeren per minuut, maar met TLER ingeschakeld in de firmware. Fysiek zijn het dezelfde schijven. WD beveelt Red-schijven officieel alleen aan voor consumententoepassingen, maar Red-schijven zijn, vanwege hun lagere stroomverbruik en TLER, uiterst populair gebleken in grote RAID-arrays, vooral wanneer ze worden gebruikt voor archivering. Red-schijven, met URE 10^14, zijn gevaarlijk om te gebruiken in pariteits-RAID-arrays, maar zijn uitstekend voor gespiegelde RAID-arrays en blinken werkelijk uit bij archiverings- en soortgelijke opslagbehoeften, waar grote capaciteit en lage bedrijfskosten essentieel zijn en opslagprestaties niet erg belangrijk zijn.
Naast de kleurgecodeerde schijven heeft WD drie SATA-schijvenfamilies die allemaal als enterprise worden beschouwd. Wat deze schijven gemeen hebben, is dat hun URE-percentage veel hoger is dan dat van de “consumenten”-kleurgecodeerde schijven, variërend van URE 10^15 tot 10^16, afhankelijk van het model. Het belangrijkste gevolg van dit URE-percentage is dat deze schijven veel beter geschikt zijn voor gebruik in pariteits-RAID-arrays (bijv. RAID 6).
SE: SE-schijven zijn WD’s instapmodel enterprise-SATA-schijven met URE 10^15-percentages en spindelsnelheden van 7.200 toeren per minuut. Ze hebben dubbele processors en een cache van 64 MB. Het belangrijkst is dat SE-schijven ERC/TLER ingeschakeld hebben. SE-schijven zijn ideaal voor enterprise-RAID-arrays, zowel gespiegeld als met pariteit.
RE: RE-schijven zijn WD’s hoogwaardige standaard enterprise-SATA-schijven, waarbij alle specificaties identiek zijn aan die van de SE-schijven, maar met het nog betere URE 10^16-percentage. RE-schijven zijn de sterspelers in WD’s RAID-schijvenstrategie en zijn perfect voor arrays met een extreem grote capaciteit, zelfs wanneer ze in pariteitsarrays worden gebruikt. RE-schijven zijn beschikbaar in zowel SATA- als SAS-configuraties, maar met dezelfde schijfmechaniek.
Velociraptor: WD’s Velociraptor is een ietwat vreemd lid van de SATA-categorie. Met URE 10^16 en een spindelsnelheid van 10.000 toeren per minuut is de Velociraptor zowel zeer betrouwbaar als zeer snel voor een SATA-schijf en concurreert hij met gangbare, reguliere SAS-schijven. Verrassend genoeg heeft de Velociraptor slechts één processor en, nog verrassender, mist hij ERC/TLER, wat het gebruik ervan in RAID-arrays twijfelachtig maakt. Omdat ERC ontbreekt, kan gebruik in RAID per implementatie worden overwogen, afhankelijk van hoe het RAID-systeem omgaat met de timing van de schijf. Met de uitstekende URE-classificatie zou de Velociraptor een uitstekende keuze zijn voor grote, hoogwaardige pariteits-RAID-arrays, maar alleen als de array de fouttiming op een soepele manier afhandelt; anders is het risico dat de array de schijf als defect aanmerkt onaanvaardbaar hoog voor een array die zo kostbaar zou zijn als deze. Het dient te worden opgemerkt dat Velociraptor-schijven niet verkrijgbaar zijn in capaciteiten die vergelijkbaar zijn met het overige SATA-schijvenaanbod – ze zijn veel kleiner.
Uiteraard is de laatste vergelijking die men moet maken die van de prijs. Bij het overwegen van schijfaankopen, vooral wanneer het gaat om grote RAID-arrays of andere behoeften aan bulkopslag, is de kostprijs per schijf vaak een belangrijke, zo niet de doorslaggevende, factor. Het gebruik van tragere, minder betrouwbare schijven in een betrouwbaarder RAID-niveau (zoals Red-schijven in RAID 10) versus snellere, betrouwbaardere schijven in een minder betrouwbaar RAID-niveau (zoals RE-schijven in RAID 6) biedt vaak een betere balans tussen betrouwbaarheid, prestaties, capaciteit en kosten. Schijfprijzen in de echte wereld spelen een significante rol bij deze beslissingen. Deze prijzen kunnen, in tegenstelling tot de schijfspecificaties, van dag tot dag fluctueren en planningsbeslissingen in verschillende richtingen doen omslaan, maar blijven over het geheel genomen ten opzichte van elkaar relatief stabiel.
Ten tijde van dit artikel, eind 2013, levert een snelle prijsinventarisatie van 3TB-schijven van WD deze indicatieve uitsplitsing op:
Green $120
Red $135
Black $155
SE $204
RE $265
Zoals te zien is, ligt de prijssprong voornamelijk tussen de consumenten- of desktopklasseschijven en de enterprise-schijven met hun betere URE-percentages, waarbij Red- en RE-schijven, beide met ERC/TLER, in een prijsverhouding van vrijwel exact 2:1 staan. Hierdoor is het, bij gelijke capaciteit, voordeliger om bijvoorbeeld veel meer Red-schijven in RAID 10 te kiezen dan minder RE-schijven in RAID 6. Het vergelijken van een aantal factoren, samen met actuele prijzen uit de echte wereld, is dan ook cruciaal voor het nemen van veel aankoopbeslissingen.
Bij nieuwere schijven, die net worden uitgebracht, begint men reducties in de ingebouwde schijfcache te zien om precies de redenen die we hierboven hebben genoemd: schijven die rond RAID-gebruik zijn ontworpen, hebben weinig of geen nut bij het hebben van ingebouwde cache, aangezien deze om redenen van data-integriteit moet worden uitgeschakeld.
Schijvenfabrikanten bieden tegenwoordig een breed scala aan traditionele, op spindels gebaseerde schijfopties om aan veel verschillende behoeften te voldoen. Inzicht hierin kan leiden tot betere betrouwbaarheid en kosteneffectievere aankopen en zal de bruikbaarheid van traditionele schijftechnologieën tot in de komende jaren verlengen.
