Opgericht in 2008 · Digitale editie · 15 juni 2026

SMB IT Journal

De informatietechnologiebron voor het kleinbedrijf

Nederlands
Opslag

Gevreesde arrayverwarring

Gevreesde arrayverwarring, of DAC (Dreaded Array Confusion), is een term voor een groep typen RAID-arrayfalen die in de praktijk onmogelijk te diagnosticeren zijn, maar die gekenmerkt worden door het gemeenschappelijke kenmerk dat er geen schijffalen optreedt in combinatie met volledig arrayfalen, wat resulteert in totaal gegevensverlies. Er wordt verondersteld dat drie hoofdoorzaken verantwoordelijk zijn voor het merendeel van DAC:

Software- of firmwarefouten: Hoewel dramatische fouten in RAID-gedrag tegenwoordig zeldzaam zijn, zijn ze altijd mogelijk, vooral bij ingewikkeldere arraytypen zoals pariteits-RAID, waar reconstructieve berekeningen op de array moeten worden uitgevoerd. Een fout in RAID-software of -firmware (afhankelijk van of we het over software- of hardware-RAID hebben) kan zich op talloze manieren manifesteren, waaronder de onbedoelde vernietiging van de array. Firmwareproblemen kunnen zich ook in de schijven zelf voordoen.

Hardwarefalen: Falen van hardware zoals processoren, geheugen of controllers kan dramatische gevolgen hebben voor een RAID-array. Met name geheugenfouten kunnen gemakkelijk leiden tot volledig arrayverlies. Dit wordt beschouwd als de minst voorkomende oorzaak van DAC.

Schijftrillingen: In dit scenario trillen individuele schijven los en raken losgekoppeld van de backplane, om vervolgens weer op hun plaats te trillen, waardoor een resilvering-gebeurtenis wordt geactiveerd. Mocht dit gebeuren met meerdere schijven tijdens een resilver-cyclus, of mocht er een URE optreden tijdens een resilver, dan zouden we volledig arrayverlies zien op pariteitsarrays, mogelijk zelfs zonder dat er enig hardwarefalen optreedt.

Vanwege de aard van DAC, en omdat het geen probleem is met RAID zelf maar met de ondersteunende componenten ervan, bevinden we ons in een zeer lastige positie om het risico te identificeren of te kwantificeren. Niemand weet hoe waarschijnlijk het is dat DAC optreedt, en hoewel we weten dat DAC een grotere bedreiging vormt op pariteits-RAID-systemen, weten we niet met hoeveel. Anekdotisch bewijs suggereert dat het risico bij gespiegelde RAID onmeetbaar laag is en bij pariteits-RAID mogelijk boven de achtergrondruis uitstijgt in een risicoanalyse. Van de faalwijzen vormen zowel softwarefouten als schijftrillingen een veel hoger risico voor systemen die op pariteits-RAID draaien, omdat het URE-risico alleen pariteitsarrays treft en de software die nodig is voor pariteit veel complexer is dan de software die nodig is voor spiegeling. Pariteits-RAID is simpelweg kwetsbaarder en draagt meer soorten risico's met zich mee, waardoor het op meer manieren blootgesteld is aan DAC dan gespiegelde RAID.

Omdat DAC een aantal mogelijkheden omvat en omdat het in de praktijk onmogelijk te identificeren is nadat het is opgetreden, zijn er weinig mogelijkheden om er gegevens over te verzamelen. Sinds DAC als risico is geïdentificeerd, zijn veel mensen naar voren gekomen, voornamelijk in de Spiceworks-community, om anekdotische ooggetuigenverslagen van DAC-arrayfalen te delen. De aard van eindgebruikers-IT is dat statistieken, zeker over nevelige begrippen als DAC die niet algemeen bekend zijn, niet worden verzameld en niet verzameld kunnen worden. DAC ontstaat in bedrijven over de hele wereld, waar een systeembeheerder terugkeert naar kantoor en een server aantreft waarvan alle gegevens verdwenen zijn zonder dat er hardware is uitgevallen. De gegevens zijn dan al verloren. Er zal waarschijnlijk geen diagnostiek worden uitgevoerd, er zullen geen logbestanden bestaan, en zelfs als het probleem geïdentificeerd kan worden, aan wie zou het dan gemeld moeten worden, en zelfs als het gemeld wordt, hoe kwantificeren we hoe vaak het gebeurt versus hoe vaak niet, of hoe vaak het zou kunnen gebeuren maar niet wordt gemeld. Helaas is het enige dat ik weet, dat nadat ik het risico en de symptomen ervan had geïdentificeerd en enigszins bekend had gemaakt, plotseling veel mensen naar voren kwamen die erkenden dat ook zij DAC zelf hadden gezien en geen idee hadden gehad wat er was gebeurd.

Als mijn anekdotische onderzoeken een indicatie zijn, lijkt het erop dat DAC daadwerkelijk een aanzienlijk risico vormt voor pariteitsarrays, met falen dat zich in een merkbaar percentage van de arrays voordoet, maar de nauwkeurigheid en omvang van de dwarsdoorsnede van die gegevensverzameling was minuscuul. Oorspronkelijk werd echter gedacht dat DAC zo zeldzaam was dat je in theorie niemand zou kunnen vinden die het ooit had waargenomen, maar dit blijkt niet het geval te zijn. Ik ben al op de hoogte van veel mensen die het hebben meegemaakt.

We worden, door de aard van de sector, gedwongen om DAC te accepteren als een potentieel risico en het in risico-evaluaties op te nemen als een onbekend “klein” risico waarop we voorbereid moeten zijn, maar waartegen we niet kunnen rekenen. Maar het besef dat het een risico kan zijn en het begrip waarom het kan gebeuren, zijn belangrijk bij het evalueren van risico's en risicobeperking.

[Anekdotisch bewijs suggereert dat DAC vrijwel altijd uitsluitend voorkomt bij hardware-RAID-implementaties van enkelvoudige pariteits-RAID-arrays op SCSI-controllers.]

Getagdarray raid

Advertentie

SMB IT Journal — the IT resource for small business