Quando un Backup Non È un Backup
Concettualmente l'idea di “backup” è diventata un'area nebulosa all'interno dell'IT. Tutti sembrano avere i propri concetti di che cosa sia un backup e di come si aspettano che si comporti. Questo può essere pericoloso quando chi fornisce il backup e chi lo utilizza hanno aspettative discordanti. Lo vedo accadere ogni giorno persino con i meccanismi di backup tradizionali. Con nuovi tipi di backup che compaiono regolarmente, le occasioni di incomprensioni e di perdita di dati diventano molto più marcate.
Con backup tradizionali mi riferisco al mondo tradizionale dei backup su nastro con una strategia di rotazione nonno – padre – figlio, giusto per preparare il terreno alla discussione. I nuovi backup potrebbero includere immagini di sistema, backup su disco, backup continui e backup verso “il cloud” oppure backup online. Il mondo dei backup si sta evolvendo rapidamente ed è proprio ora che le incomprensioni iniziano a mettere a rischio le risorse di dati aziendali.
Allora che cos'è esattamente un “backup”? Il concetto suona semplice, ma che cosa intendiamo realmente quando usiamo il termine? Intendiamo la capacità di ripristinare un sistema dopo che si è guastato? La capacità di tornare a una versione precedente di un file? Forse l'archiviazione dei dati quando l'originale non esiste più? Per quanto tempo, e quali file, vengono conservati? Questo riguarda solo i dati dei file oppure sono inclusi anche le email e i database? Dobbiamo eseguire il ripristino solo in caso di guasto del sistema oppure ci serve anche la capacità di ripristinare dati granulari? Ci serve una sola copia oppure ci servono copie di ogni versione di un file?
Ora, con i rischi aggiuntivi posti da fenomeni come il ransomware, abbiamo più preoccupazioni che mai e le idee non solo intorno al versioning ma potenzialmente al versioning illimitato e all'air gapping tra sistemi e backup sono diventate motivo di preoccupazione laddove prima, in genere, non lo erano.
Molte organizzazioni, specialmente quelle più piccole, scelgono spesso di affrontare i backup in modo un po' diverso dalle aziende di grandi dimensioni e spesso evitano del tutto i backup. Invece “eseguono i backup” ma poi spesso eliminano i file originali. E anziché conservare molte copie dei file di cui è stato “eseguito il backup”, optano per conservare una sola copia (o più versioni che dipendono l'una dall'altra). Questo significa che ciò che possiedono non è realmente un backup, bensì un archivio. Se l'unico disco o nastro su cui è memorizzato il file si danneggia, il file è perso completamente.
Il termine backup implica che esistano almeno due copie di un certo dato che non dipendono l'una dall'altra. Un archivio non implica questo e implica soltanto che abbiamo trasferito i dati dalla produzione a un altro sistema, presumibilmente uno a costo inferiore e probabilmente molto più lento e difficile da cui recuperare i dati. I dati archiviati non implicano alcuna ridondanza, a differenza del termine backup.
Se “eseguiamo un backup” e poi procediamo a eliminare i dati originali, non abbiamo più un backup e il file memorizzato nel “sistema di backup”, che si trovi su disco, su un nastro in cassaforte o quant'altro, si trasforma in un archivio dei dati originali anziché in un backup di essi. Diventa ora il nostro file sorgente, anziché essere una copia. Questa è parte della magia dei supporti digitali: le copie sono un clone anziché un'imitazione, quindi la componente di archiviazione è legittimamente l'originale in ogni senso.
Questo può sembrare pedante, ma davvero non lo è. Se un'azienda paga per i backup, presumibilmente dà per scontato che quel costo serva ad avere una certa ridondanza, e non solo una singola copia dei dati. E se si hanno normative che impongono di conservare i backup per ragioni di conformità, avere solo una copia di archivio è una chiara violazione di tale requisito. Avere due sistemi che si guastano e non riuscire a recuperare i dati è un caso limite che ogni norma di conformità deve accettare. Ma avere un sistema di archiviazione che si guasta laddove è richiesto un backup che però non è stato conservato non è uno scenario accettabile.
Per questa ragione, e per molte altre, concetti come la metodologia di backup 3-2-1 hanno senso, perché questo approccio garantisce che i backup siano conservati all'interno del sistema di backup e che gli originali non debbano essere conservati in produzione. In un certo modo di pensare, questo approccio potrebbe essere considerato come la fusione di archiviazione e backup in un unico sistema, il che aggiunge molta chiarezza alla progettazione.
Qualunque sia il sistema di backup che funziona per te, sii consapevole che i backup significano copie indipendenti e che, per molti versi, le copie indipendenti che non condividono domini di guasto sono diventate ormai quasi un requisito per tutti i backup di oggi.
