Les PME doivent cesser de se tourner vers BackBlaze pour s'orienter
Je dois préfacer cet article, car les gens sortent souvent ces propos de leur contexte et réagissent vivement à des choses qui n'ont jamais été dites, en précisant d'emblée que je pense que BackBlaze fait un excellent travail, emploie des personnes brillantes et a réalisé un travail remarquable de conception et d'exploitation d'une technologie qui est tout à fait applicable et appropriée à leurs besoins. Rien, et je dis bien rien, dans cet article ne doit jamais être sorti de son contexte et présenté comme un jugement négatif à l'égard de BackBlaze. Si quoi que ce soit dans cet article semble ou donne l'impression d'affirmer le contraire, veuillez relire et vérifier que cela a bien été dit et, le cas échéant, m'en informer afin que je puisse le corriger. Cet article n'a nullement l'intention de laisser entendre, de quelque manière que ce soit, que BackBlaze ne fait pas ce qui est judicieux pour elle-même, pour son entreprise et pour ses clients. Passons maintenant à l'article :
J'ai constaté au cours des nombreuses années passées que de nombreux professionnels de l'informatique des petites et moyennes entreprises se sont entichés de ce qu'ils perçoivent comme un miracle de stockage à faible coût et à haute capacité, à savoir ce que l'on appelle la conception du POD BackBlaze. Pour l'essentiel, le POD BackBlaze est un serveur de stockage à faible coût, à haute capacité, à faibles performances et quasiment générique (whitebox), construit à partir d'un châssis personnalisé et de composants grand public afin de constituer un nœud de stockage jetable utilisé dans de grandes baies de stockage RAIN tirant parti du codage par effacement (erasure coding). BackBlaze a conçu sur mesure le POD d'origine, et en a publié la conception, pour un usage exclusif dans ses centres de données d'hébergement de sauvegarde à grande échelle, où les PODs fonctionnent comme des nœuds individuels au sein d'une baie massive de nœuds avec réplication entre eux. Au fil des ans, BackBlaze a mis à jour la conception de son POD à mesure que la technologie évoluait et que des problèmes étaient résolus. Mais le cas d'usage fondamental est resté le même.
Je dois comparer cela à l'approche du stockage SAM-SD, qui suit une démarche similaire mais le fait en utilisant du matériel de qualité professionnelle, pris en charge. Ces différences peuvent parfois sembler insignifiantes, mais elles sont tout sauf insignifiantes ; ce sont les fondements mêmes de ce qui rend les différentes solutions appropriées dans différentes situations. L'idée qui sous-tend le SAM-SD est que le stockage doit être fiable et conçu, depuis le matériel, pour être aussi fiable que possible et bien pris en charge en cas de défaillance. Le POD adopte l'approche inverse en rendant le serveur individuel peu fiable et éphémère par nature, conçu pour être mis au rebut plutôt que réparé. La conception du SAM-SD part du principe que le serveur individuel est important, voire critique – tout sauf jetable.
Le concept SAM-SD, qui n'est littéralement rien d'autre qu'une approche de construction de stockage ouvert, est conçu en pensant au marché du stockage des PME. Le POD BackBlaze est conçu en pensant à un marché extrêmement niche, à grande échelle et particulier, celui de la sauvegarde grand public. Le SAM-SD est destiné à être exploité par de petites entreprises, y compris celles qui ne disposent pas d'informatique interne. Le POD est conçu pour être déployé et géré par une équipe d'ingénierie de stockage dédiée et à temps plein.
Parce que le POD BackBlaze est conçu par des experts, pour des experts, dans les situations de stockage les plus vastes, il peut prêter à confusion et être facilement mal compris par les non-spécialistes du stockage dans le monde des petites entreprises. En fait, il est si souvent mal compris que les objections qu'on lui oppose se heurtent fréquemment à des remarques du type « je pense que BackBlaze sait ce qu'il fait », ce qui témoigne de l'extrême incompréhension qui entoure cette approche. Bien sûr que BackBlaze sait ce qu'il fait, mais ce qu'il fait n'a rien à voir avec ce que fait la moindre PME.
La publication de la conception du POD prête largement à confusion parce qu'elle ne constitue qu'une partie d'un tout plus vaste. La conception du centre de données complet ainsi que les moyens de redondance et les mécanismes qui s'y rapportent entre les PODs ne sont pas publics, mais propriétaires. Le POD ne représente donc qu'un seul nœud d'un cluster (ou Vault) et ne reflète pas le clustering lui-même, qui est pourtant là où s'effectue le travail le plus important. En réalité, la conception du POD en elle-même n'est rien d'autre que le travail réalisé par les projets Sun Thumper et SAM-SD de la décennie précédente, sans les contraintes de fiabilité. Le POD ne devrait pas être une conception novatrice, mais une conception évidente. Une conception qui a, pendant des décennies, été évitée dans le monde du stockage des PME parce qu'elle est si radicalement inapplicable.
Parce que les aspects de clustering et de réplication sont ignorés lorsqu'on parle du POD BackBlaze, on a tendance à formuler d'énormes hypothèses sur la capacité d'un POD, qui présentent une surcharge bien moindre que celle que BackBlaze elle-même obtient pour l'infrastructure de PODs, même à grande échelle. Par exemple, en termes de RAID, cela reviendrait à supposer que le POD est en RAID 6 (avec seulement 5 % de surcharge) parce que c'est le RAID d'un composant individuel alors que, en réalité, c'est le RAID 61 (55 % de surcharge) qui est utilisé ! De fait, de nombreux professionnels de l'informatique des PME, lorsqu'ils envisagent d'utiliser une conception de POD, songent en réalité à se contenter d'utiliser le RAID 6 et, qui plus est, à n'utiliser qu'un seul POD. Le degré auquel cela ne respecte pas le modèle de BackBlaze est stupéfiant.
BackBlaze : « Les Vaults Backblaze combinent vingt Storage Pods physiques en un seul châssis virtuel. Le logiciel Vault met en œuvre notre propre codage de Reed-Solomon pour répartir simultanément les fragments de données (shards) sur l'ensemble des vingt pods du Vault, améliorant considérablement la durabilité. »
Pour faire du POD une option envisageable pour le marché des PME, il faut que l'ensemble du concept du POD soit totalement sorti de son contexte. À la fois son cas d'usage prévu et sa mise en œuvre. Ce qui rend BackBlaze unique est entièrement supprimé et seuls les aspects les plus anecdotiques et superficiels sont retenus et transformés en quelque chose qui ne ressemble en rien à la vision ou à l'objectif de BackBlaze.
En creusant les points sur lesquels la conception du POD BackBlaze diffère des besoins standard d'une entreprise ordinaire, nous trouvons les problèmes suivants :
- Le POD est conçu pour être peu fiable, pour s'appuyer sur une couche de fiabilité et de réplication au niveau du super-POD qui exige le déploiement d'un grand nombre de PODs et la redondance des données entre eux au moyen d'une réplication ou d'un clustering personnalisés. Sans cette couche, le POD est complètement hors contexte. Le niveau super-POD est connu en interne sous le nom de Vault BackBlaze.
- Le POD est conçu pour être déployé dans un centre de données d'entreprise doté d'un amortissement soigné des vibrations, d'un conditionnement de l'alimentation électrique et de systèmes de contrôle environnemental. Il résiste moins bien à ces problèmes que le matériel d'entreprise standard.
- Le POD est conçu pour être généralement remplacé en tant qu'unité complète plutôt que pour réparer un nœud in situ. C'est l'opposé du matériel d'entreprise standard, doté de composants échangeables à chaud (hot swap) conçus pour être réparés sans interruption, et encore moins sans remplacement intégral. Nous appelons cela un cas d'usage jetable ou éphémère.
- Le POD est conçu pour être incroyablement peu coûteux pour des besoins de stockage à froid (cold storage) très lents. Bien que cela puisse exister dans une PME, ce n'est généralement pas le cas.
- Le POD est conçu pour être un nœud de stockage unique, à haute capacité, au sein d'un pool d'une capacité démesurément grande. Peu de PME peuvent tirer parti ne serait-ce que du potentiel de stockage d'un seul POD, et encore moins d'un pool suffisamment grand pour justifier la conception du POD.
- Le POD BackBlaze est conçu pour utiliser un codage par effacement personnalisé, et non le RAID. Le RAID n'est pas efficace à cette échelle, même au niveau d'un seul POD.
- Un POD individuel est conçu pour une capacité de 180 To et un Vault pour une échelle de 3,6 Po.
Référence actuelle du POD 5 de BackBlaze : https://www.backblaze.com/blog/cloud-storage-hardware/
En bref, le POD BackBlaze est un fondement brillant pour un service brillant qui répond à un besoin très précis, aussi éloigné des besoins du marché du stockage des PME qu'on puisse raisonnablement l'être. Respectez BackBlaze pour son excellent travail, mais n'essayez pas de l'imiter.
