KMUs müssen aufhören, sich an BackBlaze zu orientieren
Ich muss diesem Artikel eine Vorbemerkung voranstellen, da Leute solche Dinge oft aus dem Zusammenhang reißen und heftig auf Aussagen reagieren, die nie getroffen wurden, mit dem Hinweis, dass ich der Meinung bin, dass BackBlaze großartige Arbeit leistet, brillante Köpfe beschäftigt und beim Entwurf und der Nutzung von Technologie, die für ihre Bedürfnisse absolut anwendbar und angemessen ist, hervorragende Arbeit geleistet hat. Nichts, und ich meine wirklich nichts, in diesem Artikel ist jemals aus dem Zusammenhang zu reißen und als etwas Negatives über BackBlaze darzustellen. Sollte irgendetwas in diesem Artikel den Anschein erwecken oder das Gefühl vermitteln, etwas anderes auszusagen, lesen Sie es bitte erneut und vergewissern Sie sich, dass dies tatsächlich gesagt wurde, und teilen Sie mir dies gegebenenfalls mit, damit ich es korrigieren kann. Es ist in keiner Weise die Absicht dieses Artikels zu unterstellen, dass BackBlaze nicht das tut, was für sie, ihr Unternehmen und ihre Kunden klug ist. Nun zum Artikel:
Ich habe in den vielen vergangenen Jahren festgestellt, dass viele IT-Fachleute kleiner und mittlerer Unternehmen von dem angetan sind, was sie als ein Wunder an kostengünstigem, hochkapazitivem Speicher ansehen – bekannt als das BackBlaze-POD-Design. Im Wesentlichen ist der BackBlaze-POD ein kostengünstiger, hochkapazitiver, leistungsschwacher, nahezu Whitebox-Speicherserver, der aus einem speziell angefertigten Gehäuse und Verbraucherkomponenten aufgebaut ist, um einen wegwerfbaren Speicherknoten zu schaffen, der in großen RAIN-Speicher-Arrays unter Nutzung von Erasure-Coding zum Einsatz kommt. BackBlaze hat den ursprünglichen POD speziell entworfen und sein Design der Öffentlichkeit zugänglich gemacht, zur ausschließlichen Verwendung in ihren groß angelegten gehosteten Backup-Rechenzentren, wo die PODs als einzelne Knoten innerhalb eines gewaltigen Verbunds von Knoten mit Replikation untereinander fungieren. Im Laufe der Jahre hat BackBlaze sein POD-Design aktualisiert, da sich die Technologie verändert hat und Probleme angegangen wurden. Doch der grundlegende Anwendungsfall ist derselbe geblieben.
Ich muss dies mit dem SAM-SD-Ansatz für Speicher vergleichen, der eine ähnliche Stoßrichtung verfolgt, dies jedoch mit Hardware in Enterprise-Qualität und mit Support tut. Diese Unterschiede wirken bisweilen trivial, doch sie sind alles andere als trivial, sie sind die entscheidenden Grundpfeiler dessen, was die unterschiedlichen Lösungen in unterschiedlichen Situationen angemessen macht. Die Idee hinter dem SAM-SD ist, dass Speicher zuverlässig sein muss und von der Hardware an so zuverlässig wie möglich konzipiert und gut unterstützt sein muss, für den Fall, dass etwas ausfällt. Der POD verfolgt den entgegengesetzten Ansatz, indem er den einzelnen Server unzuverlässig und vergänglich macht und darauf auslegt, eher entsorgt als überhaupt repariert zu werden. Das SAM-SD-Design geht davon aus, dass der einzelne Server wichtig, ja sogar kritisch ist – alles andere als wegwerfbar.
Das SAM-SD-Konzept, das im Grunde nichts weiter ist als ein Ansatz zum Aufbau von offenem Speicher, ist mit Blick auf den SMB-Speichermarkt konzipiert. Der BackBlaze-POD ist mit Blick auf einen äußerst spezialisierten, groß angelegten Sonderfall des Verbraucher-Backup-Marktes konzipiert. Der SAM-SD ist dafür gedacht, von kleinen Unternehmen betrieben zu werden, selbst von solchen ohne interne IT. Der POD ist darauf ausgelegt, von einem vollzeitlich tätigen, dedizierten Storage-Engineering-Team bereitgestellt und verwaltet zu werden.
Da der BackBlaze-POD von Experten für Experten in den allergrößten Speichersituationen entworfen wurde, kann er für Nicht-Speicherexperten im Bereich der kleinen Unternehmen verwirrend und leicht misszuverstehen sein. Tatsächlich wird er so oft missverstanden, dass Einwände gegen ihn häufig mit Kommentaren wie „Ich denke, BackBlaze weiß, was sie tun“ beantwortet werden, was das extreme Missverständnis aufzeigt, das in Bezug auf diesen Ansatz herrscht. Natürlich weiß BackBlaze, was sie tun, aber sie tun nicht das, was irgendein KMU tut.
Die Veröffentlichung des POD-Designs für die Öffentlichkeit sorgt für viel Verwirrung, weil es nur ein Teil eines größeren Ganzen ist. Das Design des vollständigen Rechenzentrums sowie die Mittel und Mechanismen der Redundanz zwischen den PODs sind nicht öffentlich, sondern proprietär. Der POD selbst stellt also nur einen einzelnen Knoten eines Clusters (oder Vaults) dar und spiegelt nicht das Clustering selbst wider, in dem die wichtigste Arbeit stattfindet. Tatsächlich ist das POD-Design selbst nichts weiter als die Arbeit, die von den Sun-Thumper- und SAM-SD-Projekten des vergangenen Jahrzehnts geleistet wurde, allerdings ohne die Zwänge der Zuverlässigkeit. Der POD sollte kein neuartiges Design sein, sondern ein naheliegendes. Eines, das im SMB-Speicherbereich seit Jahrzehnten gemieden wurde, weil es so drastisch unanwendbar ist.
Da die Cluster- und Replikationsaspekte ausgeblendet werden, wenn über den BackBlaze-POD gesprochen wird, werden tendenziell einige gewaltige Annahmen über die Kapazität eines POD getroffen, der einen weitaus geringeren Overhead aufweist, als BackBlaze selbst für die POD-Infrastruktur erzielt, sogar im großen Maßstab. In RAID-Begriffen ausgedrückt, wäre dies beispielsweise vergleichbar mit der Annahme, der POD sei RAID 6 (mit nur 5 % Overhead), weil das das RAID einer einzelnen Komponente ist, wenn in Wahrheit RAID 61 (55 % Overhead) verwendet wird! Tatsächlich erwägen viele SMB-IT-Fachleute, wenn sie ein POD-Design einsetzen möchten, tatsächlich, schlicht RAID 6 zu verwenden und obendrein nur einen einzigen POD einzusetzen. Das Ausmaß, in dem dies nicht dem Modell von BackBlaze entspricht, ist erstaunlich.
BackBlaze: „Backblaze Vaults combine twenty physical Storage Pods into one virtual chassis. The Vault software implements our own Reed-Solomon encoding to spread data shards across all twenty pods in the Vault simultaneously, dramatically improving durability.“
Um den POD für den SMB-Markt in Betracht zu ziehen, ist es erforderlich, das gesamte Konzept des POD vollständig aus dem Zusammenhang zu reißen. Sowohl seinen vorgesehenen Anwendungsfall als auch seine Umsetzung. Was BackBlaze besonders macht, wird vollständig entfernt, und nur die trivialsten, oberflächlichsten Aspekte werden übernommen und in etwas verwandelt, das in keiner Weise der Vision oder dem Zweck von BackBlaze ähnelt.
Wenn wir uns genauer ansehen, wo der BackBlaze-POD im Design von den Standardanforderungen eines normalen Unternehmens abweicht, finden wir folgende Probleme:
- Der POD ist darauf ausgelegt, unzuverlässig zu sein und sich auf eine Zuverlässigkeits- und Replikationsschicht auf der Super-POD-Ebene zu stützen, die erfordert, dass eine große Anzahl von PODs bereitgestellt wird und dass die Daten zwischen ihnen mittels benutzerdefinierter Replikation oder Clustering redundant gehalten werden. Ohne diese Schicht ist der POD vollständig aus dem Zusammenhang gerissen. Die Super-POD-Ebene ist intern als BackBlaze Vault bekannt.
- Der POD ist darauf ausgelegt, in einem Enterprise-Rechenzentrum mit sorgfältiger Vibrationsdämpfung, Stromaufbereitung und Umgebungssystemen bereitgestellt zu werden. Er ist gegenüber diesen Problemen weniger widerstandsfähig als Standard-Enterprise-Hardware.
- Der POD ist darauf ausgelegt, typischerweise als komplette Einheit ersetzt zu werden, anstatt einen Knoten vor Ort zu reparieren. Das ist das Gegenteil von Standard-Enterprise-Hardware mit Hot-Swap-Komponenten, die darauf ausgelegt sind, ohne Unterbrechung repariert zu werden, geschweige denn ohne vollständigen Austausch. Wir nennen dies einen wegwerfbaren oder vergänglichen Anwendungsfall.
- Der POD ist darauf ausgelegt, für sehr langsamen, kalten Speicherbedarf unglaublich kostengünstig zu sein. Auch wenn es dies in einem KMU geben kann, ist das typischerweise nicht der Fall.
- Der POD ist darauf ausgelegt, ein einzelner, hochkapazitiver Speicherknoten in einem Pool von wahnsinnig großer Kapazität zu sein. Nur wenige KMUs können auch nur das Speicherpotenzial eines einzelnen POD nutzen, geschweige denn einen Pool, der groß genug ist, um das POD-Design zu rechtfertigen.
- Der BackBlaze-POD ist darauf ausgelegt, benutzerdefiniertes Erasure-Coding zu verwenden, nicht RAID. RAID ist in diesem Maßstab nicht effektiv, selbst auf der Ebene eines einzelnen POD.
- Ein einzelner POD ist für 180 TB Kapazität ausgelegt und ein Vault für einen Maßstab von 3,6 PB.
Aktuelle Referenz des BackBlaze POD 5: https://www.backblaze.com/blog/cloud-storage-hardware/
Kurz gesagt: Der BackBlaze-POD ist ein brillanter Grundpfeiler eines brillanten Dienstes, der einen ganz spezifischen Bedarf deckt, der so weit von den Bedürfnissen des SMB-Speichermarktes entfernt ist, wie man es vernünftigerweise nur sein kann. Achten Sie BackBlaze für ihre großartige Arbeit, aber versuchen Sie nicht, sie nachzuahmen.
