Choix de RAID pratiques pour les grappes à disques mécaniques
Une quantité véritablement colossale d'informations abonde au sujet des systèmes de stockage RAID, explorant des thèmes tels que le risque, la performance, la capacité, les tendances, les approches et bien d'autres encore. Si le travail consacré à ce sujet est presque vertigineux, l'information peut être distillée en une poignée d'approches de stockage courantes et pratiques qui couvriront la quasi-totalité des cas d'usage. Mon objectif ici est de fournir un guide commode qui permettra à un praticien non spécialiste du stockage d'aborder la prise de décision en matière de RAID d'une manière pratique et, surtout, sûre.
Pour les besoins de ce guide, nous supposerons des projets de stockage ne dépassant pas vingt-cinq disques traditionnels (disques à plateaux rotatifs proprement dénommés disques Winchester.) Ces disques pourront être au format SFF (2,5″) ou LFF (3,5″), couramment, en SATA ou en SAS, grand public ou entreprise. Nous n'aborderons pas les disques à semi-conducteurs, car ceux-ci présentent des caractéristiques très différentes et requièrent leurs propres recommandations. Les systèmes de stockage de plus de vingt-cinq disques environ ne devraient pas s'appuyer sur des recommandations standards, mais explorer plus en profondeur les besoins de stockage spécifiques afin de garantir une planification adéquate.
Les recommandations formulées ici sont rédigées pour des systèmes standards en 2015. Au cours des deux dernières décennies, les approches courantes du stockage RAID ont radicalement évolué et, bien que l'on n'anticipe pas que les facteurs clés influençant ces décisions changent suffisamment à l'avenir pour modifier ces recommandations, il est tout à fait possible qu'ils le fassent. Une bonne conception de RAID en 1998 constitue une très mauvaise conception de RAID aujourd'hui. Le rythme du changement dans le secteur a sensiblement ralenti depuis cette époque et ces recommandations sont susceptibles de rester valables très longtemps, fort possiblement jusqu'à ce que le stockage sur disques mécaniques ne soit plus disponible, ou du moins plus répandu ; mais, comme toute chose, les prévisions sont sujettes à de profonds bouleversements.
D'une manière générale, nous recourons à ce que l'on appelle l'approche “une seule grande grappe”. Il s'agit d'une grappe RAID unique sur laquelle sont créées toutes les partitions système et de données. Le besoin ou le désir de scinder notre stockage en plusieurs grappes physiques a pour l'essentiel disparu aujourd'hui et ne devrait être mis en œuvre que dans des circonstances non générales. Ce n'est que dans les situations où une étude attentive des besoins de stockage et une analyse approfondie sont menées que nous devrions envisager le fractionnement des grappes. Le fractionnement des grappes est bien plus susceptible de nuire que d'être bénéfique. Dans le doute, évitez les grappes fractionnées. L'objectif de ce guide est de fournir des règles empiriques générales permettant à tout professionnel de l'informatique de construire un système de stockage sûr et fiable. Les règles empiriques ne couvrent pas, et ne peuvent pas couvrir, tous les scénarios ; des exceptions existent toujours. Mais l'idée ici est de couvrir la grande majorité des cas au moyen d'approches éprouvées, conçues autour de l'équipement, des cas d'usage et des besoins modernes, tout en veillant à pécher par excès de prudence – lorsqu'un choix est moins qu'idéal, il reste néanmoins sûr. Aucun de ces choix n'est le moins du monde téméraire ; au pire, ils sont excessivement conservateurs.
Le premier scénario que nous devrions envisager est celui où vos données n'ont pas d'importance. Cela peut sembler une chose étrange à considérer, mais il s'agit d'un scénario très important. Il existe de nombreux cas où les données enregistrées sur disque sont considérées comme éphémères et n'ont pas besoin d'être protégées. C'est courant pour les données reconstructibles telles que l'espace de travail pour le rendu, les espaces de calcul intermédiaires ou les caches – des situations où dépenser de l'argent pour protéger les données est du gaspillage, et où il serait acceptable de simplement recréer les données perdues plutôt que de les protéger. Il peut s'agir d'un cas où l'interruption ne pose pas de problème et où les données sont statiques ou quasiment, et où, plutôt que de dépenser pour réduire les interruptions, nous nous soucions uniquement de protéger les données via des mécanismes de sauvegarde, de sorte que si une grappe tombe en panne, nous restaurions simplement la grappe dans son intégralité. Dans ces cas, le choix évident est le RAID 0. Il est très rapide, très simple et offre la capacité la plus économique. Le seul inconvénient du RAID 0 est qu'il est fragile et n'offre aucune protection contre la perte de données en cas de défaillance d'un disque, ni même contre une URE (qui provoquerait une corruption de données, au même titre qu'un disque de bureau y est exposé.)
Il convient de noter qu'une exception courante à l'approche “une seule grande grappe” concerne les systèmes utilisant le RAID 0 pour les données. On pourrait fort bien plaider en faveur d'une petite grappe de disques dédiée au système d'exploitation et aux données applicatives, qu'il serait fastidieux de réinstaller en cas de perte de la grappe, conservée sur du RAID 1, la grappe de données en RAID 0 en étant distincte. De cette façon, la récupération pourrait être très rapide, plutôt que de devoir reconstruire intégralement l'ensemble du système à partir de zéro, au lieu de simplement recréer les données.
En supposant que nous ayons écarté les cas où les données ne nécessitent pas de protection, nous supposerons pour tous les cas restants que les données sont tout à fait importantes et que nous souhaitons les protéger à un certain coût. Nous supposerons que protéger les données telles qu'elles existent sur le stockage en service est important, généralement parce que nous voulons éviter les interruptions ou parce que nous voulons garantir l'intégrité des données, le stockage sur disque n'étant pas statique et une défaillance de grappe constituant également une perte de données. C'est sur cette hypothèse que nous poursuivrons.
Si nous avons une grappe de deux disques seulement, la réponse est très simple : nous choisissons le RAID 1. Il n'existe aucune autre option à cette taille, donc aucune décision à prendre. En théorie, nous devrions planifier nos grappes de manière globale et non après que le nombre de disques a été déterminé ; le nombre de disques et le type de grappe choisi devraient être décidés conjointement, plutôt que d'acheter les disques puis de déterminer l'usage en fonction de ce nombre arbitraire, mais les châssis à deux disques sont si répandus qu'il vaut la peine de les mentionner comme cas de figure.
De même, avec une grappe de quatre disques, le seul véritable choix à envisager est le RAID 10. Il n'est nul besoin d'évaluation plus poussée. Sélectionnez simplement le RAID 10 et poursuivez.
Un cas délicat est celui d'une grappe de trois disques. Il est très, très rare que nous soyons limités à trois disques, car le seul châssis courant limité à trois disques était l'Apple Xserve, lequel a quitté le marché depuis un certain temps ; la nécessité de gérer une prise de décision autour de grappes de trois disques devrait donc être extrêmement improbable. Dans les cas où nous disposons de trois disques, il est souvent préférable de solliciter des conseils, mais les approches les plus courantes consistent à ajouter un quatrième disque et donc à choisir le RAID 10 ou, si une capacité supérieure à celle d'un seul disque n'est pas nécessaire, à placer les trois disques dans une unique grappe RAID 1 à triple miroir.
Pour tous les autres cas, par conséquent, nous traitons de cinq à vingt-cinq disques. Puisque nous avons écarté les situations où le RAID 0 et le RAID 1 s'appliqueraient, il nous reste l'ensemble des scénarios courants qui se réduisent au RAID 6 et au RAID 10, lesquels constituent la grande majorité des cas. Le choix entre RAID 6 et RAID 10 devient le plus grand défi auquel nous serons confrontés, car nous devons nous fonder uniquement sur nos besoins “immatériels” de fiabilité, de performance et de capacité.
Le choix entre RAID 6 et RAID 10 ne devrait pas être terriblement difficile. Le RAID 10 est idéal pour les situations où la performance et la sécurité sont prioritaires. Le RAID 10 offre de bien meilleures performances en écriture et est sûr quel que soit le type de disque utilisé (des disques grand public à faible coût peuvent rester extrêmement sûrs, même au sein de grandes grappes.) Le RAID 10 monte bien en charge jusqu'à des tailles extrêmement élevées, bien plus importantes que ce qui devrait être mis en œuvre sur la base de règles empiriques ! Le RAID 10 est le plus sûr de tous les choix : il est à la fois rapide et sûr. Les inconvénients évidents sont que le RAID 10 offre une capacité de stockage moindre à partir des mêmes disques et qu'il est plus onéreux rapporté à la capacité. Il faut mentionner que le RAID 10 ne peut utiliser qu'un nombre pair de disques ; les disques sont ajoutés par paires.
Le RAID 6 est généralement sûr et rapide, mais jamais aussi sûr ni aussi rapide que le RAID 10. Le RAID 6 pâtit spécifiquement de ses performances en écriture, de sorte qu'il convient très mal à des charges de travail telles que les bases de données et aux charges fortement mixtes comme celles des grands systèmes de virtualisation. Le RAID 6 est économique et met fortement l'accent sur la capacité disponible comparé au RAID 10. Lorsque les budgets sont serrés ou que les besoins en capacité priment sur la performance, le RAID 6 est un choix idéal. Il est rare que la différence de sécurité entre le RAID 10 et le RAID 6 soit préoccupante, sauf dans les très grands systèmes équipés de disques grand public. Le RAID 6 est exposé à un risque supplémentaire avec les disques grand public, dont le RAID 10 n'est pas affecté, ce qui pourrait justifier une certaine préoccupation quant à la fiabilité des systèmes RAID 6 de plus grande taille, tels que ceux dépassant environ 40 To lorsque des disques grand public sont utilisés.
Dans l'univers des petites entreprises en particulier, la majorité des systèmes utiliseront le RAID 10 simplement parce que les grappes ont rarement besoin de dépasser quatre disques. Lorsque les grappes sont plus grandes, le RAID 6 est le choix le plus courant en raison de budgets quelque peu serrés et d'une préoccupation généralement faible pour la performance. Le RAID 6 comme le RAID 10 sont des solutions sûres et efficaces pour la quasi-totalité des scénarios d'usage, le RAID 10 dominant lorsque la performance ou une fiabilité extrême sont essentielles, et le RAID 6 dominant lorsque le coût et la capacité sont essentiels. Et, bien entendu, lorsque les besoins de stockage sont hautement singuliers ou très importants, par exemple au-delà de vingt-cinq disques dans une grappe, n'oubliez pas de faire appel à un consultant en stockage, car le scénario peut aisément devenir très complexe. Le stockage est l'un des domaines où il est payant de redoubler de diligence, car tant de choses en dépendent, les erreurs y sont si faciles à commettre et la souplesse pour le modifier après coup y est si réduite.
