Norme de notation du RAID en réseau (notation RAID SAM)
À mesure que le paysage du RAID se complexifie avec l'émergence du RAID en réseau, il devient impératif de disposer d'un système de notation plus complet et plus concis pour les niveaux de RAID comportant une composante réseau.
Le RAID traditionnel s'exprime au moyen d'une notation à un seul chiffre et les niveaux disponibles sont 0, 1, 2, 3, 4, 5, 6, 7. Le niveau 7 est officieux mais largement admis comme désignant le RAID à triple parité (le prolongement naturel du RAID 5 et du RAID 6), et le RAID 2 et le RAID 3 sont aujourd'hui de fait tombés en désuétude.
Le RAID imbriqué, un niveau de RAID au sein d'un autre, se note en accolant les niveaux de RAID à un seul chiffre, comme RAID 10, 50, 61, 100, etc. On peut aussi les écrire en séparant les niveaux par un signe plus, comme RAID 1+0, 5+0, 6+1, 1+0+0, etc.
Ce système de notation présente deux problèmes majeurs, au-delà du problème évident que tous les types ou extensions de RAID ne sont pas pris en compte par le système à un seul chiffre, de nombreux aspects des systèmes RAID propriétaires tels que ZRAID, XRAID et BeyondRAID n'étant pas pris en compte par le système de notation. Le premier est l'absence de notation pour le RAID en réseau et le second est l'absence de désignation précise de la configuration interne du RAID.
Le RAID en réseau se décline en deux types principaux, synchrone et asynchrone. Le RAID en réseau synchrone fonctionne de manière pratiquement identique à son homologue non mis en réseau. L'asynchrone fonctionne de la même façon mais comporte des risques supplémentaires, car les données peuvent ne pas être synchronisées entre les périphériques au moment de la défaillance de l'un d'eux. Les différences entre les deux doivent donc être visibles dans la notation.
Le RAID synchrone devrait être noté à l'aide de parenthèses. Ainsi, deux systèmes RAID 10 locaux mis en miroir sur le réseau (à la manière de DRBD) seraient notés RAID 10(1). Le niveau de RAID effectif pour les calculs de risque et de capacité serait le même que pour n'importe quel RAID 101, mais cela informe d'un coup d'œil toutes les parties que le miroir s'effectue sur un réseau.
Le RAID asynchrone devrait être noté à l'aide de crochets. Ainsi, deux systèmes RAID 10 locaux mis en miroir sur le réseau de manière asynchrone seraient notés RAID 10[1], indiquant clairement qu'il existe un délai risqué dans le système.
Il existe un besoin supplémentaire d'un type différent de réplication à un niveau supérieur, celui du système de fichiers (à la manière de rsync), qui, bien qu'il ne soit pas véritablement lié au RAID, remplit une fonction similaire pour les données froides et est souvent évoqué dans les discussions sur le RAID ; je crois que les ingénieurs du stockage doivent eux aussi pouvoir le noter aisément. Cette réplication asynchrone au niveau du système de fichiers peut être notée à l'aide d'accolades. Une seule notation est nécessaire, car la réplication au niveau du système de fichiers est toujours asynchrone. Ainsi, à titre d'exemple, deux grappes RAID 6 synchronisées automatiquement au moyen d'un système de réplication de système de fichiers par différentiel de blocs seraient notées RAID 6{1}.
Pour simplifier davantage la notation RAID, pour abréger la nécessité manifeste d'écrire le mot “RAID” à répétition et pour nous affranchir des distractions traditionnelles liées à la signification de l'acronyme afin de pouvoir nous concentrer sur les aspects pertinents de réplication, un simple préfixe “R” devrait être employé. Ainsi, RAID 10 deviendrait simplement R10. Ou un miroir purement en réseau pourrait s'écrire R(1).
Reste à traiter un aspect majeur de la notation RAID : la taille de chaque composant de la grappe. Cet aspect est souvent implicite, mais certains niveaux de RAID, en particulier ceux qui sont imbriqués, peuvent présenter des subtilités que la notation traditionnelle laisse échapper. Connaître le nombre total de disques d'une grappe ne suffit pas toujours à indiquer la configuration d'une grappe donnée. Par exemple, un R10 de 24 disques est supposé être constitué de douze paires de miroirs réunies en une bande R0. Mais il pourrait s'agir de huit ensembles de triples miroirs en une bande R0. Ou encore de six quadruples miroirs. Ou de quatre sextuples miroirs. Ou de trois octuples miroirs. Ou de deux douzuples miroirs. Si la plupart de ces cas sont extrêmement improbables, il faut pouvoir les noter. Pour la taille de l'ensemble, nous utilisons un nombre en exposant afin d'indiquer la taille de cet ensemble. En général, cela n'est nécessaire que pour un seul aspect de la grappe, et non pour tous, les autres pouvant être déduits, mais en cas de doute, cela peut être indiqué explicitement.
Ainsi, une grappe R10 utilisant des ensembles de miroirs à trois voies serait notée R130. Faute de pouvoir écrire un exposant, on pourrait aussi l'écrire R1^3+0. Cette notation n'indique pas la taille complète de la grappe, mais uniquement son type de configuration. Si tous les exposants possibles sont indiqués, la taille complète de la grappe peut être calculée sans rien d'autre. Si nous avons un R10 composé de quatre ensembles de miroirs à trois voies, nous pourrions l'écrire R1304, ce qui nous indiquerait que la grappe entière se compose de douze disques – ou, dans la notation alternative, R1^3+0^4.
La notation des ensembles en exposant n'est nécessaire que lorsqu'elle n'est pas évidente. R10 sans autre notation sous-entend que la composante R1 est constituée de paires de miroirs, par exemple. R55 requiert presque toujours une notation supplémentaire, sauf lorsque la grappe se compose de neuf membres seulement.
Un aspect supplémentaire à prendre en compte est la notation de la taille de la grappe. Cela est bien plus simple que la notation en exposant et se révèle presque toujours pleinement suffisant. Cela évite d'avoir à écrire en toutes lettres “Une grappe RAID 10 de quatre disques.” Nous pouvons à la place utiliser un préfixe à cette fin. 4R10 désignerait une grappe RAID 10 de quatre disques.
Ainsi, pour reprendre notre exemple ci-dessus, le RAID 10 de douze disques composé d'ensembles de miroirs à trois voies pourrait s'écrire 12R1304. Mais l'emploi des trois nombres devient redondant. N'importe lequel d'entre eux peut être omis. Ce serait généralement le dernier, car c'est celui qui a le moins de chances d'être utile. La taille de l'ensemble R1 est utile pour déterminer le risque de base et le 12 de tête sert aux calculs de capacité et de performance ainsi qu'au dimensionnement et à l'achat du châssis. Le quatre de fin est impliqué par les deux autres nombres et pratiquement inutile à lui seul. La meilleure manière d'écrire ceci serait donc simplement 12R130. Si cette même grappe devait recourir à l'approche courante des paires de miroirs plutôt qu'au miroir à trois voies, nous écririons simplement 12R10 pour désigner une grappe RAID 10 standard de douze disques.
