Coup de projecteur sur le stockage en PME

Le stockage est un problème difficile à résoudre. Pour les entreprises, le stockage est compliqué car il implique souvent des prix élevés pour ce qui semble être des gains nébuleux. La plupart des dirigeants comprennent le besoin de “stocker” des choses et toujours plus, mais ils comprennent très peu de choses sur la performance, les méthodes d’accès, la redondance et le calcul des risques, la sauvegarde et la reprise après sinistre. Cela rend la tâche de l’informatique difficile, car nous devons expliquer pourquoi les budgets doivent souvent être extrêmement élevés pour ce qui apparaît comme un système invisible aux yeux des parties prenantes de l’entreprise.

Pour l’informatique, le stockage est difficile parce que les systèmes de stockage sont complexes – souvent le système le plus complexe au sein d’une PME – et souvent, en raison de leur coût et de leur centralisation, ils existent en très petites quantités au sein d’une entreprise. Cela signifie que la plupart des PME, si elles possèdent un système de stockage, n’en ont qu’un seul et le conservent très longtemps. Ce manque d’exposition large aux systèmes de stockage, combiné au besoin relativement peu fréquent d’interagir avec les systèmes de stockage, laisse les services informatiques des PME aux prises avec un poste budgétaire important d’une criticité incroyable pour l’entreprise, qui ne représente qu’un faible pourcentage de leur éventail de “tâches” et sur lequel ils ont en réalité très peu d’expérience, de par la nature même de la bête. D’autres domaines de l’informatique sont bien plus accessibles à des fins d’expérimentation, de test et de formation.

Entre ces deux défis majeurs, il nous reste un produit qui est globalement mal compris, à la fois par la direction et par l’informatique. Le stockage est si mal compris que souvent les services informatiques ne savent même pas du tout ce dont ils ont besoin et ne font souvent guère plus que lancer des fléchettes sur la cible du stockage et partir de l’endroit où les fléchettes atterrissent – et commencent souvent par appeler des fournisseurs plutôt que des consultants, ce qui les engage sur la voie d’une “décision déjà prise” tout en ayant l’impression de recevoir des conseils.

Les fournisseurs de stockage, sachant tout cela, font peu pour améliorer la situation puisque, une fois le contact établi entre une PME et un fournisseur, il est dans l’intérêt du fournisseur de ne pas éduquer le client, étant donné que celui-ci a déjà pris la décision d’approcher ce fournisseur au départ, avant d’avoir les informations nécessaires en main. Le fournisseur veut donc simplement vendre ce qu’il a en stock. Il est rare qu’un seul fournisseur de stockage propose une large gamme de produits dans ses propres lignes, de sorte que s’adresser directement à un fournisseur avant de savoir exactement ce dont on a besoin peut conduire bien plus loin vers le fait que le client a, de fait, déjà décidé de ce qu’il va acheter que dans d’autres domaines de la technologie, et cela peut entraîner des coûts erronés de plusieurs ordres de grandeur par rapport à ce qui est nécessaire.

Exemple : la plupart des fournisseurs de serveurs proposent un large éventail de serveurs, à la fois dans la famille x64 ainsi que des machines RISC à grande échelle et d’autres produits de niche. La plupart des fournisseurs de stockage proposent un petit sous-ensemble de produits de stockage, offrant uniquement du SAN ou uniquement du NAS, ou uniquement du stockage de classe “mainframe”, ou uniquement du stockage de petite taille non répliqué, etc. Seuls de très rares fournisseurs disposent d’un large assortiment de produits de stockage pour répondre à la plupart des besoins, et même les meilleurs d’entre eux n’ont pas une couverture de marché complète, touchant aussi bien le marché des plus petites PME que les marchés intermédiaire et entreprise.

Alors, comment procéder à partir de là ? De toute évidence, il s’agit d’un défi sérieux à surmonter.

L’option évidente, et que les structures ne doivent pas écarter, consiste à se tourner vers un consultant en stockage. Quelqu’un qui ne revend pas une solution ou, à tout le moins, qui ne revend pas une solution unique mais dispose d’un ensemble complet de solutions parmi lesquelles choisir et qui sera en mesure de fournir une solution à faible coût, à 1 000 $, aussi bien qu’une solution à 1 000 000 $ – quelqu’un qui comprend le NAS, le SAN, le stockage à montée en charge horizontale, la réplication, la bascule, etc. Lorsque vous vous adressez à votre consultant, ne partez pas du principe que vous connaissez vos coûts – il existe de très nombreux facteurs et, en les examinant attentivement, vous pourriez être en mesure de dépenser bien moins que ce que vous aviez anticipé. Mais ayez bien des budgets en tête, une aversion au risque bien documentée, des coûts pour les temps d’arrêt et un ensemble très complet de scénarios d’utilisation du stockage anticipés.

Mais se tourner vers un consultant n’est certainement pas la seule voie. Mener vos propres recherches, apprendre les bases et suivre un processus décisionnel structuré peut vous mener, sinon à la bonne solution, du moins bien avancé sur la bonne voie. Il y a quatre considérations majeures lorsque l’on examine le stockage : la fonction (comment le stockage est utilisé et accédé), la capacité, la vitesse et la fiabilité.

Le premier facteur, la fonction, est le plus négligé et le moins bien compris. En fait, bien qu’il s’agisse de la plus fondamentale des préoccupations, elle est souvent tout simplement balayée sous le tapis et oubliée. Nous pouvons répondre à cette question en nous demandant “Pourquoi achetons-nous du stockage ?”

Abordons cela de manière systématique. Il existe de nombreuses raisons pour lesquelles nous achèterons du stockage. En voici quelques-unes courantes : réduire les coûts par rapport au fait de disposer de grandes quantités de stockage localement sur des serveurs ou postes de travail individuels, centraliser la gestion des données, augmenter la performance et rendre les données plus disponibles en cas de défaillance d’un système.

Savoir lequel de ces facteurs, ou s’il existe un autre facteur non répertorié ici, vous pousse vers le stockage partagé est important, car cela fournira vraisemblablement un point de départ dans votre processus décisionnel. Tant que nous ne savons pas pourquoi nous avons besoin de stockage partagé, nous serons incapables d’examiner la fonction de ce stockage, qui, comme nous le savons déjà, est le facteur décisionnel le plus fondamental. Si vous ne parvenez pas à déterminer la fonction du stockage, alors on peut raisonnablement supposer que le stockage partagé n’est pas du tout nécessaire. N’ayez pas peur de prendre cette décision, la grande majorité des petites entreprises n’ont que peu ou pas besoin de stockage partagé.

Une fois que nous avons déterminé la fonction de notre stockage partagé, nous pouvons désormais, de façon relativement aisée, déterminer les besoins en capacité et en performance. La capacité est la fonction la plus simple et la plus évidente du stockage. La performance, ou vitesse, est facile à énoncer et à expliquer mais bien plus difficile à quantifier, car les IOPS sont, au mieux, un concept nébuleux et, au pire, totalement incompris. Les IOPS se déclinent en différentes variantes et il existe des préoccupations autour de l’accès aléatoire, de l’accès séquentiel, des débits en rafale, de la latence et des débits soutenus, puis viennent les différences entre la lecture et l’écriture ! Il est difficile de déterminer ne serait-ce que la performance nécessaire, sans parler de la performance attendue d’un appareil. Mais avec des recherches minutieuses, cela est réalisable et mesurable.

Notre dernier facteur est la fiabilité. Celui-ci, comme la fonctionnalité, semble être un point d’achoppement récurrent pour les professionnels de l’informatique qui cherchent à passer au stockage partagé. Il est important, que dis-je, absolument essentiel, de garder à l’esprit l’idée que le stockage est “juste un serveur de plus” et que les concepts de redondance et de fiabilité qui s’appliquent aux serveurs ordinaires s’appliquent tout autant aux systèmes de stockage partagé dédiés. Dans la quasi-totalité des cas, les systèmes de stockage d’entreprise sont construits sur des serveurs d’entreprise – même châssis, mêmes disques, mêmes composants. Ce qui prête souvent à confusion, c’est que même les PME se tourneront vers des systèmes de stockage de milieu ou de haut de gamme pour prendre en charge des serveurs bien plus bas de gamme, ce qui peut parfois faire apparaître les systèmes de stockage comme mystiques, de la même manière que les serveurs “big iron” peuvent sembler l’être pour quelqu’un habitué uniquement au matériel serveur grand public. Mais ne vous y trompez pas, les mêmes principes de fiabilité s’appliquent et vous devrez évaluer le risque exactement de la même manière que vous l’avez toujours fait (ou auriez dû le faire) pour déterminer quel équipement vous convient.

Prendre le temps d’évaluer, de rechercher et de comprendre les besoins en stockage est très important, car votre système de stockage restera vraisemblablement un composant central de votre réseau pendant très longtemps, en raison de son coût extrêmement élevé et de la complexité de son remplacement. Contrairement à la dernière version de Microsoft Office, l’achat d’un nouveau système de stockage partagé n’aura pas d’impact direct sur le poste de travail d’un dirigeant et manque donc aussi du clinquant nécessaire pour motiver des “mises à jour de fonctionnalités”.

Maintenant que nous avons nos options devant nous, nous pouvons commencer à examiner de vrais produits. Sur la base de nos recherches sur la fonctionnalité, nous devrions désormais être en mesure de déterminer si nous avons besoin de SAN, de NAS ou ni de l’un ni de l’autre. Dans de nombreux cas – bien plus que les gens ne le réalisent – aucun des deux n’est le bon choix. Souvent, ajouter des disques aux serveurs existants ou rattacher un châssis de disques DAS là où c’est nécessaire est plus rentable et plus fiable que de faire quelque chose de plus complexe. Cela ne doit pas être négligé. En fait, si le DAS convient au besoin à traiter, il serait rare que quoi que ce soit d’autre ait du sens. La simplicité est l’amie du responsable informatique.

Il existe de nombreux cas où le DAS ne répondra pas au besoin actuel. Le stockage partagé a certainement sa place, ne serait-ce que pour partager des fichiers entre utilisateurs de postes de travail. Avec les systèmes de virtualisation modernes d’aujourd’hui, le stockage partagé devient de plus en plus populaire – bien que là encore le DAS soit trop souvent évité, même lorsqu’il pourrait bien convenir aux besoins existants.

À de rares exceptions près, lorsqu’un stockage partagé est nécessaire, le NAS est la solution vers laquelle se tourner. NAS signifie Network Attached Storage (stockage en réseau). Le NAS imite le comportement d’un serveur de fichiers (le NAS est simplement un serveur de fichiers conditionné sous forme d’appliance), ce qui le rend facile à gérer et facile à comprendre. Le NAS tend à être très polyvalent, remplaçant les serveurs de fichiers traditionnels et étant souvent utilisé comme support partagé pour la virtualisation. Le NAS se caractérise par les protocoles NFS et CIFS, mais il n’est pas rare de voir également HTTP, FTP, SFTP, AFS et d’autres protocoles disponibles sur les appareils NAS. Le NAS fonctionne bien comme connecteur permettant aux systèmes Windows et UNIX de partager facilement des fichiers entre eux tout en n’ayant besoin de travailler qu’avec leurs propres protocoles natifs. Le NAS est couramment utilisé comme stockage partagé pour vSphere de VMWare, Citrix XenServer, Xen et KVM. Avec le NAS, il est facile d’utiliser votre stockage partagé dans de nombreux rôles différents et facile d’obtenir une bonne utilisation de votre système de stockage partagé.

Le NAS ne répond pas toujours à nos besoins. Certaines applications particulières ont encore besoin de stockage partagé mais ne peuvent pas utiliser les protocoles NAS. Les produits les plus notables concernés par ce problème sont HyperV de Microsoft, les bases de données et les clusters de serveurs. La réponse pour ces produits est le SAN. Le SAN, ou Storage Area Networking (réseau de stockage), est un concept difficile et, même dans le meilleur des cas, difficile à catégoriser. Comme le NAS, qui n’est qu’une manière différente de présenter des serveurs de fichiers traditionnels, le SAN n’est véritablement qu’une manière différente de présenter des disques en attachement direct. Si les différences entre le SAN et le DAS peuvent sembler évidentes, les différencier réellement est nébuleux au mieux et impossible au pire. Le SAN et le DAS partagent généralement les protocoles, les châssis, les limitations et les supports. De nombreux appareils SAN peuvent être rattachés et utilisés comme DAS. Et la plupart des appareils DAS peuvent être rattachés à un commutateur et utilisés comme SAN. En réalité, nous utilisons généralement ces termes pour désigner leur scénario d’utilisation plus qu’autre chose.

Le SAN est difficile à exploiter efficacement pour de nombreuses raisons. La première est qu’il est mal compris. Le SAN est en réalité simple – si simple qu’il est très difficile à saisir, ce qui le rend étonnamment complexe. Le SAN n’est en fait que du DAS abstrait, repartitionné et présenté de nouveau aux hôtes en tant que DAS. Le terme “stockage partagé” prête à confusion car, bien que la technologie SAN, comme le NAS, puisse permettre à plusieurs hôtes de se rattacher à un seul système de stockage, elle ne fournit aucune forme de médiation pour les hôtes rattachés au même système de fichiers. Le NAS est intelligent et gère cela, ce qui facilite le “partage” du stockage partagé. Le SAN ne le fait pas, il est trop simple. Le SAN est si simple que ce qui se produit en pratique, c’est simplement qu’un seul disque dur (aussi abstrait soit-il) est câblé aux contrôleurs de plusieurs hôtes. À l’époque où le stockage partagé signifiait rattacher deux serveurs à un seul câble SCSI, c’était facile à se représenter. Aujourd’hui, avec les abstractions du SAN et la banalité du NAS, la plupart des structures informatiques oublieront ce que fait le SAN et la catastrophe peut survenir.

Le SAN a sa place, à n’en pas douter, mais le SAN est complexe à utiliser et à administrer et très limitant. Souvent, il est également très coûteux. La règle empirique avec le SAN est la suivante : à moins d’avoir besoin du SAN, utilisez autre chose. C’est aussi simple que cela. Le SAN devrait être évité jusqu’à ce qu’il soit la seule option et, lorsque c’est le cas, il est la bonne option. Il est rarement, voire jamais, choisi pour des raisons de performance ou de coût car il sous-performe et coûte normalement plus cher que les autres options. Mais lorsque vous prenez en charge HyperV ou construisez un cluster de bases de données, rien d’autre ne sera une option pour vous. Pour la plupart des cas d’usage dans une PME, utiliser efficacement le SAN nécessitera de placer un NAS devant lui afin de partager le stockage.

Le NAS constitue la grande majorité des scénarios d’utilisation du stockage partagé. Il est simple, bien compris et il est flexible.

Beaucoup, sinon la plupart, des appliances de stockage partagé aujourd’hui prendront en charge à la fois le SAN et le NAS, et la différence entre les deux réside dans leur utilisation, leurs protocoles et leur philosophie plus qu’autre chose. Souvent, les appareils physiques sont similaires, sinon identiques, tout comme le sont aujourd’hui les technologies de connexion.

Plus que tout, il est important d’avoir des objectifs précis en tête lorsque l’on recherche du stockage partagé. Notez ces objectifs et examinez chaque technologie et chaque produit pour voir comment, ou si, ils répondent à ces objectifs. N’ayez pas recours à une prise de décision impulsive et ne vous fondez pas sur des supports marketing ou sur ce qui semble être une dynamique de marché. Commencez par déterminer si le stockage partagé est même un besoin. Si c’est le cas, déterminez si le NAS répond à vos besoins. Sinon, tournez-vous vers le SAN. Le stockage est un investissement considérable, prenez le temps d’examiner les alternatives, faites beaucoup de recherches et, seulement après avoir réduit le champ à quelques produits concurrents précis – tournez-vous vers les fournisseurs pour les détails finaux et les tarifs.

À lire également.

Quand une sauvegarde n'est pas une sauvegarde

Le point d'inflexion du RAID logiciel

Nouvelle hyperconvergence, ancien stockage