Types de stockage informatique d'entreprise

Ces dernières années avec l'essor de la virtualisation et plus récemment avec Big Data (traitement de gros volumes de données) des variantes de solutions existantes sont apparues, couvrant de nouveaux besoins, offrant des capacités de stockage encore plus importantes et une plus grande redondance. Quelques exemples seraient le stockage maillé ou modulaire pour SAN et VTL.

Certaines de ces solutions existantes sont répertoriées ici :

NOUS VOULONS (Stockage à connexion directe)


Ce type de stockage peut être trouvé des PC domestiques aux serveurs. Le ou les disques sont connectés directement au bus de la carte mère. Généralement peu coûteux et n'est généralement pas optimisé en tant que référentiel d'informations car il est polyvalent. Stocke le système d'exploitation et tout autre logiciel qui doit être exécuté.

Pour améliorer sa fonctionnalité, avec deux ou plusieurs disques, il est possible de configurer différents types de RAID (Redundant Array of Independent Disks) en fonction des besoins de l'utilisateur. Dans tous les cas, les informations sont divisées en blocs et la manière de stocker ces blocs fait place à différentes configurations logiques.

RAID0 (Décapage)Les informations (blocs) sont divisées et réparties uniformément entre deux ou plusieurs disques. Il est généralement utilisé pour augmenter les performances (lecture/écriture) mais n'a aucune parité ou redondance, si un disque configuré en RAID0 tombe en panne, l'information est complètement perdue.

RAID1 (Mise en miroir)Il utilise également deux ou plusieurs disques, où les informations sont stockées en double (en miroir), donc il consomme deux fois plus de disques (un pour l'information et l'autre pour son miroir), c'est pourquoi c'est généralement l'option la plus chère économiquement .

La perte d'un membre de l'ensemble n'affecte pas la disponibilité de l'information.

RAID 0 + 1/1 + 0Combinaison des deux précédents. La vitesse du RAID0 et la redondance (et le coût) des disques RAID1 seront disponibles.

RAID5 (Avec parité simple)Vous avez besoin d'au moins trois disques. Il utilise une parité qui est répartie entre tous les membres. Le calcul du stockage disponible est le suivant : nombre total de disques moins un.

Si un disque tombe en panne, la parité distribuée est utilisée pour calculer les informations manquantes, ce qui entraîne une pénalité de performance mais les informations seront toujours accessibles.

RAID6 (Avec double parité)Configuration très similaire au RAID 5 mais il est possible d'accéder aux données même avec la perte de deux disques. Statistiquement parlant, la perte de données est beaucoup plus improbable, une probabilité estimée à 1 / 120 000 par rapport à RAID5 sur un groupe de disques fonctionnant depuis 5 ans.

Pour les deux configurations avec parité, lors du remplacement du ou des disques défaillants, le système devra reconstruire les informations en utilisant les autres disques. Cette période de temps dépendra du type de disques.
Concernant l'espace disponible, voici un tableau comparatif s'il s'agissait de 10 disques de 1To.

SAINT (Réseau de zones de mémorisation)


Il s'agit d'un réseau performant, dont l'objectif principal est de fournir aux systèmes informatiques une capacité de stockage élevée, allant de quelques téraoctets à des pétaoctets voire plus…

À l'origine, les SAN utilisaient exclusivement le protocole Fibre Channel où l'information circule à travers la fibre optique sous forme de faisceau lumineux, aujourd'hui iSCSI a également été incorporé à l'aide de câblage Ethernet et plus récemment de réseaux convergés FCoE, qui est le même protocole Fibre Channel mais encapsulé dans une IP. paquet. Les informations sont accessibles au niveau du bloc.

Les périphériques de stockage sont généralement composés de deux contrôleurs ou plus (redondants les uns par rapport aux autres) qui gèrent un ensemble de disques. Désormais également, il est possible de se connecter à ce réseau SAN pour les bibliothèques de sauvegarde, le stockage et les serveurs, entre autres.

Au moment de la concevoir un SAN il faudra considérer :

  • Comment assurer une haute disponibilité, que ce soit au travers de ses composants étant tous redondants (contrôleurs, commutateurs, câblage, alimentation, disques, etc.),
  • évolutivité, lors de la croissance si vous décidez de remplacer des pièces spécifiques de l'équipement, de le remplacer ou d'en acquérir un autre pour travailler ensemble.
  • Ou des caractéristiques spécifiques du produit qui correspondent à nos besoins. Chaque fabricant propose différents types de fonctionnalités et de licences.

SAINT (Stockage modulaire)


En règle générale, une configuration SAN se compose de deux contrôleurs fonctionnant en mode actif-actif (pour éviter les points de défaillance uniques) et d'un ensemble de disques configurés dans les types RAID mentionnés ci-dessus. Chaque contrôleur est multifonctionnel, indépendamment il pourra gérer la communication avec l'hôte, le cache interne et l'ensemble de disques. Face à la défaillance de l'un d'entre eux, le reste supportera la charge transactionnelle totale, dans la plupart des cas avec la diminution conséquente de la performance globale du système.

Rangement intérieur Le SAN est une option économiquement efficace, mais il s'accompagne d'une complexité d'évolutivité. Étant donné que deux contrôleurs ou nœuds sont le maximum pris en charge dans la plupart des configurations, pour étendre le schéma de stockage, les contrôleurs devront être remplacés par d'autres avec des performances plus élevées ou un autre SAN doit être ajouté avec le coût économique et administratif conséquent.

Ces dernières années, deux sociétés ont lancé un nouveau concept de stockage SAN sur le marché. Il s'agit d'un cluster multi-nœuds, où initialement, comme la configuration SAN standard, il est composé de deux nœuds multifonctions redondants. La principale différence réside dans une interconnexion des contrôleurs via des commutateurs former un maillage ou un réseau entre tous les membres. Les informations sont réparties entre tous les membres et sont accessibles depuis n'importe quel contrôleur, augmentant les performances à chaque fois qu'un nœud est ajouté.

Disques (Types de disques / connecteurs)

Canal de fibreC'est un protocole de transport qui transmet des commandes SCSI sur des canaux fibre. Chronologiquement, les disques Fibre Channel ont été les premiers à être utilisés dans les SAN. Ce type de connectivité haut débit permet jusqu'à 127 disques (contre 15 pour le SCSI) sur une distance allant jusqu'à 30 mètres.

Ils sont utilisés dans les centres de données de moyenne et haute performance, bien qu'aujourd'hui, en raison du coût des disques, l'industrie informatique ait tendance à utiliser SAS, laissant FC pour un créneau spécifique.

SCSI ou SAS connecté en sérieSerial Attached SCSI ou SAS remplace le SCSI (parallèle), qui est utilisé depuis plus de deux décennies. Avec des performances similaires aux disques FC, un coût moindre et soumis aux mêmes contrôles rigoureux sur ses composants, il a progressivement pu entrer dans le segment des entreprises haut de gamme.

NearLine SAS (NL-SAS)Était le répondre à la demande de stockage à faible coût en environnement d'entreprise. On pourrait dire qu'il s'agit de disques SATA avec un meilleur contrôle qualité et une interface SAS (héritant ainsi de ses fonctionnalités), par conséquent cela permet d'avoir de grandes capacités où la performance n'est pas la chose principale.

SSD d'entrepriseSSD d'entreprise (Enterprise Solid State Drive), bien que son coût par Go soit encore élevé Fournit les meilleures performances par rapport aux autres types de disques. En n'ayant pas de pièces mobiles, les temps d'accès à l'information sont considérablement réduits. Disponibles avec une interface SAS ou SATA et dans des capacités allant jusqu'au téraoctet, leur durée de vie est un peu plus courte qu'un disque SAS. Ils sont souvent utilisés comme mémoire cache.

D'une manière générale, il existe trois catégories de disques si on les classe selon leurs performances globales (IOPS, Input Output Per Second) : NL-SAS étant le plus lent et le SSD Entreprise à l'autre bout de la liste. Ce type de regroupement ou de superposition de performances est appelé niveaux.

Plusieurs fabricants proposent, embarquées dans le firmware de leurs contrôleurs ou via un logiciel, des fonctionnalités telles que la « hiérarchisation automatique », plaçant les informations les plus fréquemment consultées dans le groupe des appareils les plus rapides et au fur et à mesure que la demande diminue, elles seront réaffectées à d'autres appareils moins performants. et le coût.

NAS (Stockage en réseau)


Appelé également « serveur NAS », il s'agit d'un ordinateur de moindre valeur économique doté d'un système d'exploitation et/ou d'un logiciel optimisé pour le stockage d'informations accessibles au niveau du fichier. Vous n'avez pas besoin d'une infrastructure réseau particulière puisque la communication avec les clients se fait via TCP/IP et les protocoles utilisés pour partager les fichiers sont : CIFS (Common Internet File System) populaire dans l'environnement Windows ou NFS natif (Network File System) Linux.

Il est traditionnellement utilisé pour le partage de fichiers (documents et multimédia), l'audit, le référentiel, etc., même si récemment, sa disponibilité et ses performances s'étant améliorées, il est également souvent utilisé pour certains types de bases de données relationnelles et de virtualisation.

Malgré ses différences avec SAN, ils ne s'excluent pas mutuellement.

Sauvegarde (Sauvegarde sur bande)


C'est le plus ancien type de stockage de masse (et il est toujours utilisé !).
La sauvegarde sur bande a été soumise à des tests sévères tout au long de son existence, en particulier lorsque les technologies émergentes sont plus pratiques et plus rapides. Les bandes ont toujours apprécié d'avoir de grandes quantités de stockage par rapport à un disque dur, on parle de l'ordre de 15 To compressant les données (sur une bande LTO7 de dernière génération).

Avec la technologie d'aujourd'hui, chaque bande a une espérance de vie de 30 ans ou plus, ce qui en fait le support privilégié pour l'archivage des informations. Il est important de mentionner que chaque génération de bandes (LTO-x) a la compatibilité deux générations en arrière pour la lecture et une pour l'écriture.

Aujourd'hui, ils sont encore utilisés pour leur portabilité et leur rapport coût/bénéfice.

VTL (Bibliothèque de bandes virtuelles)
Ces dernières années, la sauvegarde sur disque a gagné en popularité en raison de la baisse des prix des disques et de la moindre intervention de l'utilisateur. En général, ses performances sont plus élevées car elles ne dépendent pas de la recherche séquentielle comme sur bande.

Il s'agit d'un périphérique qui communique avec le logiciel de sauvegarde se comportant comme une bibliothèque de bandes, mais le stockage se traduit par un ensemble de disques. Pour faire simple, c'est un hybride. Il a été quelque peu accepté dans les centres informatiques qui les utilisent comme étape intermédiaire avant le vidage sur bande, réduisant ainsi les fenêtres de sécurité et de restauration. Dans certains cas, il a été utilisé pour remplacer les robots de sauvegarde sans sacrifier le schéma en cours. Il existe plus d'un produit sur le marché qui remplit la même fonction mais qui est conceptuellement éloigné d'une librairie virtuelle.

wave wave wave wave wave