04 72 14 18 00 Devis (0) Devis
Devis 0 Devis

Définition RAID

 

Très présent en Informatique Industrielle, le terme RAID est l'acronyme de "Redundant Array of Independent Disks", qui signifie littéralement "Regroupement Redondant de Disques Indépendants". Il ne s'agit de rien d'autre que de créer un système de stockage de données utilisant plusieurs unités de stockage entre lesquelles les données sont distribuées ou répliquées.

La technologie RAID est divisée en configurations appelées "tiers", grâce auxquelles nous pouvons obtenir différents résultats en termes de possibilités de stockage d'informations. Pour des raisons pratiques, nous allons considérer un RAID comme un seul magasin de données, comme s'il s'agissait d'une seule unité logique, bien qu'il contienne plusieurs disques durs physiquement indépendants. Ces unités de stockage peuvent être soit des disques durs mécaniques (HDD), soit des disques durs solides (SSD).

L'objectif ultime du RAID est de fournir :

  • Performance : accès distribué, hausse des taux I/O et du débit.
  • Capacité : agrégation des volumes en une seule entité.
  • Redondance : continuité de service en cas de défaillance.

Exemples de PC industriels dotés d'un systèmes RAID

Comment fonctionne un système RAID ?

 

Un système RAID fonctionne en plaçant les données sur plusieurs disques durs, et en permettant aux opérations d'entrée et de sortie (E/S) de fonctionner de manière équilibrée, ce qui améliore les performances.

En d'autres termes, soit les données sont écrites sur les deux disques en même temps, soit les données sont écrites sur un disque et les données sont écrites sur un autre disque pour répartir la charge de travail. Les systèmes RAID sont présentés au système d'exploitation comme s'il s'agissait d'un seul disque logique, puisqu'ils sont constitués d'un seul volume.

Pour qu'un système RAID fonctionne, un contrôleur RAID doit être présent, qu'il soit matériel ou logiciel. Aujourd'hui, la grande majorité des PC utilisateurs disposent déjà d'un contrôleur RAID logiciel intégré au BIOS de la carte mère. En fait, les contrôleurs matériels ne sont plus utilisés que dans les environnements d'entreprise.

RAID matériel

  • Géré par un contrôleur dédié, souvent équipé de cache de parité, pour de meilleures performances.
  • Faible utilisation CPU, adapté aux environnements serveur/NAS/DAS.

RAID logiciel

  • Géré par le CPU via le système d'exploitation (Windows, Linux MD RAID,...).
  • Coût réduit, plus flexible, mais plus gourmand en CPU et parfois moins portable entre plateformes.

Les niveaux de RAID

 

Il existe de nombreux types de système RAID, bien que la plupart d'entre eux soient déjà en désuétude en raison de leur peu ou pas d'utilité par rapport aux autres, ci-dessous un tableau récapitulatif des niveaux de RAID les plus utilisés..

Niveaux de RAID les plus utilisés

Niveau RAID Nb mini de disques Capacité utile Redondance Tolérance aux pannes
RAID 0 2 100% Aucune Aucune - si un disque tombe, tout est perdu
RAID 1 2 50% (1 disque sur 2) Mirroring (copie exacte) 1 disque peut tomber
RAID 5 3 (N–1) disques Parité (sauvegarde intelligente) 1 disque peut tomber
RAID 6 4 (N–2) disques Double parité 2 disques peuvent tomber
RAID 10 4 50% Mirroring + performance Plusieurs disques peuvent tomber (si un par paire)

 

RAID 0

Le premier RAID que nous avons est ce que l'on appelle le RAID niveau 0 ou "striping". Dans ce cas, il n'y a pas de redondance des données, car la fonction de ce niveau est de répartir les données stockées entre les différents disques durs connectés à l'équipement. L'objectif de la mise en œuvre d'un RAID 0 est de fournir de bonnes vitesses d'accès aux données qui sont stockées sur les disques durs, puisque l'information est répartie de manière égale sur ceux-ci pour avoir un accès simultané à plus de données avec leurs disques fonctionnant en parallèle.

Le RAID 0 n'a pas d'information de parité ni de redondance des données, donc si l'une des unités de stockage se casse, nous perdrons toutes les données qui étaient à l'intérieur, à moins que nous n'ayons fait des copies de sauvegarde externes à cette configuration.

Pour réaliser un RAID 0, il faut faire attention à la taille des disques durs qui le composent. Dans ce cas, c'est le plus petit disque dur qui déterminera l'espace ajouté au RAID. Si nous avons un disque dur de 1 To et un disque dur de 500 Go dans la configuration, la taille de l'ensemble fonctionnel sera de 1 To, en prenant le disque dur de 500 Go et un autre 500 Go du disque de 1 To. C'est pourquoi il est idéal d'utiliser des disques durs de la même taille pour pouvoir utiliser tout l'espace disponible dans la matrice conçue.

 

RAID 1

Cette configuration, également appelée "mirroring", "shadowing" ou "duplexing", est l'une des plus couramment utilisées pour assurer la redondance des données et une bonne tolérance aux pannes. Dans ce cas, il s'agit de créer un magasin de données en miroir sur deux disques durs, ou deux ensembles de disques durs. Lorsque nous stockons une donnée, elle est immédiatement répliquée sur son disque miroir, de sorte que nous avons les mêmes données stockées deux fois.

Aux yeux du système d'exploitation, nous n'avons qu'une seule unité de stockage, à laquelle nous accédons pour lire les données qu'elle contient. Mais en cas de défaillance de celui-ci, il recherchera automatiquement les données sur le disque miroir. Il est également intéressant d'augmenter la vitesse de lecture des données, car nous pouvons lire les informations simultanément sur les deux disques miroirs.

 

RAID 5

Également appelé système distribué avec parité. Ce niveau est aujourd'hui plus fréquemment utilisé que les niveaux 2, 3 et 4, notamment dans les dispositifs NAS. Dans ce cas, les informations sont stockées dans des blocs qui sont répartis entre les disques durs qui composent le RAID.

En outre, un bloc de parité est généré afin d'assurer la redondance et de pouvoir reconstruire les informations au cas où un disque dur serait corrompu. Ce bloc de parité sera stocké dans un lecteur différent de celui des blocs de données impliqués dans le bloc calculé, de sorte que les informations de parité seront stockées dans un lecteur différent de celui des blocs de données impliqués. 

Dans ce cas, nous aurons également besoin d'au moins trois unités de stockage pour assurer la redondance des données avec parité, et une seule défaillance d'unité sera tolérée à la fois. Si deux se cassent simultanément, nous perdrons les informations de parité, et au moins un des blocs de données concernés. Il existe une variante RAID 5E dans laquelle un disque dur de rechange est introduit pour minimiser le temps de reconstruction des données en cas de défaillance de l'un des disques primaires.

 

RAID 6

RAID 6 est essentiellement une extension de RAID 5, où un autre bloc de parité est ajouté pour obtenir un total de deux. Les blocs de données seront à nouveau répartis sur des lecteurs distincts et les blocs de parité seront également stockés sur deux lecteurs distincts. De cette façon, le système sera tolérant aux pannes pour un maximum de deux unités de stockage, mais par conséquent, nous aurons besoin de quatre unités pour former un RAID 6E. Dans ce cas, il existe également une variante RAID 6E ayant le même objectif que le RAID 5E.
 

RAID 1+0 ou RAID 10

RAID 10 ou partitionnement en miroir. C'est un niveau principal de type 0 qui répartit les données stockées entre les différents sous-niveaux. Nous avons plusieurs sous-niveaux de type 1 qui sont chargés de répliquer les données sur les disques durs qu'ils contiennent. Dans ce cas, la tolérance aux pannes permet de casser tous les disques d'un sous-niveau sauf un, et il faudra qu'il reste au moins un disque sain dans chacun des sous-niveaux pour ne pas perdre d'informations.
 

Les autres RAID

 

RAID 2

Ce niveau RAID est rarement utilisé, car il est essentiellement basé sur un stockage distribué sur plusieurs disques au niveau des bits. À son tour, un code d'erreur est créé à partir de cette distribution de données et stocké sur des lecteurs exclusivement destinés à cet effet. De cette façon, tous les disques du stockage peuvent être surveillés et synchronisés pour la lecture et l'écriture de données. Comme les disques d'aujourd'hui sont déjà équipés d'un système de détection des erreurs, cette configuration est contre-productive et le système de parité est utilisé.

 

RAID 3

Cette configuration n'est pas non plus utilisée actuellement. Elle consiste à répartir les données au niveau de l'octet dans les différentes unités qui forment le RAID, à l'exception d'une seule, où sont stockées les informations de parité afin de pouvoir joindre ces données lors de leur lecture. De cette façon, chaque octet stocké dispose d'un bit de parité supplémentaire pour identifier les erreurs et pouvoir récupérer les données en cas de perte d'un disque. L'avantage de cette configuration est que les données sont réparties sur plusieurs disques et que l'accès à l'information est très rapide, autant de disques en parallèle qu'il y a de disques. Pour configurer ce type de RAID, vous avez besoin d'au moins 3 disques durs.

 

RAID 4

Il s'agit également de stocker les données réparties en blocs entre les disques de stockage, en laissant l'un d'entre eux pour stocker les bits de parité. La différence fondamentale avec le RAID 3 est que si un disque est perdu, les données peuvent être reconstruites en temps réel grâce aux bits de parité calculés. Il vise à stocker de gros fichiers sans avoir besoin de redondance, mais l'enregistrement des données est plus lent précisément parce qu'il faut effectuer ce calcul de parité à chaque fois que quelque chose est enregistré.

 

RAID 50

Le RAID 50 est un niveau RAID 0 principal qui divise les données des sous-tiers configurés en RAID 5, avec leurs trois disques durs respectifs. Dans chaque bloc RAID 5, nous aurons une série de données avec leur parité correspondante. Dans ce cas, un disque dur peut tomber en panne dans chaque RAID 5, et il garantira l'intégrité des données, mais si plusieurs tombent en panne, nous perdrons les données qui y sont stockées.

 

RAID 100 et RAID 101

On peut avoir non seulement une arborescence à deux niveaux, mais aussi une arborescence à trois niveaux, et c'est le cas du RAID 100 ou 1+0+0. Il est constitué de deux sous-niveaux RAID 1+0 divisés à leur tour par un niveau principal également en RAID 0. De la même manière, nous pouvons avoir un RAID 1+0+1, formé par plusieurs sous-niveaux RAID 1+0 mis en miroir par un RAID 1 comme RAID principal. Leur vitesse d'accès et leur redondance sont très bonnes, et ils offrent une bonne tolérance aux pannes, bien que la quantité de disques à utiliser soit considérable par rapport à l'espace disponible.

Performances & tolérance (2025)

  • RAID 0 : lecture/écriture distribuée = gain linéaire, perte totale si disque failing.
  • RAID 1 : lecture distribuée, écriture limitée au plus lent, tolérance d’un disque.
  • RAID 5 : bonne lecture, écriture ralentie à cause des calculs de parité, reconstruction lente pour les gros disques.
  • RAID 6 : sécurisation forte (2 disques), overhead plus important.
  • RAID 10 : performances élevées et redondance solide ; coûteux en disques.
     

Cas d'usages & recommandations

  • Serveurs critiques / base données : RAID 10 ou RAID 6, contrôleur matériel, SSD NVMe.
  • Stockage domestique / NAS : RAID 1 ou RAID 5 (RAID 6 si gros volumes).
  • Cache / temporaires : RAID 0 avec sauvegardes externes.
  • VM / virtualisation : RAID 10 pour combiner performance et fiabilité.

Conclusion

Le RAID reste une brique incontournable pour les architectures nécessitant performance et sécurité, mais doit être appliqué judicieusement. En 2025, les configurations recommandées sont :

  • RAID 10 pour les charges massives.
  • RAID 6 pour gros stockage avec sécurité double.
  • RAID 5 pour usages modérés.

Même si le RAID améliore la tolérance aux pannes, il ne garantit pas à lui seul la protection totale des données, pour cela, vous devez toujours les coupler à des sauvegardes régulières et externes, ainsi que du matériel à jour (contrôleur, firmware, disques) !

Demande d'informations complémentaires