Une brève introduction à la tolérance aux pannes

Last Updated: 2021-10-26
4.6
(23)
Résumé: La tolérance aux pannes signifie la capacité du système à continuer à fonctionner sans interruption, même si un ou plusieurs de ses composants tombent en panne. Dans cet article, nous allons donner une introduction plus détaillée à la tolérance aux pannes.

Définition de la tolérance aux pannes

La tolérance aux pannes fait référence à la propriété qui permet au système de continuer à fonctionner correctement même en cas de défaillance de certains de ses composants. En d'autres termes, la tolérance aux pannes signifie comment un système d'exploitation (OS) réagit et permet des dysfonctionnements et des défaillances matérielles ou logicielles.

La capacité du système d'exploitation à récupérer et à tolérer les pannes peut être gérée par le biais d'un logiciel, d'un matériel ou d'une solution combinée qui exploite les équilibreurs de charge. Certains systèmes informatiques utilisent plusieurs systèmes de tolérance aux pannes en double pour gérer les pannes avec élégance, ce qu'on appelle un réseau tolérant aux pannes.

L'informatique tolérante aux pannes comprend plusieurs niveaux de tolérance :

  • Tle niveau le plus basLa capacité de répondre à une panne de courant.
  • Un pas en avantou niveau de renforcementLa possibilité d'utiliser le système de sauvegarde immédiatement en cas de défaillance d'un système.
  • Niveau amélioré :Lorsqu'un disque tombe en panne, les disques en miroir prennent immédiatement le relais. Ce niveau offre des fonctionnalités malgré les pannes partielles du système ou la dégradation attendue, plutôt qu'une panne et une perte de fonctionnalité immédiates.
  • Haut niveauPlusieurs processeurs collaborent pour analyser les données et les sorties afin de détecter les erreurs, puis les corriger immédiatement.

Les systèmes tolérants aux pannes utilisent des composants de sauvegarde qui remplacent automatiquement les composants défaillants pour garantir qu'aucune interruption de service ne se produise.

  • Les systèmes matériels ont le même système d'exploitation de sauvegarde ou un système d'exploitation équivalent. Il est tolérant aux pannes qu'un serveur avec le même serveur tolérant aux pannes reflète toutes les opérations dans une sauvegarde et s'exécute en parallèle. En éliminant un point de défaillance unique, la tolérance aux pannes matérielles sous forme redondante peut rendre n'importe quel composant ou système plus sûr et fiable.
  • Systèmes logiciels sauvegardés par d'autres instances logicielles. Par exemple, si les utilisateurs répliquent la base de données clients en continu, et si la première base de données se ferme, les opérations de la base de données primaire peuvent être automatiquement redirigées vers la seconde.
  • Si des sources alternatives peuvent automatiquement prendre le relais pendant les pannes de courant, une alimentation redondante peut aider à éviter les pannes du système et à garantir que les services ne sont pas perdus.

La fauteTtoléranceTtechniques

  1. RéplicationIl fournit plusieurs instances identiques du même système ou sous-système, dirige des tâches ou des demandes vers toutes les instances en parallèle et sélectionne les résultats corrects en fonction de l'arbitrage.
  2. Informatique insensible aux pannesIl permet aux programmes informatiques de continuer à s'exécuter malgré les erreurs, qui peuvent être appliquées dans différents contextes.
  3. Berger de récupérationIl s'agit d'une technique légère qui permet aux programmes logiciels de se remettre d'erreurs autrement fatales.
  4. Disjoncteur:Ce modèle de conception est une technique permettant d'éviter des défaillances catastrophiques dans les systèmes distribués.

Conditionsde la tolérance aux pannes

Voici les principales caractéristiques requises pour la tolérance aux pannes :

  1. Pas de point de défaillance uniqueSi le système tombe en panne, il doit continuer à fonctionner pendant la réparation sans interruption.
  2. Isolation des pannes sur le composant défaillants :En cas de panne, le système doit pouvoir isoler le défaut sur le composant concerné. Cela nécessite l'ajout de mécanismes de détection de pannes dédiés qui n'existent que pour l'isolation des pannes. La récupération d'un état de défaut nécessite la classification des défauts ou des composants défectueux
  3. Confinement des défauts pour éviterla propagationde l'échecCertains mécanismes de défaillance peuvent provoquer des défaillances du système par la propagation des défauts au reste du système. Le « transmetteur malveillant » est un exemple d'une telle défaillance qui conduit à une communication légitime dans le système et provoque une défaillance complète du système. Un émetteur malveillant ou un composant défaillant doit être isolé pour protéger le pare-feu du système ou d'autres mécanismes.
  4. Disponibilité des modes de réversion.

Disadvantagesde la tolérance aux pannes

  • Coût.
  • Composants inférieurs.
  • Interférence avec la détection de défaut dans un autre composant.
  • Interférence avec la détection de défaut du même composant.
  • Réduction de la priorité de la correction des défauts.
  • Testez la difficulté.

Exemplesde la tolérance aux pannes

Parfois, la tolérance aux pannes matérielles exige que les pièces endommagées soient retirées et remplacées par de nouvelles pièces pendant que le système fonctionne encore. De tels systèmes mis en œuvre à l'aide d'une sauvegarde unique sont appelés tolérance à point unique et représentent la grande majorité des systèmes tolérants aux pannes.

La tolérance aux pannes réussit dans les applications informatiques. Tandem Computers construit toute son activité sur de tels ordinateurs, qui utilisent une tolérance de point unique pour créer leurs systèmes non-stop, qui sont récupérés au fil des années.

Une architecture à sécurité intégrée peut également inclure des logiciels informatiques, tels que la réplication via des processus.

Les formats de données peuvent également être conçus pour se dégrader naturellement. Par exemple, HTML est conçu pour être compatible avec l'avenir, permettant aux navigateurs Web qui ne les comprennent pas sans rendre le document inutilisable d'ignorer les nouvelles entités HTML.

À quel point ce message vous a-t-il été utile ?

Cliquez sur une étoile pour la noter !

Note moyenne 4.6 / 5. Décompte des votes : 23

Aucun vote pour l'instant ! Soyez le premier à noter ce post.

Article précédent

What’s New in Bitwar HEIC Converter for Mac V2.0.0 Résumé : La tolérance aux pannes signifie la capacité du système à continuer à fonctionner sans interruption, même si un ou plusieurs des...

article suivant

Quick Fix: The Volume Does Not Contain A Recognized File System Error Résumé : La tolérance aux pannes signifie la capacité du système à continuer à fonctionner sans interruption, même si un ou plusieurs des...

About Bitwar Data Recovery

3 Steps to get back 500+ kinds of deleted, formatted or lost documents, photos, videos, audios, archive files from various data loss scenarios.

Learn More

Articles chauds

    Articles Liés