Eine kurze Einführung in die Fehlertoleranz

Last Updated: 2021-10-26
4.6
(23)
Zusammenfassung: Fehlertoleranz bedeutet die Fähigkeit des Systems, ununterbrochen weiterzuarbeiten, selbst wenn eine oder mehrere seiner Komponenten ausfallen. In diesem Artikel werden wir eine ausführlichere Einführung in die Fehlertoleranz geben.

Definition der Fehlertoleranz

Fehlertoleranz bezieht sich auf die Eigenschaft, die es dem System ermöglicht, auch dann ordnungsgemäß zu funktionieren, wenn einige seiner Komponenten ausfallen. Mit anderen Worten bedeutet Fehlertoleranz, wie ein Betriebssystem (OS) reagiert und Hardware- oder Software-Fehlfunktionen und -Ausfälle zulässt.

Die Fähigkeit des Betriebssystems, Fehler zu beheben und zu tolerieren, kann durch Software, Hardware oder eine Kombinationslösung, die Load Balancer nutzt, gehandhabt werden. Einige Computersysteme verwenden mehrere doppelte Fehlertoleranzsysteme, um Fehler ordnungsgemäß zu behandeln, was als fehlertolerantes Netzwerk bezeichnet wird.

Fehlertolerantes Computing umfasst mehrere Toleranzebenen:

  • Ter unterste Stufe:Die Fähigkeit, auf einen Stromausfall zu reagieren.
  • Ein Schritt nach obenoder Stärkungsstufe:Die Möglichkeit, das Backup-System sofort zu verwenden, wenn ein System ausfällt.
  • Erhöhte Stufe:Wenn eine Platte ausfällt, übernehmen sofort die gespiegelten Platten dafür. Diese Stufe bietet Funktionalität trotz teilweiser Systemausfälle oder erwarteter Verschlechterung anstelle eines sofortigen Ausfalls und Verlusts der Funktionalität.
  • Hohes Level:Mehrere Prozessoren arbeiten zusammen, um Daten zu scannen und auszugeben, um Fehler zu erkennen und diese dann sofort zu korrigieren.

Fehlertolerante Systeme verwenden Sicherungskomponenten, die ausgefallene Komponenten automatisch ersetzen, um sicherzustellen, dass keine Betriebsunterbrechung auftritt.

  • Hardwaresysteme haben das gleiche oder ein gleichwertiges Backup-Betriebssystem. Es ist fehlertolerant, dass ein Server mit demselben fehlertoleranten Server alle Operationen in einem Backup spiegelt und parallel läuft. Durch die Eliminierung eines Single Point of Failure kann Hardware-Fehlertoleranz in redundanter Form jede Komponente oder jedes System sicherer und zuverlässiger machen.
  • Softwaresysteme, die von anderen Softwareinstanzen gesichert werden. Wenn Benutzer beispielsweise die Kundendatenbank kontinuierlich replizieren und die erste Datenbank geschlossen wird, können Operationen in der primären Datenbank automatisch auf die zweite umgeleitet werden.
  • Wenn alternative Quellen bei Stromausfällen automatisch übernehmen können, kann redundante Stromversorgung helfen, Systemausfälle zu vermeiden und sicherzustellen, dass Dienste nicht verloren gehen.

FehlerTToleranzTTechniken

  1. Reproduzieren:Es stellt mehrere identische Instanzen desselben Systems oder Subsystems bereit, leitet Aufgaben oder Anfragen parallel an alle Instanzen und wählt die richtigen Ergebnisse basierend auf der Arbitrierung aus.
  2. Fehler-Oblivious Computing:Es ermöglicht, dass Computerprogramme trotz Fehlern weiter ausgeführt werden können, was in verschiedenen Kontexten angewendet werden kann.
  3. Erholungshirten:Es ist eine leichtgewichtige Technik, die es Softwareprogrammen ermöglicht, sich von ansonsten schwerwiegenden Fehlern zu erholen.
  4. Leistungsschalter:Dieses Entwurfsmuster ist eine Technik, um katastrophale Ausfälle in verteilten Systemen zu verhindern.

AnforderungenVon Fehlertoleranz

Im Folgenden sind die wichtigsten charakteristischen Anforderungen an die Fehlertoleranz aufgeführt:

  1. Kein Single Point of Failure:Fällt das System aus, muss es während der Reparatur ohne Unterbrechung weiterbetrieben werden.
  2. Fehlerisolierung auf die ausgefallene KomponenteS:Im Fehlerfall muss das System in der Lage sein, den Fehler auf die betroffene Komponente einzugrenzen. Dies erfordert das Hinzufügen von dedizierten Fehlererkennungsmechanismen, die nur für die Fehlerisolierung existieren. Die Wiederherstellung aus einem Fehlerzustand erfordert eine Klassifizierung von Fehlern oder fehlerhaften Komponenten
  3. Fehlereindämmung zur Vorbeugungdie Verbreitungdes Scheiterns:Einige Fehlermechanismen können Systemfehler durch die Ausbreitung von Fehlern auf den Rest des Systems verursachen. Der „Rogue Transmitter“ ist ein Beispiel für einen solchen Fehler, der zu einer legitimen Kommunikation im System führt und einen kompletten Systemausfall verursacht. Ein bösartiger Sender oder eine ausgefallene Komponente muss isoliert werden, um die Firewall des Systems oder andere Mechanismen zu schützen.
  4. Verfügbarkeit von Reversionsmodi.

NachteileVon Fehlertoleranz

  • Kosten.
  • Minderwertige Komponenten.
  • Störung der Fehlererkennung in einer anderen Komponente.
  • Störung der Fehlererkennung der gleichen Komponente.
  • Reduzierung der Priorität der Fehlerbeseitigung.
  • Schwierigkeit testen.

BeispieleVon Fehlertoleranz

Manchmal erfordert die Hardwarefehlertoleranz, dass beschädigte Teile entfernt und durch neue Teile ersetzt werden, während das System noch läuft. Solche Systeme, die unter Verwendung eines einzigen Backups implementiert werden, werden als Single-Point-Toleranz bezeichnet und stellen die überwiegende Mehrheit der fehlertoleranten Systeme dar.

Fehlertoleranz ist in Computeranwendungen erfolgreich. Tandem Computers bauen ihr gesamtes Geschäft auf solchen Computern auf, die eine Einzelpunkttoleranz verwenden, um ihre Nonstop-Systeme zu erstellen, die in Jahren aufgegriffen werden.

Eine ausfallsichere Architektur kann auch Computersoftware umfassen, wie beispielsweise Replikation durch Prozesse.

Die Datenformate können auch so gestaltet werden, dass sie sich natürlich verschlechtern. HTML ist beispielsweise aufwärtskompatibel, sodass Webbrowser, die sie nicht verstehen, ohne das Dokument unbrauchbar zu machen, neue HTML-Entitäten ignorieren können.

Wie nützlich war dieser Beitrag?

Klicken Sie auf einen Stern, um ihn zu bewerten!

Durchschnittliche Bewertung 4.6 / 5. Stimmenzahl: 23

Bisher keine Stimmen! Seien Sie der Erste, der diesen Beitrag bewertet.

Vorheriger Artikel

Was ist neu in Bitwar HEIC Converter für Mac V2.0.0 Zusammenfassung: Fehlertoleranz bedeutet die Fähigkeit des Systems, ununterbrochen weiterzuarbeiten, selbst wenn eine oder mehrere der...

Nächster Artikel

Quick Fix: Das Volume enthält keinen erkannten Dateisystemfehler Zusammenfassung: Fehlertoleranz bedeutet die Fähigkeit des Systems, ununterbrochen weiterzuarbeiten, selbst wenn eine oder mehrere der...

Über Bitwar-Datenwiederherstellung

3 Schritte, um mehr als 500 Arten von gelöschten, formatierten oder verlorenen Dokumenten, Fotos, Videos, Audios und Archivdateien aus verschiedenen Datenverlustszenarien zurückzubekommen.

Erfahren Sie mehr

Heiße Artikel

    In Verbindung stehende Artikel