Zusammenfassung
Im Jahre 1976 lieferte TANDEM sein erstes System T16 aus. Dieses war das erste kommerziell nutzbare Standard-Non-Stop-System.
Die Non-Stop Funktionen werden im Bereich der Hardware durch Vervielfachung der einzelnen Komponenten erreicht. Im Fehlerfall können die Aufgaben der ausgefallenen Komponente auf die noch vorhandenen Komponenten (z. B. Prozessoren) verteilt werden.Im Normalfall führen alle Komponenten ihre eigenen Aufgaben aus (= aktive Redundanz). Stromausfall bis zu 80 min wird über Batteriepuffer toleriert.
Die Behandlung der Hardwarefehler und qqf. die Umschaltunq auf andere Hardwarekomponenten wird vom Betriebssystem GUARDIAN durchgeführt. Statusinformationen und Daten werden über Checkpointing auch an andere prozessoren übertragen.
Für die Anwenderprogramme gibt es neben dem normalen Verarbeitungsmodus zwei Möglichkeiten der Non-Stop Verarbeitung:
-
a)
durch Checkpoints
-
b)
unter der Kontrolle von TMF. Hierbei ist die Datenkonsistenz auch bei Mehrfachfehlern, Programmfehlern und bei Netzwerk-Fehlern gewährleistet.
Summary
The TANDEM System T16 was shipped in 1976 as the first “non-stop” computer system available for commercial use.
Fault tolerance is achieved from a hardware viewpoint by duplicating critical system components. In the case of a single component failure during system operating the work previously done by the failed component (e. g. a processor module) is redistributed across the still remaining components and processing continues. Battery backup allows for the toleration of power loss forup to approx. 80 minutes.
The handling of hardware errors e.g. loss of a processor module, and the subsequent reassignment of hardware resources are automatically executed by the GUARDIAN operating system. Critical information pertinent to an executing program are sent from the primary process in a process pair to it’s backup (in another processor) in the form of checkpoints.
For applications software there are two methods to achieve fault tolerance:
-
a)
By defining restart points within the program (checkpoints).
-
b)
By employing the services of TMF (Transaction Monitor Facility) for ensuring database consistency in the case of both single and multiple component failures as well as errors in the application program. These database integrity functions are also fully supported for operation within a network of system.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
Author information
Authors and Affiliations
Editor information
Editors and Affiliations
Rights and permissions
Copyright information
© 1984 Springer-Verlag Berlin Heidelberg
About this paper
Cite this paper
Schulz, A. (1984). Das Fehlertolerante System Tandem T16. In: Belli, F., Pfleger, S., Seifert, M. (eds) Software-Fehlertoleranz und -Zuverlässigkeit. Informatik-Fachberichte, vol 83. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-642-69705-0_18
Download citation
DOI: https://doi.org/10.1007/978-3-642-69705-0_18
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-540-13383-4
Online ISBN: 978-3-642-69705-0
eBook Packages: Springer Book Archive