Project Details
Analyse und Entwurf von Fehlertoleranzstrategien für ein transaktionales verteiltes Betriebssystem
Applicant
Professor Dr. Peter Schulthess
Subject Area
Computer Architecture, Embedded and Massively Parallel Systems
Term
from 2005 to 2010
Project identifier
Deutsche Forschungsgemeinschaft (DFG) - Project number 18510134
Aktuelle PC-Cluster Systeme konzentrieren sich auf die Bereitstellung hoher Rechenleistung und Ausfallsicherheit für Dienste. Letztere wird durch redundante Maschinen erreicht, die im Fehlerfall die Aufgabe von ausgefallenen Knoten übernehmen. Alternativ hierzu können verteilte Programme auch explizit Fehlertoleranz und Wiederanlauf Strategien implementieren oder entsprechende Middleware-Software verwenden. Hierbei wird in der Regel auf Softwareebene ein Schnappschuss des Zustands des Clusters, ein so genannter Sicherungspunkt (engl. Checkpoints), abgespeichert. Im Fehlerfall fällt der Cluster somit nicht auf den initialen Zustand, sondern auf den letzten Sicherungspunkt zurück und beginnt von dort wieder seine Arbeit. Sicherungspunktverfahren wurden ausgiebig erforscht, stoßen jedoch schnell an Aufwandsgrenzen, die sich trotz harter Forschungsanstrengungen über Jahrzehnte als vergleichsweise hart erwiesen haben. Wesentlich ist hierbei, dass die verwendeten Betriebssysteme weder für den Cluster-Betrieb, noch im Hinblick auf verteilte Fehlertoleranz entworfen wurden. Letzteres betrifft einerseits die Zustandssicherung, die auch Informationen im Betriebssystemkern (z.B. gesetzte Sperren) einschließt, sowie andererseits auch die oft schwierige Rücksetzung der Kernstrukturen im Fehlerfall. Durch die Vorarbeiten der Antragsteller gibt es stichhaltige Gründe anzunehmen, dass in einem verteilten Betriebssystem mit transaktionalem verteiltem Speicher (TVS) diese Aufwandsgrenzen elegant überwunden werden können. Da das Betriebssystem selbst im TVS untergebracht ist vereinfacht sich die Zustandssicherung erheblich und die Rücksetzungsfähigkeit ist eine Grundeigenschaft des TVS.
DFG Programme
Research Grants
Participating Person
Professor Dr. Michael Schöttner