Detailseite
Projekt Druckansicht

Analyse und Entwurf von Fehlertoleranzstrategien für ein transaktionales verteiltes Betriebssystem

Fachliche Zuordnung Rechnerarchitektur, eingebettete und massiv parallele Systeme
Förderung Förderung von 2005 bis 2010
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 18510134
 
Aktuelle PC-Cluster Systeme konzentrieren sich auf die Bereitstellung hoher Rechenleistung und Ausfallsicherheit für Dienste. Letztere wird durch redundante Maschinen erreicht, die im Fehlerfall die Aufgabe von ausgefallenen Knoten übernehmen. Alternativ hierzu können verteilte Programme auch explizit Fehlertoleranz und Wiederanlauf Strategien implementieren oder entsprechende Middleware-Software verwenden. Hierbei wird in der Regel auf Softwareebene ein Schnappschuss des Zustands des Clusters, ein so genannter Sicherungspunkt (engl. Checkpoints), abgespeichert. Im Fehlerfall fällt der Cluster somit nicht auf den initialen Zustand, sondern auf den letzten Sicherungspunkt zurück und beginnt von dort wieder seine Arbeit. Sicherungspunktverfahren wurden ausgiebig erforscht, stoßen jedoch schnell an Aufwandsgrenzen, die sich trotz harter Forschungsanstrengungen über Jahrzehnte als vergleichsweise hart erwiesen haben. Wesentlich ist hierbei, dass die verwendeten Betriebssysteme weder für den Cluster-Betrieb, noch im Hinblick auf verteilte Fehlertoleranz entworfen wurden. Letzteres betrifft einerseits die Zustandssicherung, die auch Informationen im Betriebssystemkern (z.B. gesetzte Sperren) einschließt, sowie andererseits auch die oft schwierige Rücksetzung der Kernstrukturen im Fehlerfall. Durch die Vorarbeiten der Antragsteller gibt es stichhaltige Gründe anzunehmen, dass in einem verteilten Betriebssystem mit transaktionalem verteiltem Speicher (TVS) diese Aufwandsgrenzen elegant überwunden werden können. Da das Betriebssystem selbst im TVS untergebracht ist vereinfacht sich die Zustandssicherung erheblich und die Rücksetzungsfähigkeit ist eine Grundeigenschaft des TVS.
DFG-Verfahren Sachbeihilfen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung