Detailseite
Projekt Druckansicht

Simulator-Framework für Laufzeit- und Energievorhersage von massiv parallelen Message-Passing-Programmen

Fachliche Zuordnung Rechnerarchitektur, eingebettete und massiv parallele Systeme
Hardwaresysteme und -architekturen für die Informationstechnik und die Künstliche Intelligenz, Quantentechnische Systeme
Förderung Förderung seit 2026
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 545776403
 
Das Teilprojekt der Forschergruppe Mod4Comp beinhaltet die Entwicklung eines architekturübergreifenden Simulations-Frameworks, das in der Lage ist, massiv-parallele Anwendungen mit Millionen von Threads unter Berücksichtigung der Performance- und Energieeigenschaften der Hardware-Software-Interaktion zu simulieren. Der Simulator wird die Dynamik paralleler Programme auf aktuellen Supercomputern reproduzieren und es erlauben, hypothetische parallele Programme auf zukünftigen Hochleistungssystemen ressourcenschonend zu untersuchen. Diese Lösung wird schneller sein als traditionelle Ansätze zur MPI-Simulation, da kein Code auf realen Zielsystemen ausgeführt wird. Das Simulator-Framework wird verschiedene Ansätze zur Generierung von Anwendungsblaupausen ermöglichen, die von anwendungszentrierten Teilprojekten entwickelt werden. Zunächst wird eine domänenspezifische eingebettete Sprache (DSEL) für die Konstruktion von Blaupausen entwickelt, da Traces keine verlässlichen Informationen über Abhängigkeiten zwischen den Prozessen enthalten und von vielen Effekten überlagert werden, wie z.B. Systemrauschen, Variationen in MPI-Implementierungen usw. Ebenso wird eine kompakte und intuitive Annotations-Sprache erarbeitet, um die halbautomatische Erstellung von Anwendungsentwürfen durch statische Analyse zu erleichtern und manuelle Nacharbeit zu reduzieren. Schließlich werden auch Traces aus realen Anwendungsläufen auf der Zielhardware für die Blaupausengenerierung verwendet. Das Projekt wird den ersten analytisch-modellbasierten Simulator entwickeln, der Anwendungscodes verarbeiten kann, die sowohl rechen- als auch speichergebundene numerische Schleifen enthalten. Die wichtigste Neuerung dieses Simulators ist sein umfassender Anwendungsbereich; er wird eine automatisierte Version der analytischen ab-initio White- oder Gray-Box-Modellierungsansätze sein, die in anderen Teilprojekten für die gesamte Hierarchie paralleler Systeme entwickelt wurden, einschließlich Kernen, Chips, Knoten, Netzwerken, Clustern, ihren individuellen inhärenten Engpässen und den Wechselwirkungen zwischen ihnen. Der ganzheitliche Ansatz wird eine modellbasierte Exploration des Entwurfsraumes moderner paralleler Systeme ermöglichen, inklusive des Zusammenspiels der verschiedenen Komponenten. Die Validierung der komplexen Vorhersagen und die Architektur- und Anwendungsexploration im Simulator werden in enger Zusammenarbeit mit den anwendungs- und modellzentrierten Teilprojekten durchgeführt. Die Schnittstellen für modellübergreifende Abhängigkeiten werden durch den Beauftragten der Forschergruppe für das Koordinationsprojekt koordiniert. Die Validierung wird mit Anwendungen durchgeführt, die auf den aktuellen heterogenen HPC-Architekturen (CPUs, GPGPUs, FPGAs) und neuromorphen Plattformen laufen. Sie erfolgt über die Messung der Zeit, des Datenvolumens, der Leistungsaufnahme und anderer grundlegender und abgeleiteter Metriken unter Verwendung von Leistungswerkzeugen wie z.B. LIKWID oder lo2s.
DFG-Verfahren Forschungsgruppen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung