Methodik, die basierend auf die Analyse von Ausführungs-Traces von Anwendungen und Problemsymmetrien eine bessere Abbildung auf heterogene Multiprozessor-Systeme ermöglicht
Zusammenfassung der Projektergebnisse
Die abnehmende Effizienz von Single-Core-Architekturen um 2005 markierte einen einen Wendepunkt in der Computertechnik. Seitdem haben sich Multicore-Systeme in allen Arten von Geräten verbreitet, was zu einem Boom bei Modellen und Methoden, die sich mit der effizienten Programmierung von parallelen Architekturen. Während sich die Industrie für Erweiterungen etablierter Sprachen (z. B. OpenMP) entschied, sind Programmiermodelle mit formalen Eigenschaften im akademischen Bereich beliebter. Insbesondere die Datenfluss- Programmiermodelle aus den 1970er Jahren haben in jüngster Zeit wieder an Interesse gewonnen und sind heute Gegenstand zahlreicher Forschungsarbeiten in den Bereichen Bereich der eingebetteten und allgemeinen Anwendungen. Ein zentrales Forschungsproblem ist die Berechnung einer optimalen Abbildung von einer Anwendungsbeschreibung auf eine parallele Hardware-Plattform, einschließlich der die Platzierung von Berechnungen auf Kernen, die Kommunikation mit Speichern und Kommunikation zu Speichern und Verbindungen sowie die Entscheidung über die Ausführungsreihenfolge. Die Anwendungen haben sich so entwickelt, dass sie nicht nicht immer durch statische Modelle beschrieben werden können, d. h., für die statische Analyse ausreicht, um ein optimales Mapping zu berechnen. Ein gängiger Ansatz zur Bewältigung dieser Dynamik besteht in der Analyse von Ausführungstraces einer Anwendung, um das Mapping besser anpassen zu können. Bei den kommenden größeren Systemen und dynamischeren Anwendungen ist es wichtig, die Trace-Analyse und Trace-basierte Mapping-Methoden zu verbessern. In diesem Projekt haben wir (i) dynamische Datenflussgraphen im Kontext von 4G/5G-Netzwerken untersucht, (ii) adaptive Mappings entwickelt, die sich mit der Veränderung der Arbeitslast ändern, (iii) einen Rahmen für die Charakterisierung und Ausnutzung von Problemsymmetrien entwickelt, (iv) Entwicklung neuartiger Mapping-Algorithmen zur Kompilier- und Laufzeit, die die Problemsymmetrien ausnutzen, (v) ein Open-Source-Rahmenwerk mit allen Methoden für Erweiterbarkeit und Reproduzierbarkeit bereitgestellt.
Projektbezogene Publikationen (Auswahl)
-
Symmetry in Software Synthesis. ACM Transactions on Architecture and Code Optimization, 14(2), 1-26.
Goens, Andrés; Siccha, Sergio & Castrillon, Jeronimo
-
TETRiS. Proceedings of the 20th International Workshop on Software and Compilers for Embedded Systems, 11-20. ACM.
Goens, Andrés; Khasanov, Robert; Castrillon, Jeronimo; Hähnel, Marcus; Smejkal, Till & Härtig, Hermann
-
On Compact Mappings for Multicore Systems. Lecture Notes in Computer Science, 325-335. Springer International Publishing.
Goens, Andrés; Menard, Christian & Castrillon, Jeronimo
-
Magnetic Racetrack Memory: From Physics to the Cusp of Applications Within a Decade. Proceedings of the IEEE, 108(8), 1303-1321.
Blasing, Robin; Khan, Asif Ali; Filippou, Panagiotis Ch.; Garg, Chirag; Hameed, Fazal; Castrillon, Jeronimo & Parkin, Stuart S. P.
-
Modem Design in the Era of 5G and Beyond: The Need for a Formal Approach. 2020 27th International Conference on Telecommunications (ICT), 1-5. IEEE.
Wittig, Robert; Goens, Andres; Menard, Christian; Matus, Emil; Fettweis, Gerhard P. & Castrillon, Jeronimo
-
Optimizing Tensor Contractions for Embedded Devices with Racetrack and DRAM Memories. ACM Transactions on Embedded Computing Systems, 19(6), 1-26.
Khan, Asif Ali; Rink, Norman A.; Hameed, Fazal & Castrillon, Jeronimo
-
Polyhedral Compilation for Racetrack Memories. IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems, 39(11), 3968-3980.
Khan, Asif Ali; Mewes, Hauke; Grosser, Tobias; Hoefler, Torsten & Castrillon, Jeronimo
-
BLOwing Trees to the Ground: Layout Optimization of Decision Trees on Racetrack Memory. 2021 58th ACM/IEEE Design Automation Conference (DAC), 1111-1116. IEEE.
Hakert, Christian; Khan, Asif Ali; Chen, Kuan-Hsun; Hameed, Fazal; Castrillon, Jeronimo & Chen, Jian-Jia
-
Domain-specific Hybrid Mapping for Energy-efficient Baseband Processing in Wireless Networks. ACM Transactions on Embedded Computing Systems, 20(5s), 1-26.
Khasanov, Robert; Robledo, Julian; Menard, Christian; Goens, Andrés & Castrillon, Jeronimo
-
Mocasin—Rapid Prototyping of Rapid Prototyping Tools. Proceedings of the 2021 Drone Systems Engineering and Rapid Simulation and Performance Evaluation: Methods and Tools Proceedings, 66-73. ACM.
Menard, Christian; Goens, Andrés; Hempel, Gerald; Khasanov, Robert; Robledo, Julian; Teweleitt, Felix & Castrillon, Jeronimo
-
Embeddings of Task Mappings to Multicore Systems. Lecture Notes in Computer Science, 161-176. Springer International Publishing.
Goens, Andrés & Castrillon, Jeronimo
-
mpsym: Improving Design-Space Exploration of Clustered Manycores With Arbitrary Topologies. IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems, 41(6), 1592-1605.
Goens, Andres; Nicolai, Timo & Castrillon, Jeronimo
-
ROLLED: Racetrack Memory Optimized Linear Layout and Efficient Decomposition of Decision Trees. IEEE Transactions on Computers, 72(5), 1488-1502.
Hakert, Christian; Khan, Asif Ali; Chen, Kuan-Hsun; Hameed, Fazal; Castrillon, Jeronimo & Chen, Jian-Jia
