Neue Commodity Rechnerarchitekturen

Term Funded in 2010

Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 173136989

Final Report Year 2016

Final Report Abstract

Mit NVIDIA-Grafikkarten der Fermi-Architektur (64-bit Rechengenauigkeit und ECC-Speicher) und dem Larrabee-Prozessor von Intel begann das Manycore-Zeitalter mit dem Versprechen höhere Rechenleistung bei geringerem Energieverbrauch liefern zu können. Eingebettet in ein Commodity-Rechencluster wurden drei unterschiedliche, wegweisende Architekturen in der Produktionsumgebung eines universitären Rechenzentrums aus Sicht der Methoden- und Anwendungswissenschaften untersucht: ScaleMP: kohärente Kopplung von Commodity-Rechnern zu einem Shared-Memory-Rechner (512 Cores); Intel Xeon Phi („Knights Corner“): dem Nachfolger des Larrabee–Manycoreprozessors auf x86-Basis; NVIDIA: Grafikprozessoren zur Visualisierung in einer VR-Umgebung sowie für Simulationsrechnungen. Letztere sind das Herz des GPU-Clusters welche die in 2012 beschaffte CAVE ansteuern. Die Forschungsziele, die damit verfolgt wurden, beziehen sich daher auch auf dieses GPU-Cluster. Folgende weitere Aspekte wurden mit Hilfe der beschafften Geräte erforscht und weiterentwickelt: Integration innovativer Architekturen in die Produktionsumgebung eines großen Rechenclusters. Programmierparadigmen für Manycore-Rechner, insbes. die Unterstützung von Akzeleratoren und NUMA-Architekturen durch OpenMP. Werkzeuge zur Performance- und Korrektheitsanalyse für Manycore-Rechner (im VI-HPS). Benchmark-Entwicklung für Manycore-Rechner (SPEC ACCEL). Anwendungen und Einsetzbarkeit dieser neuen Architekturen im Computational Engineering Science. Methoden zum Vergleich von Produktivität und Total Cost of Ownership von Manycore-Rechnern. Der produktive Einsatz innovativer Rechnerarchitekturen, der aufgrund der immensen Energiekosten aktueller Hochleistungsrechnersysteme zukünftig unabdingbar ist, benötigt ein angemessenes Software-Ökosystem, sowie eine adäquate Ausbildung der Anwender. Der theoretische Vorteil dieser Architekturen kann nur bei geeigneter Nutzung realisiert werden. Die Forschungsarbeiten, die die geförderten Geräte ermöglicht haben, haben zu wesentlichen Schritten beigetragen, dieses Ökosystem auszubauen und auch das Wissen darüber zu verbreiten in der Lehre, durch Nutzerschulungen (PPCES), individuelle Nutzerbetreuung, Bedienungsanleitungen, Tutorials auf internationalen Konferenzen (SC, ICS) und Tuning Workshops (aixCelerate, VI-HPS). Die folgenden drei Anwendungsbereiche konnten u.a. von den neuen Architekturen besonders profitieren: Im Rahmen des Verbundprojektes MeProRisk konnte eine neuartige Methodik zur Erfassung der Struktur und der physikalischen Eigenschaften geothermischer Lagerstätten entwickelt werden. Während der Phase der Exploration und der anschließenden Nutzung der geothermischen Lagerstätte erlaubt diese Methodik eine zunehmend bessere Prognose der Bedingungen im Reservoir und damit eine verbesserte Abschätzung des Fündigkeitsrisikos. Die Parallelisierung für das ScaleMP-Cluster mit großem gemeinsamem Speicher eröffnete die Möglichkeit große Simulationsmodelle und gleichzeitig eine große Anzahl an Ensemble-Mitgliedern für stochastische Methoden zu berechnen. Die Lösung von inversen Problemstellungen mithilfe der automatischen Differenzierung zur optimierten Experimentauslegung (OED) und zur inversen Parameterschätzung und Ungenauigkeitsanalyse benötigt einen erhöhten Aufwand an Rechenzeit und Speicher. Im Rahmen des Exzellenzclusters 236 konnten im Institut für Technische Verbrennung Turbulenzeigenschaften mit einer neuen Methode statistisch erfasst werden. Turbulenz zeichnet sich u.a. durch unvorhersehbare plötzliche Änderungen zugrundeliegender Vektor- und Skalarfelder aus. Das Zerlegen der Felder in kleinere raumfüllende Strukturen mit einem rechen- und speicherintensiver Verfahren wurde durch das ScaleMP-Clusters ermöglicht bei dem alle Prozessoren Zugriff auf den großen gemeinsamen Speicher besitzen. Am Lehrstuhl für Experimentelle Molekulare Bildgebung wurde für mehrere umfangreiche biomedizinische Studien GPU-beschleunigter Code für Rekonstruktionsmethoden zur multimodalen dreidimensionalen Fluoreszenztomographie implementiert und damit Ergebnisse erzielt, die mit herkömmlichen Rechnerarchitekturen nicht in angemessener Zeit möglich gewesen wären. In mehreren Projekten wurden innovative Tumorbehandlungskonzepte untersucht, fluoreszente Sonden zur Charakterisierung der Leberentzündung entwickelt, der Effekt der Epo-Therapie auf das Tumorwachstum, die Wirkstoffanreicherung langzirkulierender Nanowirkstoffe in Tumoren und die Anreicherung von Wirkstoffen im Tumor aufgrund durchlässiger Tumorgefäße erforscht, sowie die Verwendung von Hardwarebeschleunigern für die Gradientenberechnung mittels Algorithmischer Differenzierung evaluiert.

Publications

Trajectory-Search on ScaleMP's vSMP Architecture IOS Press - Advances in Parallel Computing
Wienke, Sandra; an Mey, Dieter & Müller, Matthias S.
Accelerators for Technical Computing: Is It Worth the Pain? A TCO Perspective Lecture Notes in Computer Science, Springer
Wienke, Sandra; an Mey, Dieter & Müller, Matthias S.
Gradient trajectory analysis in a jet flow for turbulent combustion modelling. Journal of Turbulence, Volume 14, Issue 1, 2013
Gampert, M.; Schaefer, P.; Narayanaswamy, V. & Peters, N.
Modeling contribution to risk assessment of thermal production power for geothermal reservoirs. ScienceDirect, Renewable Energy, vol. 52, pp.230-241, May 2013
Vogt, Christian; Iwanowski-Strahser, Katja; Marquart, Gabriele; Arnold, Juliane; Mottaghy, Darius; Pechnig, Renate; Gnjezda, Daniel & Clauser, Christoph
A Pattern-Based Comparison of OpenACC and OpenMP for Accelerator Computing. Lecture Notes in Computer Science, Springer
Wienke, Sandra; Terboven, Christian; Beyer, James C. & Müller, Matthias S.
Hybrid µCT-FMT imaging and image analysis. J Vis Exp, no. 100, p. e52770, 2015
Gremse, Felix; Doleschel, Dennis; Zafarnia, Sara; Babler, Anne; Jahnen-Dechent, Willi; Lammers, Twan; Lederle, Wiltrud & Kiessling, Fabian
SPEC ACCEL: A Standard Application Suite for Measuring Hardware Accelerator Performance. Lecture Notes in Computer Science, Springer
Juckeland, Guido; Brantley, William; Chandrasekaran, Sunita; Chapman, Barbara; Che, Shuai; Colgrove, Mathew; Feng, Huiyu; Grund, Alexander; Henschel, Robert; Hwu, Wen-Mei W.; Li, Huian; Müller, Matthias S.; Nagel, Wolfgang E.; Perminov, Maxim; Shelepugin, Pavel; Skadron, Kevin; Stratton, John; Titov, Alexey; Wang, Ke; ... & Kumaran, Kalyan
GPU-Accelerated Adjoint Algorithmic Differentiation. Comput Phys Commun, vol. 200, pp. 300–311, Mar. 2016
Gremse, Felix; Höfter, Andreas; Razik, Lukas; Kiessling, Fabian & Naumann, Uwe
Optimal experimental design for reservoir property estimates in geothermal exploration. Computational Geosciences, 2(2):357-383, 2016
Seidler, Ralf; Padalkina, Kateryna; Bücker, H. Martin; Ebigbo, Anozie; Herty, Michael; Marquart, Gabriele & Niederau, Jan

Servicenavigation

Hauptnavigation

Neue Commodity Rechnerarchitekturen

Final Report Abstract

Publications

Additional Information

Servicenavigation

Hauptnavigation

Neue Commodity Rechnerarchitekturen

Final Report Abstract

Publications

Additional Information

Textvergrößerung und Kontrastanpassung