Detailseite
Adaption von Datenanalyseworkflows der Genomforschung auf unterschiedliche Datenzugriffsmuster (A02)
Fachliche Zuordnung
Sicherheit und Verlässlichkeit, Betriebs-, Kommunikations- und verteilte Systeme
Bioinformatik und Theoretische Biologie
Datenmanagement, datenintensive Systeme, Informatik-Methoden in der Wirtschaftsinformatik
Bioinformatik und Theoretische Biologie
Datenmanagement, datenintensive Systeme, Informatik-Methoden in der Wirtschaftsinformatik
Förderung
Förderung seit 2020
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 414984028
Die Laufzeit von DAWs auf naturwissenschaftlichen Messdaten wird in der Regel durch die notwendigen Operationen zum Datenzugriff und zum Datenaustausch bestimmt. Deren Laufzeit wiederum ist abhängig von den Daten, die analysiert werden, den Programmen, die die Analysen durchführen, und der Rechnerinfrastruktur, auf der ein DAW ausgeführt wird. Notwendige Anpassungen werdenheutzutage manuell auf Ebene der DAW-Spezifikation durchgeführt, da Änderungen in einer dieser Aspekte schnell zu einem eklatanten Effizienzverlust führen können. Das interdisziplinäre Teilprojekt A2 beschäftigt sich mit der Entwicklung von Methoden, mit deren Hilfe ein gegebener DAW (semi-)automatisch an veränderte Eingabedaten oder eine veränderte Infrastruktur adaptiert werden kann um solche Effizienzeinbrüche zu verhindern. Im Mittelpunkt der Methodenentwicklung stehen DAWs zur Analyse großer genomischer Datensätze, die typischerweise sehr sensitiv auf die Performanz von Datenzugriff und Datenaustausch sind. A2 wird intensiv mit Teilprojekt A6 zusammenarbeiten, um die entwickelten Methoden auch auf DAWs zur Analyse von Strukturvarianten zu erproben. Ebenso ist eine enge Kooperation mit B1 geplant, da die dort entwickelten Hardware-Abstraktionen essentiell für eine gute DAW Anpassung sind. A2 wird von Prof. Reinert, einem Experten in Datenstrukturen und Algorithmen zur Analyse genomischer Daten, und Prof. Leser, einem Experten in der Optimierung naturwissenschaftlicher DAWs, geleitet.
DFG-Verfahren
Sonderforschungsbereiche
Teilprojekt zu
SFB 1404:
FONDA – Grundlagen von Workflows für die Analyse großer naturwissenschaftlicher Daten
Antragstellende Institution
Humboldt-Universität zu Berlin
Teilprojektleiter
Professor Dr. Ulf Leser; Professor Dr. Knut Reinert