Detailseite
SRPtn: Entwicklung einer Lösung für das Last-Mile-Problem der Datenanalyse
Fachliche Zuordnung
Bioinformatik und Theoretische Biologie
Förderung
Förderung seit 2026
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 574526432
Reproduzierbarkeit ist ein zentrales Ziel jeder wissenschaftlichen Datenanalyse. Unterschiedliche Erfahrungen im Umgang mit Computern in interdisziplinären Teams, Zeitdruck und technische Schwierigkeiten können jedoch dazu führen, dass die Reproduzierbarkeit kurz vor der Veröffentlichung eines Manuskripts oder während des Begutachtungsprozesses verloren geht: Während anfangs möglicherweise Reproduzierbarkeits-Frameworks wie Snakemake verwendet wurden, werden finale Analyseschritte häufig dennoch außerhalb solcher Systeme durchgeführt. Wir bezeichnen dies als das „Last-Mile-Problem“ der Datenanalyse. In unserem Projekt möchten wir eine grafische Analyseplattform rund um Snakemake entwickeln. Die Plattform soll die Lücke zwischen Forschern mit und ohne Programmiererfahrung überbrücken, indem sie eine assistenzreiche, benutzerfreundliche Oberfläche für die Konfiguration und Ausführung von Snakemake-Datenanalyse-Workflows bietet. Um das Last-Mile-Problem zu lösen, wird die Plattform die Erweiterung solcher Workflows ermöglichen, indem neue Schritte zur Visualisierung oder Filterung mit Hilfe von KI/ML und intuitiven Benutzerschnittstellen generiert werden können. Alle derartigen Erweiterungen werden jedoch automatisch wieder in den Snakemake-Workflow integriert, sodass der sonst häufig auftretende Verlust wissenschaftlicher Reproduzierbarkeit vermieden wird.
DFG-Verfahren
Forschungsdaten und Software (Wiss. Literaturversorgung und Informationssysteme)
