Detailseite
Projekt Druckansicht

Datenmanagement, -integration and -analyse

Antragstellerinnen / Antragsteller Professor Dr. Johannes Betge; Dr. Maria Zimmermann
Fachliche Zuordnung Gastroenterologie
Förderung Förderung seit 2025
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 537604907
 
Die Datenmengen in der biomedizinischen Forschung sind in den letzten Jahren durch das Aufkommen von Hochdurchsatztechnologien wie Next-Generation-Sequencing, phänotypischer Screens oder durch Einzelzelltechnologien exponentiell gestiegen. Die Analyse, Speicherung und gemeinsame Nutzung dieser Datensätze stellt aufgrund ihrer Größe, der Vielzahl von Datenformaten, der unterschiedlichen Analyse-Pipelines, der rechtlichen Beschränkungen in der Nutzung von Daten und Datenbanken eine große Herausforderung dar. Diese Limitationen können zu erheblichen Einschränkungen bei der Gewinnung und Nutzung von Daten aus Forschungsprojekten führen. Sie tragen zu Einschränkungen bei der Sekundärnutzung von Daten bei und haben damit letztlich auch Einfluss auf die Reproduzierbarkeit und Nachhaltigkeit von wissenschaftlichen Erkenntnissen. Im Rahmen der GenoMiCC-Projekte werden unterschiedlichste Datenformate mit zum Teil sensiblen Daten erzeugt, die jedoch gemeinsam, mithilfe unterschiedlicher Analysepipelines und Speicherplätze genutzt werden sollen. Ziel des Projektes Datenmanagement, -integration und -analyse (CP2) ist die Verarbeitung von Daten und Metadaten zu standardisieren und zu vereinfachen, die gemeinsame Nutzung von Daten innerhalb des Konsortiums zu verbessern, standardisierte Datenanalyse-Pipelines für gemeinsame Datentypen zu entwickeln und für alle beteiligten Wissenschaftler:innen Unterstützung für die Datenanalyse anzubieten. Zu diesem Zweck sollen die Metadaten aller großen Datensätze standardisiert werden, um kombinierte Analysen zu erleichtern. Wir werden dazu eine Datenbank einrichten, die Informationen über alle im Rahmen des Projekts gewonnenen Datensätze enthält, und zudem zusammen mit der Integrierten Biobank Mannheim eine virtuelle Biobank für die verfügbaren Biomaterialien anbieten. Ein zentraler Fokus des Projekts wird die Einrichtung einer zentralen Plattform für den Datenaustausch / Datenraum für das Konsortium sein. Dieser Datenraum baut auf den bestehenden Datenspeicher- und Rechnerkapazitäten der Universität Heidelberg auf und wird in Zusammenarbeit mit dem Heidelberg-Mannheim Life Science Alliance Data Space Projekt weiterentwickelt. Zusätzlich werden wir ein Datenanalysezentrum einrichten, das mit allen Wissenschaftler:innen zusammenarbeitet. Darin werden wir Analysepipelines innerhalb des Konsortiums etablieren, vereinheitlichen und automatisieren, und ebenso Unterstützung bei der Datenverarbeitung innerhalb des Konsortiums anbieten. Mit diesen Initiativen sollen die Grundlagen geschaffen werden, um Meta-Analysen der Datensätze aus den Projekten des Konsortiums durchzuführen und die Zusammenführung dieser Ergebnisse mit weiteren publizierten Datensätzen in einem größeren Kontext zu ermöglichen. Dieses zentrale Projekt wird damit innerhalb von GenoMiCC die Gewinnung wissenschaftlicher Ergebnisse unterstützen und die Nachhaltigkeit der Datengewinnung und Datennutzung verbessern.
DFG-Verfahren Forschungsgruppen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung