Detailseite
Projekt Druckansicht

Unüberwachte Modellfindung für stereotype Organismen (Acronym UMDISTO)

Antragstellerinnen / Antragsteller Dr. Dagmar Kainmüller; Dr. Bogdan Savchynskyy
Fachliche Zuordnung Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung Förderung seit 2022
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 498181230
 
Unser Ziel ist eine neuartige Methodik zur unüberwachten Lösung großer Multimatching-Probleme. Solche Probleme treten bei Anwendungen in der Biologie im Kontext von Organismen auf, die auf der Ebene einzelner Zellen stereotyp sind. Solche Organismen haben einen festen Körperplan, d.h. jedes Exemplar hat die gleiche Anzahl und Anordnung von Zellen. Diese Eigenschaft bietet Biologen die einzigartige Möglichkeit, mehrere Beobachtungen in unterschiedlichen Exemplaren durchzuführen, und diese auf der Ebene einzelner Zellen in einen gemeinsamen Referenzrahmen zusammenzuführen. Unser Projekt befasst sich insbesondere mit dem beliebten Modellorganismus Caenorhabditis elegans (weiter C. elegans), einem Fadenwurm, der als Larve 558 Zellen besitzt.Die individuelle Expression fast aller seiner Gene kann mittels Fluoreszenzmikroskopie beobachtet werden. Die Zusammenführung solcher Beobachtungen in einen Referenzrahmen auf Zellebene ergibt einen Atlas der Genexpression. Ein solcher Atlas würde einen wichtigen Beitrag zum Reverse-Engineering des in der DNA des Wurms kodierten „Programms“ liefern.Ein entscheidender Schritt zur Erstellung eines solchen Atlas besteht darin, zellweise Korrespondenzen zwischen Mikroskopiebildern einzelner Exemplare herzustellen.Insbesondere befassen wir uns mit einem Datensatz, der aus 265 Bildern verschiedener Exemplare des C. elegans-Wurms besteht. Das entsprechende Zellkorrespondenzproblem stellt ein riesiges Multimatching-Problem dar, sowohl in Bezug auf die Größe der einzelnen Objekte (558 Zellen) als auch ihre Anzahl (265 Würmer). Dies ist bei weitem das größte und schwierigste Problem dieser Art, das in der Computer Vision betrachtet wird. Die Herausforderung besteht jedoch nicht nur darin, ein Matching-Problem dieser Größe zu optimieren, sondern auch die Matching-Kosten für die Optimierung zu trainieren, da die Generierung der für das Training erforderlichen Ground-Truth-Matchings für die betrachteten Bio-Imaging-Anwendungen aufgrund des enormen Aufwandes und erforderlichen Fachwissens praktisch nicht in ausreichendem Maßstab durchführbar ist. Frühere Arbeiten in dieser Richtung umfassen Teilannotationen (357 von 558 Zellen) von 30 Wurmexemplaren. Komplexität und Dauer dieser partiellen Annotationsarbeit verhindern jedoch, sie auf die volle Annotation auszuweiten sowie für andere stereotype Organismen und andere Entwicklungsstadien von C. elegans zu wiederholen.Es gibt bisher keine geeignete Methodik zur Lösung derartiger Multimatching-Probleme in dieser Größenordnung. Wir wollen diese Lücke mittels neuartiger Methodik für unüberwachtes Training und Optimierung schließen. Als Fallbeispiel betrachten wir den C. elegans-Wurm im ersten Larvenstadium und streben an, einen vollständigen Atlas dieses Organismus basierend auf mikroskopischen Aufnahmen von 265 Instanzen zu erstellen. Um die Genauigkeit unseres Ansatzes zu bewerten, verwenden wir die 30 Instanzen, für die partielle Ground-Truth-Matchings verfügbar sind.
DFG-Verfahren Sachbeihilfen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung