Detailseite
Entwicklung von ontologie-basierten semantischen Suchmethoden für pluripotente humane Stammzellen und eines Tools zur Empfehlung von Zelllinien, Publikationen und Forschungsprojekten (OsemPSC)
Antragsteller
Professor Dr. Andreas Kurtz
Fachliche Zuordnung
Datenmanagement, datenintensive Systeme, Informatik-Methoden in der Wirtschaftsinformatik
Zellbiologie
Zellbiologie
Förderung
Förderung von 2019 bis 2023
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 425872946
Embryonale Stammzellen oder induzierte pluripotente Stammzellen (ES, iPS-Zellen) können in alle Zelltypen des Körpers differenzieren. Die Zellen spiegeln den Genotyp des Spenders wieder. Aus diesen Eigenschaften ergibt sich das enorme Anwendungsspektrum pluripotenter Stammzellen (PS-Zellen) in der in vitro Krankheits- und Gewebemodellierung, der Medikamententestung oder der regenerativen Medizin. Um diese Perspektiven umzusetzen werden große Zellbanken etabliert, die phänotypisch und genotypisch repräsentative PS-Zellen über ein breites Spektrum von Krankheiten und Populationen zur Verfügung stellen und diese gleichzeitig standardisiert charakterisieren und herstellen. Für die Nutzung von PS-Zellen als zelluläre Surrogate von Personen werden Informationen zu den Spendern, den Zellen und Nutzerinformation über bereits erfolgte Anwendungen benötigt. Diese Information ist in Form unterschiedlicher Datentypen über viele Zellbanken und Register verteilt und muss dennoch für Nutzer abrufbar und zugänglich sein. Es wird jedoch immer schwieriger, die rapide expandierende Wissensbasis zu überblicken und effektiv zu nutzen, um die für die Forschung und Anwendung relevanten Daten und PS-Zelllinien zu identifizieren und zu vergleichen. Es ist für Nutzer unmöglich, unterschiedliche Datentypen aus verschiedenen Registern und Datenbanken sinnvoll zu verknüpfen, und aus den vorhandenen Resourcen geeignete Zellen für ihre Anwendungen zu finden. Um die diversen Daten der Spender, der Zellen und ihrer Anwendungen zu qualifizieren, sie untereinander und zwischen verschiedenen Datenressourcen zu verbinden, sind neue Methoden und Tools notwendig. Im vorgeschlagenen Projekt möchte ich einen Ontologiebasierten semantischen Suchalgorithmus entwickeln und implementieren. Dieser soll genutzt werden, um das Problem der Suche nach Zellen mit verschiedensten Datentypen zu lösen, indem die Bedeutung der eingetragenen Daten erkannt und für die Suche verwendet wird. Darauf aufbauend soll ein Auto Suggest und Auto Complete Tool entwickelt werden, welches dem Benutzer automatisiert für ihn interessante Zelllinien, aber auch Publikationen, Anwendungen und Forschungsprojekte dazu vorstellt. Die entwickelte Ontologie soll also alle relevanten Informationen und Daten enthalten und mit weiteren spezifischen Ontologien für Krankheiten, Phänotypen, Gewebe und Zelltypen zu einer Meta-Ontologie verknüpfen – also auch das Problem der wissensbasierten Vernetzung verschiedener Datenressourcen angegangen werden. Als Grundlage der Forschung und Implementierung dient die human pluripotent stem cell registry (hPSCreg), eine öffentliche internationale Datenbank für PS-Zellen. Das in diesem Projekt entwickelte Tool soll dabei so modular entwickelt werden, dass es perspektivisch auch für andere Zellbanken wie EBiSC (European Bank for induced pluripotent Stem Cells) oder für andere Plattformen, welche Informationen über Zelllinien sammeln, eingesetzt werden kann.
DFG-Verfahren
Forschungsdaten und Software (Wiss. Literaturversorgung und Informationssysteme)
Internationaler Bezug
USA
Mitverantwortlich(e)
Dr. Stefanie Seltmann
Kooperationspartner
Professor Dr. Yongqun He