Detailseite
Projekt Druckansicht

Chat4Data: Verbesserung der Auffindbarkeit von Forschungsdaten in den Erdsystemwissenschaften mit großen Sprachmodellen

Fachliche Zuordnung Datenmanagement, datenintensive Systeme, Informatik-Methoden in der Wirtschaftsinformatik
Geodäsie, Photogrammetrie, Fernerkundung, Geoinformatik, Kartographie
Künstliche Intelligenz und Maschinelle Lernverfahren
Förderung Förderung seit 2026
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 574305041
 
Findable (Auffindbar) – dafür steht das „F“ des FAIRen Datenmanagements. Zur Ermöglichung der Auffindbarkeit konzentrieren sich die FAIR-Prinzipien auf globale Identifikatoren sowie durchsuchbare und „reichhaltige“ Metadaten für einen Datensatz. Doch die Dokumentation von Daten mit „reichhaltigen“ Metadaten ist aufwändig und die Suche [war] bisher meist auf Stichwort-Suchen begrenzt. Im beantragten Projekt wollen wir aktuelle Methoden der Künstlichen Intelligenz nutzen, um das Finden von Datensätzen zu verbessern und damit eine Nachnutzung zu ermöglichen. Dazu sollen mit Methoden des Natural Language Processing (NLP) KI-Modelle entwickelt und erprobt werden, die Wissen über ein Fachgebiet sowie über Datensätze dieses Fachgebietes kombinieren. Für dieses Vorhaben werden die Modelle mit Metadaten aus Forschungsdatenrepositorien eines Fachgebietes sowie Fachtexten (Publikationen, Texte aus Daten-Journalen) trainiert, um dem Modell ein besseres inhaltliches Verständnis zu ermöglichen. Die Forschenden sollen davon profitieren, indem sie mit dem KI-Modell über einen Chatbot kommunizieren und so über Fragen und Antworten zu gesuchten Datensätzen geleitet werden. Als konkret umzusetzender Anwendungsfall/Pilot dienen die Erdsystemwissenschaften (ESS) in Kooperation mit dem NFDI-Konsortium NFDI4Earth. Aufbauen kann das Projekt auf Vorarbeiten des nationalen Kompetenzzentrums für Big Data und KI Scads.AI Dresden/Leipzig sowie des BMWK-Projektes OpenGPT-X.
DFG-Verfahren Forschungsdaten und Software (Wiss. Literaturversorgung und Informationssysteme)
Mitverantwortliche Dr. Auriol Degbelo; Dr. René Jäkel
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung