Detailseite
Datenintegration und -abfrage durch die Zusammenführung von Ontologien und Datenbanken (DIAMOND)
Antragsteller
Professor Dr. Markus Krötzsch
Fachliche Zuordnung
Theoretische Informatik
Förderung
Förderung von 2013 bis 2022
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 239756895
In modernen Informationssystemen treffen Nutzer zunehmend Entscheidungen über Art und Organisation von Daten, die bislang Systementwicklern vorbehalten waren. Gleichzeitig öffnen sich Anwendungen immer breiteren Nutzergruppen und betonen Zusammenarbeit und Informationsaustausch. Diese Trends verdeutlicht Wikidata, ein Schwesterprojekt von Wikipedia, welches eine zentrale, vielsprachige Web-Datenbank für faktische Informationen aus Wikipedia anbieten soll. Wikidata ist Vorläufer einer neuen Art von Informationssystemen, welche die Flexibilität und Dynamik Wikipedias mit strukturierter Datenverwaltung verbinden. Das System soll bis Mitte 2013 voll einsatzfähig sein und könnte bald darauf die größte von Menschen erstellte Sammlung faktischen Wissens werden. Krötzsch spielt eine zentrale Rolle in diesem Projekt. Wikidata unterscheidet sich stark von klassischen Datenbankanwendungen und steht völlig neuen Problemen gegenüber. Gespeicherte Daten und deren Schema sind hoch dynamisch und unzureichend dokumentiert. Dies erschwert die Suche nach Informationen, sowie das Aufspüren von Fehlern und Redundanzen. Qualität und Nutzen der Daten leiden darunter. Diese Probleme sollen im Projekt DIAMOND durch den aktuellen Ansatz des Ontology-Based Data Access (OBDA) gelöst werden. OBDA verwendet konzeptionelle Modelle, sogenannte Ontologien, um die Beziehungen zwischen heterogenen Informationsmodellen so zu beschreiben, dass Computer diese automatisch zusammenführen und integrieren können. Bisher funktioniert OBDA allerdings nur bei relativ kleinen, statischen, sorgfältig erstellten Ontologien, während Anwendungen wie Wikidata große, dynamische, nutzergenerierte Ontologien benötigen. Die Hauptziele von DIAMOND sind (1) die grundlegende Erforschung von Ontologiesprachen für diese neue Art von Informationssystem, (2) die Entwicklung eines integrierten Prototypsystems, das die Realisierbarkeit dieser Lösung belegt, und (3) die Verbesserung von Evaluationsmethoden für OBDAFormalismen und -Systeme. Dazu werden im Projekt theoretische und praktische Forschung eng miteinander verbunden. Grundlegende Fragen der mathematischen Logik, Datenbanktheorie und Wissensrepräsentation werden in engem Zusammenhang mit Algorithmendesign, automatischem Schließen und Systemarchitektur betrachtet. Dementsprechend werden sowohl mathematische Beweise als auch empirische Studien zum wissenschaftlichen Erkenntnisgewinn eingesetzt. Wikidata dient dabei als Quelle realistischer Anforderungen und als Gewähr für die praktische Relevanz dieser Forschung. Die in DIAMOND angestrebten Forschungsziele leisten einen wichtigen Beitrag zur theoretischen und praktischen Weiterentwicklung wissenbasierter Systeme im Information Management. Wikidata ist ein erstes wichtiges Beispiel für Entwicklungen, die sich noch auf viele Organisationen, Communities und Firmen auswirken werden – das Potential des Projekts geht weit über diesen prominenten Anwendungsfall hinaus.
DFG-Verfahren
Emmy Noether-Nachwuchsgruppen