Detailseite
Event-basierte Exploration und Analyse von Linked Open Data
Antragsteller
Professor Dr. Michael Gertz; Professor Dr.-Ing. Kai-Uwe Sattler
Fachliche Zuordnung
Sicherheit und Verlässlichkeit, Betriebs-, Kommunikations- und verteilte Systeme
Förderung
Förderung von 2014 bis 2018
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 249438185
Informationen sind heutzutage zunehmend durch explizite und implizite zeitliche und geographische Aspekte beschrieben, dies reicht von geo-annotierten Tweets bis hin zu Umschreibungen von Ort und Zeit in Textdokumenten. Derartige Zeit- und Rauminformationen bilden die Basis für Ereignisbeschreibungen, d.h. Beschreibungen des Auftreten bestimmter Geschehen an einem Ort zu einer bestimmten Zeit sowie weiterer damit verbundener Eigenschaften wie etwa die beteiligten Personen oder Organisationen. Die Exploration derartiger Informationen aus den unterschiedlichsten Quellen - seien es Linked Data im Web oder eher traditionelle Dokumentkollektionen - ist eine immer dringender werdende Aufgabe in vielen Disziplinen wie etwa den Geistes- und Geschichtswissenschaften oder der Medizin.Ziel des hier beantragten Projektes ist die Entwicklung eines neuartigen und umfassenden Frameworks zur Extraktion und Identifikation von Ereignisbeschreibungen aus heterogenen Quellen. Die Basis für ein Schema von Ereignisbeschreibungen sollen existierende Ontologien bilden, wobei der Fokus auf zeitlichen und geographischen Informationen mit der wohldefinierten Semantik von Raum und Zeit liegt. Dieses Schema soll als Zielschema für die verschiedenen Extraktions- und Integrationssaufgaben genutzt werden. Obwohl grundsätzlich offen für beliebige Datenquellen konzentrieren wir uns zunächst auf existierende Linked-Data-Quellen wie DBpedia und YAGO2, ereignis-spezifische Quellen wie eventful.com und traditionelle Textkollektionen wie Wikipedia. Das Framework umfasst drei wesentliche Schritte: Extraktion, Normalisierung und Integration von Ereignisdaten. Der Schwerpunkt der Extraktion liegt auf der Erschließung von Textdokumenten. Der Aufbau einer konsistenten und einheitlichen Ereignisbasis für Such- und Explorationsaufgaben soll durch Techniken zur Normalisierung und Integration von Ereignisbeschreibungen unterstützt werden. Als ein weiterer Beitrag des Vorhabens sind die Konzeption, Umsetzung und Evaluierung von Operatoren zur Ereigniskorrelation geplant. Diese Operatoren zielen auf die effiziente Verarbeitung von in RDF repräsentierten Ereignisdaten und hierbei speziell die Aufdeckung von Beziehungen zwischen Ereignissen in Raum und Zeit, wofür Ähnlichkeitsmaße entwickelt bzw. ausgewählt werden müssen. Basierend auf einer umfassenden und teilweise automatisierten Verarbeitungspipeline aus Extraktion, Integration und Analyse von Ereignisdaten sollen im Rahmen des Projektes weiterhin (1) ein Repository von Ereignisdaten entwickelt und der Öffentlichkeit verfügbar gemacht werden, das die Daten mit anderen Linked-Open-Data-Quellen verknüpft, und (2) Nutzern die Möglichkeiten zur Suche und Exploration von Ereignisdaten bietet. Letzteres umfasst u.a die Suche nach ähnlichen Ereignissen, die Ableitung von Ereignistrajektorien für (historische) Personen oder Organisationen sowie Korrelationen basierend auf zeitlichen, räumlichen und kontextbezogenen Informationen.
DFG-Verfahren
Sachbeihilfen