Detailseite
Projekt Druckansicht

Pantheon: Erzeugung und Instandhaltung von semantisch sinnvollen Entitäts-Ranglisten über großen Datenmengen

Fachliche Zuordnung Sicherheit und Verlässlichkeit, Betriebs-, Kommunikations- und verteilte Systeme
Förderung Förderung von 2013 bis 2020
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 241616207
 
Bei der Analyse großer und heterogener Datenmengen spielen Ranglisten eine große Rolle. Sie erlauben es, Anwendern sich auf die am besten dastehenden Entitäten zu fokussieren. So gibt es Ranglisten der reichsten Personen, der schnellsten Autos oder höchsten Gebäude, genauso wie Ranglisten der besten Sportler, getrennt nach Sportart, Geschlecht oder Altersgruppe. Im durch die DFG geförderten Projekt Pantheon (MI 1794/1-1) betrachten wir die automatische Erstellung von Entitäts-Ranglisten und deren automatische Neuberechnung bei sich ändernden zugrunde liegenden Daten. Dabei werden insbesondere anhand von Fakten aus Wissensdatenbanken Ranglisten erzeugt, wie zum Beispiel die top-20 Universitäten anhand der Anzahl ihrer Nobelpreisträger. Im Laufe des Pantheon-Projekts konnten wir verschiedene wichtige Forschungsergebnisse erreichen, die auf international anerkannten Konferenzen und Workshops publiziert sind. Durch die vorangegangenen Arbeiten konnten auch zwei weitere vielversprechende Forschungsgebiete identifiziert werden, die wir in diesem Verlängerungsantrag beschreiben. Ein Aspekt der geplanten Arbeit adressiert das Problem der Unvollständigkeit von Ranglisten, die aufgrund von fehlenden oder fehlerhaften Daten einer Wissensdatenbank entstehen. Ziel ist es, eine genaue Abschätzung des Grads an Unvollständigkeit zu erhalten, sodass Benutzer anhand dieser Information entscheiden können, wie aussagekräftig die aus einer Rangliste abzuleitenden Erkenntnisse sein können. Desweiteren möchten wir untersuchen, inwiefern Ranglisten benutzt werden können, um per se unbekannte oder wenig bekannte Daten zu erforschen. Dazu bedarf es neben der ursprünglichen Generierung von Ranglisten auch Methoden, die es erlauben, ähnliche Ranglisten zu finden, Ranglisten zu gruppieren, komplementäre oder im Konflikt stehende Ranglisten zu finden, etc. Wir planen auch Methoden zur Rang-Aggregation in die verschiedenen Aspekte von Pantheon aufzunehmen, was einen weiteren Anstieg in der Anzahl der zu betrachteten Listen bedeutet. Da Anwender interaktiv mit dem System arbeiten werden, wird ein wichtiger Aspekt auf der Performanz der entwickelten bzw. angewendeten Methoden liegen.
DFG-Verfahren Sachbeihilfen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung