Detailseite
Webskalierendes negatives Wissen
Antragsteller
Dr. Simon Razniewski
Fachliche Zuordnung
Datenmanagement, datenintensive Systeme, Informatik-Methoden in der Wirtschaftsinformatik
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung
Förderung von 2021 bis 2024
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 453095897
Strukturiertes Wissen ist wichtig für viele Anwendungen wie etwa Question Answering, Dialog oder Empfehlungssysteme. Das benötigte Wissen wird typischerweise in Knowledge Bases (KBs) gespeichert, und Konstruktion, Pflege und Anfragesprachen für KBs haben in den letzten Jahren gesteigertes Interesse erfahren. Das betrifft insbesondere enzyklopädische KBs wie etwa Wikidata, DBpedia oder den Google Knowledge Graph. Diese KBs speichern positive Aussagen wie "Saarbrücken ist die Hauptstadt des Saarlandes", welche eine wesentliche Grundlage für wissensintensive KI-Anwendungen sind.Eine wesentliche Limitierung dieser KBs liegt in der fehlenden Fähigkeit mit negativem Wissen umzugehen. Bis jetzt enthalten alle großen KBs nur positive Aussagen, während Aussagen wie etwa dass Tom Cruise keinen Oscar gewonnen hat nur durch Inferenzen hergeleitet werden können, die umfangreiche Annahmen erfordern. Da KBs meist nur einen kleinen Teil aller wahren Aussagen enthalten, müssen Nutzer daher oft raten ob fehlende Aussagen tatsächlich nicht gelten, oder einfach nur unbekannt sind.Nicht formal zwischen unwahren und unbekannten Aussagen unterscheiden zu können ist ein Problem in vielen Anwendungen. In der Medizin ist es zum Beispiel wichtig zwischen der Abwesenheit einer biochemischen Reaktion zwischen Substanzen, und unbekannter Beziehung zu unterscheiden. Für die Unternehmensintegrität ist es wichtig, ob ein Mitarbeiter nicht bei einem Wettbewerber angestellt war, oder ob vorherige Anstellung unbekannt ist. Im Bereich Korruption ist es wichtig, die Abwesenheit von Verwandschaftsbeziehungen zu erfassen, während es im Bereich Fake News einen wesentlichen Unterschied macht, ob ein Gerücht falsch ist (etwa dass Obama in Kenia geboren ist), oder ob ein Gerücht weder wahr noch widerlegt ist (etwa ob Malayan Airlines 370 entführt wurde).Obwohl negatives Wissen bereits ausführlich in Logik und Datenbanktheorie untersucht wurde, fehlt eine adäquate Behandlung in KBs. Im Gegensatz zu fokussierten Datenbanken sind KBs heterogene Sammlungen von Wissen, für die ein uniformes logisches Schema wie etwa die Closed-world Assumption oder Certain Answers ungeeignet ist. Auch Techniken für die Konstruktion von KBs haben sich bisher nur auf positives Wissen konzentriert, und ignorieren negative Aussagen.Im vorliegenden Projekt adressieren wir die gegenwärtige Limitation von KBs auf positives Wissen mit Forschung basierend auf drei Komponenten: (i) statistische Inferenzverfahren für die Generierung von negativem Wissen, (ii) Web-Validierungs und Verbundkonsolidierungstechniken um Widersprüche und Inkonsistenzen aufzulösen, und (iii) Rankingverfahren die es erlauben, die je nach Anwendungsfall relevantesten negativen Fakten zu identifizieren.
DFG-Verfahren
Sachbeihilfen