Webskalierendes negatives Wissen
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Zusammenfassung der Projektergebnisse
Wissensgraphen (Knowledge Graphs, KGs) sind ein wichtig für viele KI-Anwendungen. KGs im Web speichern fast nur positive Aussagen und lassen negative Aussagen außer Acht. Aufgrund der Unvollständigkeit von Open-World-KGs werden fehlende Aussagen nicht als falsch, sondern als unbekannt betrachtet. In diesem Projekt haben wir die folgenden Beiträge geleistet: 1. Wir haben für eine selektive Materialisierung negativer Aussagen über Entitäten in enzyklopädischen KGs argumentiert und drei Arten negativer Aussagen formal definiert: voll instanziierte, universell abwesende und quantifiziert negativ. Wir haben die Peer-basierte Negationsinferenzmethode vorgestellt, um Listen von prägnanten Negationen über Entitäten zusammenzustellen. Die Methode berechnet relevante Peers für eine gegebene Eingabeentität und verwendet deren positive Aussagen, um Erwartungen für die Eingabeentität festzulegen. Eine Erwartung, die nicht zutrifft, ist ein unmittelbarer Negativkandidat und wird dann anhand der Metriken Häufigkeit, Wichtigkeit und Unerwartetheit bewertet. 2. Wir haben eine musterbasierte Methode zur Extraktion von Abfrageprotokollen vorgeschlagen, um auffällige Negativa aus umfangreichen Textquellen zu extrahieren. Diese Methode extrahiert hervorstechende Negative über eine Entität, indem sie große Korpora, d.h. die Abfrageprotokolle von Suchmaschinen, unter Verwendung handgefertigter Muster mit negativen Schlüsselwörtern auswertet. 3. Wir haben die UnCommonsense-Methode eingeführt, um hervorstechende negative Phrasen über alltägliche Konzepte in weniger kanonisierten Commonsense- KGs zu generieren, die kurze natürlichsprachliche Aussagen enthalten. Sie berechnet vergleichbare Konzepte für ein bestimmtes Zielkonzept, leitet aus dem Vergleich ihrer Positiva Negationskandidaten ab und prüft diese Kandidaten anhand des KGs selbst sowie anhand von Sprachmodellen (LMs) als externe Wissensquelle. Schließlich werden die Kandidaten anhand von Häufigkeitsmaßen, die die semantische Ähnlichkeit berücksichtigen, in eine Rangfolge gebracht. 4. Um die Erforschung unserer Methoden und ihrer Ergebnisse zu erleichtern, haben wir zwei Prototypsysteme implementiert. In WikiNegata wurde ein System zur Präsentation der Peer-basierten Methode entwickelt, in dem Benutzer negative Aussagen über 500.000 Entitäten aus 11 Klassen untersuchen und verschiedene Parameter der Peer-basierten Inferenzmethode einstellen können. Im UnCommonsense-System können die Benutzer genau überprüfen, was die Methode bei jedem Schritt produziert, und Negationen zu 8K alltäglichen Konzepten durchsuchen. Darüber hinaus haben wir mit der Peer-basierten Negationsinferenzmethode den ersten großen Datensatz über Demografie und Ausreißer erstellt und seine Nützlichkeit in Anwendungsfällen wie der Identifizierung unterrepräsentierter Gruppen gezeigt. Wir haben alle erstellten Datensätze und den Code veröffentlicht.
Projektbezogene Publikationen (Auswahl)
-
Negative Knowledge for Open-world Wikidata. Companion Proceedings of the Web Conference 2021, 544-551. ACM.
Arnaout, Hiba; Razniewski, Simon; Weikum, Gerhard & Pan, Jeff Z.
-
Negative statements considered useful. Journal of Web Semantics, 71, 100661.
Arnaout, Hiba; Razniewski, Simon; Weikum, Gerhard & Pan, Jeff Z.
-
Neguess: Wikidata-entity Guessing Game with Negative Clues. Aditya B. Biswas, Hiba Arnaout, and Simon Razniewski. ISWC Companion 2021
Aditya B. Biswas, Hiba Arnaout & Simon Razniewski
-
Wikinegata. Proceedings of the VLDB Endowment, 14(12), 2807-2810.
Arnaout, Hiba; Razniewski, Simon; Weikum, Gerhard & Pan, Jeff Z.
-
UnCommonSense: Informative Negative Knowledge about Everyday Concepts. Proceedings of the 31st ACM International Conference on Information & Knowledge Management, 37-46. ACM.
Arnaout, Hiba; Razniewski, Simon; Weikum, Gerhard & Pan, Jeff Z.
-
Can large language models generate salient negative statements? Hiba Arnaout and Simon Razniewski, KBC-LM at ISWC 2023.
Hiba Arnaout & Simon Razniewski
-
UnCommonSense in Action! Informative Negations for Commonsense Knowledge Bases. Proceedings of the Sixteenth ACM International Conference on Web Search and Data Mining, 1120-1123. ACM.
Arnaout, Hiba; Nguyen, Tuan-Phong; Razniewski, Simon & Weikum, Gerhard
-
Wiki-Based Communities of Interest: Demographics and Outliers. Proceedings of the International AAAI Conference on Web and Social Media, 17, 990-996.
Arnaout, Hiba; Razniewski, Simon & Pan, Jeff Z.
-
Completeness, Recall, and Negation in Open-world Knowledge Bases: A Survey. ACM Computing Surveys, 56(6), 1-42.
Razniewski, Simon; Arnaout, Hiba; Ghosh, Shrestha & Suchanek, Fabian
