Detailseite
Projekt Druckansicht

Zusammenschluss von graphen-basierten und vektor-basierten Bedeutungsrepräsentationen für semantischen Informationszugang (JOIN-T 2)

Fachliche Zuordnung Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung Förderung von 2014 bis 2019
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 259256643
 
Erstellungsjahr 2023

Zusammenfassung der Projektergebnisse

In den 2010er-Jahren gelangen durch sprachtechnologische Forschungen Durchbrüche im automatischen Sprachverstehen. Lexikalische Semantik ist eine der Schlüsselbereiche in der Sprachtechnologie, was dazu führte, dass eine große Anzahl von Arbeiten sich mit der Repräsentation maschinenlesbaren Wissens beschäftigte, und zwar entlang orthogonaler Dimensionen wie manuelle gegenüber automatischer Akquise, lexikalischer gegenüber konzeptueller Ebene und dicht gegenüber dünn besetzter Vektoren und Matrizen. Dennoch bestand ein großer Forschungsbedarf bezüglich deren Kombination, um die individuellen Vorteile dieser Dimensionen in einem gemeinsamen Modell bzw. einer gemeinsamen Ressource zu vereinen, welche die bessere Bearbeitung von komplexen sprachtechnologischen Aufgaben ermöglicht. Wir erforschten Ansätze zur Bedeutungsrepräsentation, welche auf der Dualität von Graph und Vektor basieren und der Hypothese, dass sowohl graphenbasierte als auch vektorbasierte Repräsentationen für lexikalische Einheiten gleichermaßen und gleichzeitig genutzt werden sollten, um deren Bedeutung zu charakterisieren. Hierzu entwickelten wir Frameworks und Ressourcen, welche die oben genannten Dimensionen integrieren und insbesondere die Interpretierbarkeit händisch erstellter und dünn (sparse) repräsentierter Ressourcen mit der Genauigkeit und der hohen Abdeckung von dimensionsreduzierten neuralen Embeddings kombiniert. In der ersten Projektphase (JOIN-T1) erzielten wir bemerkenswerte Fortschritte im bereich der distributionellen Semantik, insbesondere: i) das Linken von distributionellen und ontologischen semantischen Repräsentationen ist mit hoher Genauigkeit möglich und ii) die Disambiguierung lexikalischer Einheiten in ihrem Kontext zu deren Bedeutungen ist mit Hilfe graphen-basierter Repräsentationen zwar mit hoher Genauigkeit möglich, jedoch nur mit hoher Berechnungskomplexität, welche deren Skalierung auf sehr große Korpora bisher verhindert. Aufbauend auf unseren Arbeiten zur Kombination von Ontologien mit graphen-basierter distributioneller Semantik in JOIN-T1 erweiterten wir unseren Fokus für JOIN-T2 auf i) das Verbinden mit dimensionsreduzierten neuralen Vektorrepräsentationen (Embeddings) aus Text und Wissensbasen in einem gemeinsamen Modell, ii) das Erweitern der Abdeckung auch auf niederfrequente und neu auftretende Entitäten durch das Verarbeiten von Korpora in der Größe des Internets und iii) das Nutzen der gemeinsamen Vorteile einer gleichzeitig lexikalischen, distributionellen und ontologischen Repräsentation für komplexe sprachtechnologische Aufgaben wie das entitätenund eventzentrierte Browsen von Dokumentkollektionen. Durch die rasanten Entwicklungen im Bereich kompositioneller Repräsentationen durch große, vor-trainierte Sprachmodelle passten wir unsere Forschungsrichtung entsprechend neuster Ansätze und Modelle an, und wichen deshalb von einzelnen, im Antrag definierten, Arbeitspaketen ab. Zusammengefasst konnten wir neue Einblicke im Bereich kontextualisierter Repräsentationen erreichen und erzielten Fortschritte insbesondere bei der Modellierung und kontextuellen Wiedererkennung der Bedeutung von Wörtern, semantischer Frames und Entitäten.

Projektbezogene Publikationen (Auswahl)

 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung