Detailseite
BERT mit Figur - Um Wissensgraphen angereicherte neuronale Sprachmodelle zur Analyse der Darstellung literarischer Figuren (LitBERT)
Antragsteller
Professor Dr. Andreas Hotho; Professor Dr. Fotis Jannidis
Fachliche Zuordnung
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung
Förderung seit 2023
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 529659926
Dieses Projekt ist eine Zusammenarbeit zwischen der Informatik und den Computational Literary Studies (CLS), einem aufstrebenden Feld, das größere Sammlungen literarischer Texte unter Verwendung einer breiten Palette von Werkzeugen aus der Computerlinguistik, der Informatik und ihrer eigenen Tradition analysiert. In unserem Projekt konzentrieren wir uns auf die computergestützte literarische Analyse von Figuren als einem der wichtigsten Elemente von narrativen und dramatischen Texten. Wir untersuchen die textuelle Beschreibung von inneren und äußeren Merkmalen, Handlungen und weiteren figurenspezifischen Informationen mit Hilfe von wissensinduzierten Sprachmodellen. Unser Ziel ist es, einen Wissensgraphen über Figuren durch die Extraktion von Figureninformationen aus dem Text zu erstellen, verschiedene Figurentypen durch datengetriebenes Clustering zu finden und diese Informationen zu nutzen, um ein auf Figuren fokussiertes, "literarisches" Sprachmodell ("LitBERT") für die automatische Literaturanalyse zu entwickeln. Das Projekt wird den Stand der Technik bei der Kombination von Sprachmodellen und Wissensgraphen deutlich vorantreiben und zeigen, wie die Leistung von Sprachmodellen für die Analyse von Entitäten und deren Attributen verbessert werden kann, indem (a) Wissensgraphen integriert werden und (b) domänenspezifische Wissensgraphen auf Basis der Textanalyse mit Sprachmodellen angereichert werden. Zusätzlich wollen wir den Umgang mit längeren Texten, wie z.B. Romanen, verbessern, indem wir die Fähigkeiten von Sprachmodellen zur Repräsentation von Wissen, wie z.B. Repräsentation und Typen von Figuren/Personen in der Textwelt (d.h. der im Text beschriebenen Welt), erweitern.
DFG-Verfahren
Sachbeihilfen