Detailseite
Projekt Druckansicht

Automatisierte Erstellung von Bildkarten mittels Retrieval-Augmented Generation

Fachliche Zuordnung Geodäsie, Photogrammetrie, Fernerkundung, Geoinformatik, Kartographie
Förderung Förderung seit 2025
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 567521318
 
Ziel des Projekts ist es Potenziale generativer künstlicher Intelligenz für die Kartenproduktion zu erforschen. Durch die Kombination generative Methoden und Retrieval-Augmented Generation (RAG) soll ein automatisierter Workflow zur Erstellung pictorialer Karten entwickelt werden. Als Anwendungsfall sollen Bildkarten im handgezeichneten Stil für den Tourismus in Städten erzeugt werden, welche aktuelle Informationen und Nutzerpräferenzen berücksichtigen. Der Workflow umfasst mehrere Phasen, beginnend mit der Integration externer Geo- und Points-of-Interest (POI)-Datenquellen. Hierbei werden aktuelle räumliche Daten aus OpenStreetMap, Wikivoyage, Wikidata und geotaggten Social-Media-Inhalten abgerufen, um relevante touristische Sehenswürdigkeiten und Veranstaltungen zu identifizieren. Diese Daten werden in den Generationsprozess eingespeist, um eine präzise und kontextualisierte Darstellung der gesammelten Informationen zu ermöglichen. Die zweite Phase des Workflows beinhaltet die Optimierung des Prompt Engineering, bei dem strukturierte Geo-Daten in narrativ formulierte Texte umgewandelt werden, die anschließend von generativen open-source Modellen wie Stable Diffusion oder DeepSeek-VL2 verarbeitet werden. Für die Erzeugung bildhafter Kartensymbole sollen Text-zu-Bild-Methoden eingesetzt werden. Dabei wird durch den Einsatz von Natural Language Processing (NLP) und bildgenerativen Modellen eine nahtlose Verbindung zwischen textuellen und visuellen Informationen geschaffen. Es sollen sowohl vortrainierten Modellen eingesetzt werden, als auch ein Training mit spezifischen kartographischen bzw. handgezeichneten Stilen erfolgen, so das neue angepasste Low-Rank Adaptation (LoRA) Modelle entstehen. Für die Einbettung der bildhaften Kartenelemente in die Basiskarte werden Bild-zu-Bild-basierte Verfahren zur Anwendung kommen. Es soll erforscht werden, wie eine nahtlose Integration von Vorder- und Hintergrundinformationen erreicht werden kann. Ein weiteres zentrales Merkmal dieses Ansatzes ist die Möglichkeit der Personalisierung der Kartenerstellung. Nutzeranfragen, wie etwa für „familienfreundliche Sehenswürdigkeiten“ oder aktuelle Veranstaltungen, werden durch den Abruf von Live-Daten und personalisierten Präferenzen unterstützt, um individuell zugeschnittene, interaktive Karten zu generieren. Der Einsatz von RAG ermöglicht es, aktuelle, relevante und kontextualisierte Daten in Echtzeit zu integrieren, was zu einer dynamischen und nutzerspezifischen Kartenerstellung führt. Die Evaluierung wird in Form von Nutzbarkeitsstudien durchgeführt. Hierzu werden Bildkarten verwendet, die für verschiedene Städte, Themen und Nutzergruppen angepasst sind. Darüber hinaus wird eine vergleichende Analyse mit manuell erstellten Bildkarten durchgeführt. Die Nutzerzufriedenheit und die Akzeptanz generativer Kartendarstellungen werden bewertet und so Erkenntnisse für die Weiterentwicklung generativer Kartenerstellungsmethoden gewonnen.
DFG-Verfahren Sachbeihilfen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung