Detailseite
Konzeptbasiertes Retrieval und Informationsfusion in heterogenen Dokumentbeständen
Antragsteller
Professor Dr.-Ing. Alois Knoll
Fachliche Zuordnung
Theoretische Informatik
Förderung
Förderung von 2001 bis 2006
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 5254619
Ziel dieses Teilprojekts ist die Entwicklung von praktisch einsetzbaren Methoden für konzeptbasiertes Suchen/Retrieval und für die Informationsfusion in heterogenen Dokumenten. Ihre Verfügbarkeit ist Vorbedingung für eine effiziente Navigation des Menschen durch riesige multimediale Dokumentenmengen und die automatische Auswertung von Redundanz bzw. Elimination von Widersprüchen in den Daten/Dokumenten. Sie erlauben ferner die Erkennung und Nutzung von Bezügen innerhalb von Dokumenten heterogener Struktur und über Dokumentgrenzen hinweg. Die Retrievalmethodik soll in der Lage sein, eine hinreichend gute Interpretation bzw. Approximation der in der zugrundeliegenden Wissensdomäne verwendeten Konzepte vorzunehmen, und zwar in allen Repräsentationsformen. Es wird dazu ein gewisses Verständnis von Bildern und Texten angestrebt, allerdings nicht im Sinne einer 1:1-Interpretation, sondern nur im Hinblick auf eine derart reduzierte Komplexität der Konzeptimplementierungen, daß im Hinblick auf das Retrieval nützliche Approximationen der Zielkonzepte gebildet werden. Dieses Verständnis für das Vorhandensein von Zielkonzepten in Dokument(teilen) unterschiedlicher Repräsentationsformen macht darüberhinaus die Nutzung inhaltlicher Bezüge innerhalb komplexer Dokumente und zwischen assoziierten Dokumenten möglich. Sowohl die Konzeptinterpretation als auch die Interpretation von Bezügen kann nur gelingen, wenn mächtige und zugleich handhabbare Methoden zur Fusion der unterschiedlichen heterogenen Informationsquellen unter Nuztzung ihrer Glaubwürdigkeit entwickelt werden. Diese Prozesse sollen wissensbasiert, d. h. unter Ausnutzung domänenunabhängigen und domänenspezifischen Wissens, gesteuert werden. Nur damit läßt sich für den weiteren Mining-Prozeß ein zugeschnittenes Ergebnisdokument erzeugen, das die unter einer Anfrage optimal nützliche, aus dem Datenarchiv zu extrahierende Information, enthält. Die Methoden zum konzeptbasierten Retrieval und zur Informationsfusion sollen in das Mining-Kernsystem eingebaut werden. Sie sollen auf der Fernerkundungsdomäne getestet werden; die dort voorhandenen Daten sollen um textuelle Daten dieser Domäne, die aus dem WWW extrahiert werden, nochmals deutlich erweitert werden.
DFG-Verfahren
Sachbeihilfen