Kontextentdeckung in Informationsnetzwerken
Zusammenfassung der Projektergebnisse
Das Ziel des Forschungsstipendiums war, Verfahren zur Kontextentdeckung in heterogenen Daten zu entwickeln. Diese heterogenen Daten können mithilfe von Informationsnetzwerken einheitlich dargestellt werden. So speichert ein Informationsnetzwerk Informationen in Form von Beziehungen zwischen Objekten in einer Graphstruktur, wobei Objekte als Knoten und Beziehungen zwischen Objekten als Kanten repräsentiert werden. Ein Objekt umfasst dabei nicht nur materielle Gegenstände, sondern auch immaterielle, beispielsweise Ideen, Handlungen oder Ereignisse. Auf Basis dieser einheitlichen Darstellung wurden im Rahmen des Stipendiums zwei Verfahren zum Extrahieren semantischer Informationen entwickelt. Das erste Verfahren, mit dem Namen FCDA (Fault-tolerant Concept Detection Algorithm), sucht in diesen Netzwerken nach Konzepten. Ein solches Konzept z.B. Tier repräsentiert eine Gruppe von Objekten z.B. Affe mit gemeinsamen Eigenschaften z.B. lebt. Durch seine Fehlertoleranz findet FCDA diese Konzepte auch, wenn Verbindungen zu einzelnen Eigenschaften aufgrund von unvollständigen Daten oder Wissen fehlen. Die so aufgedeckten fehlenden Verbindungen werden anschließend mithilfe einer Bewertungsfunktion, welche die Wahrscheinlichkeit des Fehlens sowie den Interessantheitsgrad bewertet, dem Anwender sortiert präsentiert. Das zweite Verfahren, mit dem Namen ParTX (Parameter-Free Taxonomy Extraction), ordnet Eigenschaften von Objekten in einem Baum hierarchisch an. Dabei bildet die allgemeinste Eigenschaft die Wurzel des Baumes und die sehr speziellen Eigenschaften die Blätter des Baumes. Die so extrahierten Hierarchien ermöglichen sowohl einen Überblick über die Daten als auch das Erforschen spezieller Eigenschaften. Die so gewonnen Informationen über die hierarchischen Beziehtmgen zwischen den verschiedenen Eigenschaften können verwendet werden, um die mithilfe des ersten Verfahrens gefundenen fehlenden Verbindungen auf ihre Plausibilität hin zu untersuchen. So ist zum Beispiel eine fehlende Verbindung zwischen einem Objekt und einer Eigenschaft plausibler, wenn dieses Objekt bereits eine Eigenschaft besitzt z.B. atmet, welche eine Spezialisierung der als fehlend gefundenen Eigenschaft z.B. lebt ist.
Projektbezogene Publikationen (Auswahl)
- "Fault-tolerant Concept Detection in Information Networks", in PAKDD, pp. 410-421, 2014
Tobias Kötter, Stephan Günnemann, Michael R. Berthold, and, Christos Faloutsos
(Siehe online unter https://doi.org/10.1007/978-3-319-06608-0_34)