Context discovery in information networks

Applicant Dr. Tobias Kötter

Subject Area Software Engineering and Programming Languages

Term from 2012 to 2014

Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 233032739

Final Report Year 2014

Final Report Abstract

Das Ziel des Forschungsstipendiums war, Verfahren zur Kontextentdeckung in heterogenen Daten zu entwickeln. Diese heterogenen Daten können mithilfe von Informationsnetzwerken einheitlich dargestellt werden. So speichert ein Informationsnetzwerk Informationen in Form von Beziehungen zwischen Objekten in einer Graphstruktur, wobei Objekte als Knoten und Beziehungen zwischen Objekten als Kanten repräsentiert werden. Ein Objekt umfasst dabei nicht nur materielle Gegenstände, sondern auch immaterielle, beispielsweise Ideen, Handlungen oder Ereignisse. Auf Basis dieser einheitlichen Darstellung wurden im Rahmen des Stipendiums zwei Verfahren zum Extrahieren semantischer Informationen entwickelt. Das erste Verfahren, mit dem Namen FCDA (Fault-tolerant Concept Detection Algorithm), sucht in diesen Netzwerken nach Konzepten. Ein solches Konzept z.B. Tier repräsentiert eine Gruppe von Objekten z.B. Affe mit gemeinsamen Eigenschaften z.B. lebt. Durch seine Fehlertoleranz findet FCDA diese Konzepte auch, wenn Verbindungen zu einzelnen Eigenschaften aufgrund von unvollständigen Daten oder Wissen fehlen. Die so aufgedeckten fehlenden Verbindungen werden anschließend mithilfe einer Bewertungsfunktion, welche die Wahrscheinlichkeit des Fehlens sowie den Interessantheitsgrad bewertet, dem Anwender sortiert präsentiert. Das zweite Verfahren, mit dem Namen ParTX (Parameter-Free Taxonomy Extraction), ordnet Eigenschaften von Objekten in einem Baum hierarchisch an. Dabei bildet die allgemeinste Eigenschaft die Wurzel des Baumes und die sehr speziellen Eigenschaften die Blätter des Baumes. Die so extrahierten Hierarchien ermöglichen sowohl einen Überblick über die Daten als auch das Erforschen spezieller Eigenschaften. Die so gewonnen Informationen über die hierarchischen Beziehtmgen zwischen den verschiedenen Eigenschaften können verwendet werden, um die mithilfe des ersten Verfahrens gefundenen fehlenden Verbindungen auf ihre Plausibilität hin zu untersuchen. So ist zum Beispiel eine fehlende Verbindung zwischen einem Objekt und einer Eigenschaft plausibler, wenn dieses Objekt bereits eine Eigenschaft besitzt z.B. atmet, welche eine Spezialisierung der als fehlend gefundenen Eigenschaft z.B. lebt ist.

Publications

"Fault-tolerant Concept Detection in Information Networks", in PAKDD, pp. 410-421, 2014
Kötter, Tobias; Günnemann, Stephan; Berthold, Michael R. & Faloutsos, Christos

Servicenavigation

Hauptnavigation

Context discovery in information networks

Final Report Abstract

Publications

Additional Information

Servicenavigation

Hauptnavigation

Context discovery in information networks

Final Report Abstract

Publications

Additional Information

Textvergrößerung und Kontrastanpassung