Relevanzlernen für temporale neuronale Karten / Relevance Learning for temporal Neural Maps
Final Report Abstract
Ziel des Projekts war die Entwicklung von Analysemethoden für kurze hochdimensionale Zeitreihen mithilfe von interpretierbaren Prototyp-basierten Modellen. Dabei sollten insbesondere Methoden des Relevanzlernens auf dieses Gebiet übertragen werden,die es erlauben, die Relevanz von Modellgrößen wie etwa Eingabesignale, Zeitpunkte, Datenpunkte, oder geeignete abgeleitete Informationen automatisch auf der Basis von Zusatzinformation zu bestimmen. Ein Test der Methoden sollte insbesondere im Bereich der biomedizinischen Datenanalyse stattfinden. Im Rahmen des Projekts gelang es, zwei verschiedene grundlegende Verfahren zu entwickeln, die die Analyse von Zeitreihen unter vorgegebener Zusatzinformation erlauben: ein rekursives Modell, die generative topographic mapping through time, konnte mithilfe der Zusatzinformation zu einem überwachten Modell erweitert werden. Unter Ausnutzung einer geeigneten Kostenfunktion für die Klassifikation konnten dann Relevanzterme für wichtige Modellgrößen durch einen Gradientenabstieg parallel zur Adaptation der Modellparameter bestimmt werden. Als Alternative wurden wichtige überwachte und unüberwachte Modelle für allgemeine Ähnlichkeitsmaße in sogenannten relationalen Modellen erweitert, so dass Zeitreihen mithilfe geeigneter Metriken im Modell berücksichtigt werden können. Hier wurde insbesondere untersucht, wie man die Relevanz einzelner Datenpunkte für das gelernte Modell bestimmen und so adaptieren kann, dass spärliche Modelle erhalten werden. Einen wichtigen Aspekt stellte neben der Untersuchung prinzipieller Eigenschaften wie der Konvergenz der Lernverfahren oder der Lernbarkeit bei überwachten Modellen die Effizienz der entwickelten Verfahren dar. Für relationale Modelle wurden zwei Approximationen entwickelt, die die ursprünglich quadratische Zeit- und Platzkomplexität auf lineare Zeitkomplexität und konstanten Speicherbedarf des trainierten Modells beschränken, und so die Verfahren auch für große Datenmengen einsetzbar machen. Die Verfahren wurden in mehreren Anwendungen im biomedizinischen Bereich erfolgreich eingesetzt. Untersucht wurden einerseits im Zusammenhang relationaler Modelle allgemeine als Ähnlichkeiten charakterisierte Daten, insbesondere Ähnlichkeitsdaten für Spektren sowie biologische Sequenzdaten. Es stellte sich heraus, dass lineare Approximationen hier abhängig von der intrinsischen Dimension der Daten im pseudo-euklidischen Raum gute Ergebnisse liefern. Ferner wurden mit rekursiven Modellen Zeitreihen untersucht, die aus dem Bereich der Genexpression stammen, Bewegungsdaten bei Stabinsekten, sowie durch eine elektronische Nase gemessene chemische Stoffe. Es wurde demonstriert, dass die entwickelten Methoden es hier ermöglichen, relevante Zeitpunkte und relevante Eingabesignale herauszufiltern.
Publications
-
Efficient Kernelized Prototype-based Classification, Journal of Neural Systems, 2011, 21(6): 443- 457
F.-M. Schleif, T. Villmann, B. Hammer, P. Schneider
-
Genetic algorithm for shift-uncertainty correction in 1-D NMR based metabolite identifications and quantifications, Bioinformatics, 2011, 27(4): 524-533
F.-M. Schleif, T. Riemer, U. Börner, L. Schnapka-Hille, M. Cross
-
Approximation techniques for clustering dissimilarity data, Neurocomputing, 2012, 90:72-84
X. Zhu, A. Gisbrecht, F.-M. Schleif, B. Hammer
-
Learning relevant time points for time-series data in the life sciences, Proceedings of ICANN 2012, pp. 531-539
F.-M. Schleif, B. Mokbel, A. Gisbrecht, L. Theunissen, V. Dürr, B. Hammer
-
Limited Rank Matrix Learning, Discriminative Dimension Reduction and Visualization, Neural Networks, 2012, 26:159-173
K. Bunte, P. Schneider, B. Hammer, F.-M. Schleif, T. Villmann, M. Biehl
-
Relevance learning for short highdimensional time series in the life sciences, Proceedings of IJCNN 2012, pp. 2069-2076
F.-M. Schleif, A. Gisbrecht, B. Hammer