Detailseite
Projekt Druckansicht

Statistische, rechnerische und algorithmische Aspekte des Kernel-Clustering

Fachliche Zuordnung Theoretische Informatik
Mathematik
Förderung Förderung seit 2022
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 499522214
 
Clustering ist eines der grundlegenden Probleme in der Datenanalyse, und Kernel-Clustering-Algorithmen gehören zu den beliebtesten Clustering-Techniken. Kernel-Clustering-Algorithmen können latente Gruppen in komplexen Daten anhand von paarweisen Ähnlichkeiten zwischen den Daten finden, die mithilfe einer vordefinierten Kernel-Funktion berechnet werden. Kernel-Methoden basieren auf der mathematischen Theorie der reproduzierenden Kernel, die insbesondere im Kontext des überwachten maschinellen Lernens bei der theoretischen Analyse der statistischen Eigenschaften dieser Methoden hilft. Im Vergleich dazu gibt es nur wenig mathematisches Verständnis für die Rolle von Kerneln beim Clustering. Dieses Projekt befasst sich mit dem mangelnden Verständnis von Kernel-Clustering-Algorithmen. Insbesondere kombiniert dieses Projekt mathematische und numerische Forschung, um drei Schlüsselfragen zum Kernel-Clustering zu beantworten: (1) Welche Art von zugrundeliegenden Clusterstrukturen können durch Kernel-Clustering statistisch wiederhergestellt werden? (2) Wie schneiden effiziente Kernel-Clustering-Algorithmen bei großen Datensätzen ab? (3) Welche Verbindung besteht zwischen Kernel-Clustering und anderen Clustering-Ansätzen? Um diese Fragen zu beantworten, werden im Rahmen des Projekts theoretische Untersuchungen zu den statistischen Garantien des Kernel-Clustering für die Wiederherstellung geplanter Cluster, zum statistisch-rechnerischen Kompromiss des Kernel-Clustering und zu den Verbindungen zwischen Kernel-Clustering und verteilungsbasiertem Clustering durchgeführt. Als Folge der theoretischen Studie wird das Projekt auch neue rechnerisch effiziente und interpretierbare Clustering-Algorithmen entwickeln. Angesichts der kürzlich etablierten Rolle der Kernel-Theorie in der Analyse des überwachten maschinellen Lernens und des Deep Learnings bietet dieses Projekt außerdem einen Baustein für ein tieferes Verständnis moderner Clustering- und unüberwachter Lernalgorithmen.
DFG-Verfahren Sachbeihilfen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung