Detailseite
Maschinelles Lernen Tiefer Repräsentationen zur Schätzung von Klassenhäufigkeiten
Antragsteller
Dr. Mirko Bunse
Fachliche Zuordnung
Künstliche Intelligenz und Maschinelle Lernverfahren
Förderung
Förderung seit 2026
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 576571177
Der vorliegende Projektantrag behandelt eine zentrale Herausforderung des überwachten maschinellen Lernens: die Schätzung von variierenden Klassenhäufigkeiten in mehreren großen Datensätzen anstelle der üblichen Klassifikation einzelner Datenpunkte. Die Lösung dieser Herausforderung ist entscheidend für vielfältige Anwendungsbereiche, wie etwa Physik, Sozialwissenschaften, öffentliche Gesundheit und Umwelt-Monitoring, bei denen das Verständnis der globalen Häufigkeit bestimmter Klassen (z. B. Teilchentypen, Meinungen, Insekten- oder Planktonpopulationen) wichtiger ist als die Analyse einzelner Instanzen. Die Schätzung von Klassenhäufigkeiten (Class Frequency Estimation, CFE) hat sich zu einem eigenständigen Bereich des maschinellen Lernens entwickelt, mit maßgeschneiderten Methoden und Evaluierungsmaßnahmen. Frühere Arbeiten des Antragstellers zeigen auf, dass sich bestehende CFE-Algorithmen hauptsächlich in ihren Datenrepräsentationen unterscheiden, während andere Aspekte, wie etwa Verlustfunktionen, oft nur spezifische Anforderungen der Anwendungsbereiche abbilden. Andere Forscher haben darüber hinaus Fortschritte bei der Charakterisierung optimaler Datenrepräsentationen im speziellen Fall von Prior Probability Shift erzielt. Dennoch bleiben zwei zentrale Herausforderungen bestehen: (1) Wie können optimale Datenrepräsentationen aus Trainingsdatensätzen endlichen Umfangs gelernt werden? und (2) Wie lassen sich komplexe Verschiebungen in den Verteilungen der Datensätze über die Standardannahme eines Prior Probability Shift hinaus bewältigen? Diese ungelösten Fragen schränken die breitere Anwendbarkeit aktueller CFE-Methoden ein, obwohl eine dringende Nachfrage nach genauen Schätzungen von Klassenhäufigkeiten besteht. Das vorliegende Projekt zielt darauf ab, diese Forschungslücken durch die Entwicklung robuster CFE-Methoden mit optimierten CFE-Datenrepräsentationen zu schließen. Der Ansatz umfasst neuartige Deep-Learning-Architekturen und repräsentationsspezifische Verlustfunktionen, die darauf ausgelegt sind, schwerwiegende und komplexe Verschiebungen in den Verteilungen der Datensätze zu bewältigen. Der Erfolg wird durch empirische Benchmarks und grundlegende Theorien zur rigorosen Bewertung der Performanz von CFE-Methoden sichergestellt, in Erwartung erheblicher Vorteile für die vielfältigen Anwendungsbereiche von CFE.
DFG-Verfahren
Sachbeihilfen
Internationaler Bezug
Brasilien, Italien, Spanien
Mitverantwortliche
Professor Dr. Jakob Rehof; Professor Dr. Wolfgang Rhode
Kooperationspartner
Dr. Pablo González; Dr. André Maletzke; Dr. Alejandro Moreo Fernandez; Dr. Fabrizio Sebastiani
