Maschinelles Lernen Tiefer Repräsentationen zur Schätzung von Klassenhäufigkeiten

Antragsteller Dr. Mirko Bunse

Fachliche Zuordnung Künstliche Intelligenz und Maschinelle Lernverfahren

Förderung Förderung seit 2026

Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 576571177

Projektbeschreibung

Der vorliegende Projektantrag behandelt eine zentrale Herausforderung des überwachten maschinellen Lernens: die Schätzung von variierenden Klassenhäufigkeiten in mehreren großen Datensätzen anstelle der üblichen Klassifikation einzelner Datenpunkte. Die Lösung dieser Herausforderung ist entscheidend für vielfältige Anwendungsbereiche, wie etwa Physik, Sozialwissenschaften, öffentliche Gesundheit und Umwelt-Monitoring, bei denen das Verständnis der globalen Häufigkeit bestimmter Klassen (z. B. Teilchentypen, Meinungen, Insekten- oder Planktonpopulationen) wichtiger ist als die Analyse einzelner Instanzen. Die Schätzung von Klassenhäufigkeiten (Class Frequency Estimation, CFE) hat sich zu einem eigenständigen Bereich des maschinellen Lernens entwickelt, mit maßgeschneiderten Methoden und Evaluierungsmaßnahmen. Frühere Arbeiten des Antragstellers zeigen auf, dass sich bestehende CFE-Algorithmen hauptsächlich in ihren Datenrepräsentationen unterscheiden, während andere Aspekte, wie etwa Verlustfunktionen, oft nur spezifische Anforderungen der Anwendungsbereiche abbilden. Andere Forscher haben darüber hinaus Fortschritte bei der Charakterisierung optimaler Datenrepräsentationen im speziellen Fall von Prior Probability Shift erzielt. Dennoch bleiben zwei zentrale Herausforderungen bestehen: (1) Wie können optimale Datenrepräsentationen aus Trainingsdatensätzen endlichen Umfangs gelernt werden? und (2) Wie lassen sich komplexe Verschiebungen in den Verteilungen der Datensätze über die Standardannahme eines Prior Probability Shift hinaus bewältigen? Diese ungelösten Fragen schränken die breitere Anwendbarkeit aktueller CFE-Methoden ein, obwohl eine dringende Nachfrage nach genauen Schätzungen von Klassenhäufigkeiten besteht. Das vorliegende Projekt zielt darauf ab, diese Forschungslücken durch die Entwicklung robuster CFE-Methoden mit optimierten CFE-Datenrepräsentationen zu schließen. Der Ansatz umfasst neuartige Deep-Learning-Architekturen und repräsentationsspezifische Verlustfunktionen, die darauf ausgelegt sind, schwerwiegende und komplexe Verschiebungen in den Verteilungen der Datensätze zu bewältigen. Der Erfolg wird durch empirische Benchmarks und grundlegende Theorien zur rigorosen Bewertung der Performanz von CFE-Methoden sichergestellt, in Erwartung erheblicher Vorteile für die vielfältigen Anwendungsbereiche von CFE.

DFG-Verfahren Sachbeihilfen

Internationaler Bezug Brasilien, Italien, Spanien

Mitverantwortliche Professor Dr. Jakob Rehof; Professor Dr. Wolfgang Rhode

Kooperationspartner Dr. Pablo González; Dr. André Maletzke; Dr. Alejandro Moreo Fernandez; Dr. Fabrizio Sebastiani

Servicenavigation

Hauptnavigation

Maschinelles Lernen Tiefer Repräsentationen zur Schätzung von Klassenhäufigkeiten

Zusatzinformationen

Servicenavigation

Hauptnavigation

Maschinelles Lernen Tiefer Repräsentationen zur Schätzung von Klassenhäufigkeiten

Zusatzinformationen

Textvergrößerung und Kontrastanpassung