Detailseite
Verteilungsregression mit tiefen künstlichen neuronalen Netzen
Antragsteller
Dr. Benjamin Säfken
Fachliche Zuordnung
Statistik und Ökonometrie
Förderung
Förderung seit 2020
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 450330162
Die datengetriebene Digitalisierung führt zu einer zunehmenden Verfügbarkeit großer unstrukturierter und heterogener Datenmengen und –typen, z.B. Bilder oder Texte. Diese unterliegen eingeschränkten Möglichkeiten der Nutzbarmachung insbesondere hinsichtlich der empirischen Analyse mit herkömmlichen statistischen Verfahren, wie z. B. Regressionsmodellen. Hingegen wurden im Bereich des maschinellen Lernens bei Verfahren zur prädiktiven Verarbeitung dieser Datentypen, speziell solchen des tiefen Lernens, enorme Fortschritte erzielt. Der Fokus dieser Verfahren liegt, im Gegensatz zu fortgeschrittenen Verfahren der Verteilungsregression, allerdings häufig auf der Prädiktion und weniger auf der Unsicherheitsmodellierung. Zusätzlich führt die komplexe Struktur der Modelle zu einem Mangel an Erklärbarkeit. Ziel dieses Projekts ist die Nutzbarmachung der, dem tiefen Lernen zugrundeliegenden, neuronalen Netze für die Inferenz in Modellen der strukturiert additiven Verteilungsregression.Die angestrebte Synthese der Modelle ermöglicht eine explizite wahrscheinlichkeitstheoretische Quantifizierung der Zielgröße und somit, im Kontrast zu einer vielfachen Fokussierung auf die reine Prädiktion des Mittelwerts, eine vollständige Modellierung der, der Zielgröße unterliegenden Verteilung. Durch die Inkludierung erweiterter Modelle der Verteilungsregression wie z.B. bivariater Zielgrößen basierend auf Copulas führt dieser Forschungsansatz zu einer Komplexitätsausweitung der Struktur der prädiktorabhängigen Variable unter Beibehaltung der für tiefe neuronale Netzwerke kennzeichnenden komplexen Struktur der erklärenden Größen. Effektspezifisch interpretierbare Parameter ermöglichen darüber hinaus die Integration einer für den Menschen nachvollziehbaren Erklärbarkeitskomponente in das tiefe neuronale Netz. Auch lässt sich über Inferenzverfahren und (asymptotische) Verteilungsannahmen an die geschätzten Parameter die Güte des spezifizierten Modells bewerten. Durch die Verwendung performanter Algorithmen zur Optimierung tiefer neuronaler Netze lassen sich aus Sicht strukturiert additiver Verteilungsregression solche Modelle auch für größere Datensätze schätzen als mit den bisher üblichen Implementierungen. Zusätzlich kann mit der Darstellbarkeit beliebig komplexer Funktionen durch neuronale Netze die vorgegebene additive Struktur des Prädiktors in der strukturiert additiven Verteilungsregression fallengelassen werden und komplexere funktionale Zusammenhänge und Interaktionen können in dem Prädiktor repräsentiert werden. Die anvisierten Forschungsergebnisse liefern somit einen vielversprechenden Ansatz zur Nutzung künstlicher Intelligenz für die statistische Analyse und können zur Nachvollziehbarkeit und Erklärbarkeit tiefer neuronaler Netze beitragen. Gleichzeitig eröffnet dieses Projekt Ansatzmöglichkeiten auch komplexere Datentypen wie Bilder vollumfänglich in empirischen Fragestellungen zu berücksichtigen.
DFG-Verfahren
Sachbeihilfen