Detailseite
Die Epistemologie der Statistischen Lerntheorie
Antragsteller
Dr. Tom Sterkenburg
Fachliche Zuordnung
Theoretische Philosophie
Theoretische Informatik
Theoretische Informatik
Förderung
Förderung von 2019 bis 2023
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 437206810
Maschinelles Lernen hat immer größere Auswirkungen auf Wissenschaft und Gesellschaft. Dies erfordert nachhaltige Bemühungen für ein besseres Verständnis, nicht nur der (sozialen, ethischen und anderen) Folgen des allgegenwärtigen Einsatzes von maschinellen Lernmethoden, sondern auch dieser Methoden selbst. Was erklärt ihren offensichtlichen Erfolg? In welchem Sinne und in welchem Umfang führen sie zu verlässlichen Schlussfolgerungen? Was sind ihre unvermeidlichen Grenzen?Diese Fragen beziehen sich auf die Art und Rechtfertigung unsicherer oder induktiver Inferenz: grundlegende epistemologische Fragen. Dennoch haben sich Philosophen bisher wenig mit diesen Fragen in Bezug auf moderne maschinelle Lernalgorithmen beschäftigt. Gleichzeitig haben Forscher in der Theorie des maschinellen Lernens leistungsfähige mathematische Rahmen entwickelt, um die Funktionsweise von Lernalgorithmen zu untersuchen. Insbesondere die Statistische Lerntheorie (SLT) bildet den theoretischen Rahmen, der einem Großteil des modernen maschinellen Lernens zugrunde liegt.Ziel meines Projekts ist es, den Rahmen der SLT zu nutzen, um philosophische Probleme der induktiven Inferenz zu untersuchen und diese Untersuchungen in eine breitere epistemologische Bewertung von Methoden des maschinellen Lernens zu integrieren. Dieses Hauptziel findet in drei Phasen konkrete Gestalt. Die erste Phase betrifft die grundlegenden Grenzen der induktiven Inferenz, und im Zusammenhang mit SLT insbesondere, die No-Free Lunch Theoreme als deren Ausdruck. Ich werde eine einheitliche Perspektive ausarbeiten, indem ich für eine möglichst fruchtbare Interpretation der No-Free Lunch Theoreme plädiere und darlege, wie Ergebnisse innerhalb der Philosophie als Instanziierungen der No-Free Lunch Theoreme verstanden werden können. Die zweite Stufe betrifft stärker den Erfolg von Lernmethoden und deren mögliche Erklärungen, insbesondere die Einhaltung einer Einfachheitspräferenz in der induktiven Inferenz. Ich werde angeben, in welchem minimalen, aber dennoch authentischen Sinn, SLT ein Argument für die Rechtfertigung von Occams Rasiermesser liefert.Die ersten beiden Phasen treffen schließlich in der aktuellen wissenschaftlichen Debatte darüber zusammen, wie der praktische Erfolg des besonderen Lernparadigmas der tiefen neuronalen Netzen erklärt werden kann. In der dritten Phase werde ich diese Debatte als wichtige Fallstudie in der Philosophie der induktiven Inferenz analysieren. Diese Debatte knüpft zudem an eine allgemeinere Diskussion über die Rolle der Theorie des maschinellen Lernens und ihre Auswirkungen auf die traditionelle Epistemologie an. Ich werde gegen die Ansicht argumentieren, dass der praktische Erfolg des maschinellen Lernens eine Epistemologie rechtfertigt, die die Rolle der theoretischen Analyse herunterspielt. Dies dient auch als Verteidigung der Annahme meines Projekts, dass die Theorie des maschinellen Lernens für ihre epistemologische Beurteilung von großem Wert ist.
DFG-Verfahren
Sachbeihilfen