Detailseite
Projekt Druckansicht

Konfidenzbasiertes Lernen: Etablierung einer neuen Form des Lernens ohne Feedback

Antragsteller Dr. Marcus Rothkirch, seit 2/2022
Fachliche Zuordnung Kognitive und systemische Humanneurowissenschaften
Biologische Psychiatrie
Förderung Förderung von 2018 bis 2024
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 403630675
 
Erstellungsjahr 2024

Zusammenfassung der Projektergebnisse

Lernen ist eine zentrale und überlebenswichtige menschliche Fähigkeit zur Verbesserung und Anpassung in einer sich ständig verändernden Welt. Die meisten Lerntheorien fokussieren sich auf Mechanismen, wie Menschen durch externes Feedback lernen. Zugleich lernen Menschen in vielen Fällen auch in Abwesenheit von externem Feedback. Ein Beispiel hierfür ist das private Üben eines Musikinstruments, bei dem das Feedback nicht von einem externen Lehrer kommt, sondern aus uns selbst. Dieses selbstbewertende Feedback ist ein Mechanismus, den Forscher als Metakognition bezeichnen, oder, wenn sich eine solche interne Bewertung auf die Richtigkeit unserer Handlungen bezieht, als Konfidenz. Die zentrale Hypothesedieses Projekts ist, dass es eine grundlegende Parallele zwischen externem belohnungsbasiertem Feedback (z. B. monetäre Belohnungen) und internem, auf Konfidenz basierendem Feedback gibt. Diese Hypothese wurde in zwei grundlegenden Lernformen untersucht – instrumentelle und klassische Konditionierung. Instrumentelle Konditionierung bezieht sich auf Lernvorgänge, bei denen Feedback den relativen Wert von Handlungsoptionen verändert, zwischen denen ein Individuum wählen kann. Beispielsweise ziehen wir womöglich einen Spaziergang einer öffentlichen Verkehrsmittelverbindung vor, wenn wir wiederholt schlechte Erfahrungen mit letzterer gemacht haben. Die zentrale Frage ist: beeinflusst Konfidenz den Wert von Wahlmöglichkeiten ähnlich wie externes Feedback? Um dies herauszufinden, wurden Teilnehmer in Belohnungsexperimenten getestet, in dem sie zunächst Belohnungsverstärkungen für eine Reihe von Wahlmöglichkeiten erhielten, dann aber in eine Phase ohne Belohnungsverstärkung eintraten, in der das einzige verfügbare Feedback intern war (Konfidenz). Es zeigte sich, dass die subjektiven Präferenzen in dieser Phase weiterhin dynamischen Veränderungen unterlagen und dass diese Veränderungen durch ein „Konfidenzvorhersagefehler“- Signal erklärt wurden – der Unterschied zwischen vorhergesagter und tatsächlicher Konfidenz. Die klassische Konditionierung ist vielen durch Pawlows Experimente mit Hunden bekannt und bezieht sich auf Lernvorgänge, bei denen ein zuvor neutraler Reiz durch wiederholte Paarung mit einer Form der Verstärkung einen Wert erlang. Wenn Konfidenz eine Form intern erzeugter Belohnung ist, sollte es zu ähnlichen Verstärkungseffekten führen, wenn sie systematisch mit neutralen Reizen gekoppelt wird. Wir überprüften diese Vorhersage in einem Paradigma, bei dem neutrale Töne entweder mit hoher oder niedriger Konfidenz in einer perzeptuellen Entscheidungsaufgabe assoziiert waren. Es zeigte sich, dass dieses neuartige Verstärkungsschema zu ähnlichen behavioralen und physiologischen Konditionierungseffekten führte, wie sie von belohnungsbasierter Verstärkung bekannt sind – einschließlich Extinktionseffekten. Um die Berechnungen solcher metakognitiver Lernsignale besser zu verstehen, wurde die Toolbox ReMeta entwickelt, die es ermöglicht, metakognitive Verzerrungen und Ineffizienzen aus Konfidenzdatensätzen zu schätzen.

Projektbezogene Publikationen (Auswahl)

 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung