Detailseite
Projekt Druckansicht

Erklärungen zur Unterstützung gesunden Misstrauens in Large Language Models (C01)

Fachliche Zuordnung Allgemeine, Kognitive und Mathematische Psychologie
Künstliche Intelligenz und Maschinelle Lernverfahren
Förderung Förderung seit 2021
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 438445824
 
ML-Modelle haben Grenzen, weshalb es angebracht sind, sie zu hinterfragen und ihnen zu misstrauen. In C01 wurde eine gemeinsame Terminologie für Vertrauen und Misstrauen erarbeitet, nachgewiesen, dass Disclaimer nicht ausreichen, gesundes Misstrauen zu erzeugen, und neue Methoden entwickelt, um Modellunsicherheiten zu erklären. Wir werden nun Interventionen entwickeln, um gesundes Misstrauen beim akademischen Schreiben mit LLM-Unterstützung zu fördern, und zwar durch eine neue Art von Erklärungen, die wir „perplexing explanations“ nennen. Diese werden im TRR auch als automatische Methode genutzt werden können, um menschliche Autonomie in der Arbeit mit KI-Systemen zu unterstützen.
DFG-Verfahren Transregios
Antragstellende Institution Universität Paderborn
Teilprojektleiterinnen / Teilprojektleiter Professorin Dr. Barbara Hammer; Professor Dr. Benjamin Paaßen, seit 1/2026; Professorin Dr. Ingrid Scharlau
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung