Detailseite
Erklärungen zur Unterstützung gesunden Misstrauens in Large Language Models (C01)
Fachliche Zuordnung
Allgemeine, Kognitive und Mathematische Psychologie
Künstliche Intelligenz und Maschinelle Lernverfahren
Künstliche Intelligenz und Maschinelle Lernverfahren
Förderung
Förderung seit 2021
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 438445824
ML-Modelle haben Grenzen, weshalb es angebracht sind, sie zu hinterfragen und ihnen zu misstrauen. In C01 wurde eine gemeinsame Terminologie für Vertrauen und Misstrauen erarbeitet, nachgewiesen, dass Disclaimer nicht ausreichen, gesundes Misstrauen zu erzeugen, und neue Methoden entwickelt, um Modellunsicherheiten zu erklären. Wir werden nun Interventionen entwickeln, um gesundes Misstrauen beim akademischen Schreiben mit LLM-Unterstützung zu fördern, und zwar durch eine neue Art von Erklärungen, die wir „perplexing explanations“ nennen. Diese werden im TRR auch als automatische Methode genutzt werden können, um menschliche Autonomie in der Arbeit mit KI-Systemen zu unterstützen.
DFG-Verfahren
Transregios
Teilprojekt zu
TRR 318:
Erklärbarkeit konstruieren
Antragstellende Institution
Universität Paderborn
Teilprojektleiterinnen / Teilprojektleiter
Professorin Dr. Barbara Hammer; Professor Dr. Benjamin Paaßen, seit 1/2026; Professorin Dr. Ingrid Scharlau
