Detailseite
Individuelle Textcorpora zur Sprachmodellierung von Persönlichkeit, Wissen und Intelligenz
Antragsteller
Dr. Markus Josef Hofmann
Fachliche Zuordnung
Allgemeine, Kognitive und Mathematische Psychologie
Persönlichkeitspsychologie, Klinische und Medizinische Psychologie, Methoden
Persönlichkeitspsychologie, Klinische und Medizinische Psychologie, Methoden
Förderung
Förderung seit 2024
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 539645652
In diesem Forschungsprojekt sollen sechs Fragen beantwortet werden: (i) Lässt sich das menschliche Internet-Verhalten als ein Sample individueller menschlicher Erfahrungen nutzen, um damit Persönlichkeit und individuelles Wissen reproduzierbar vorherzusagen? (ii) Ist der Internet-Suchverlauf oder Web Tracking ein besseres Sample für diese Vorhersagen? (iii) Können wir nicht nur mit den Fragebogendaten, sondern auch mit den Vorhersagen die strukturellen Beziehungen zwischen den Big Five Faktoren der Persönlichkeit, den individuellen Interessen, sowie der kristallinen und fluiden Intelligenz abbilden? (iv) Und falls das möglich ist, erlauben dann auch die für viele Jahre der Internet-Suche vorliegenden Daten eine retrospektive Simulation der intellektuellen Entwicklung? (v) Wie "intelligent" sind (große) Sprachmodelle, wenn wir sie mit den Normstichproben eines Intelligenztests vergleichen? (vi) Ist es möglich, die menschlichen Antworten in einem Intelligenztest erfolgreich zu ersetzen, wenn wir Sprachmodelle mit den individuellen menschlichen Erfahrungen trainieren, wie sie in individuellen Text-Corpora abgebildet werden? Um diese Fragen zu beantworten, nutzen wir die Web Tracking Daten einer GESIS Panel-Studie mit ~1.000 Versuchspersonen, mit der wir auch den Bildungsstand untersuchen können. Für diese Stichprobe erheben wir den Internet-Suchverlauf, die Persönlichkeit und das Wissen der Versuchspersonen. Die aus dieser Stichprobe abgeleiteten prädiktiven Modellierungsmethoden werden in einer weiteren Stichprobe von ~500 Versuchspersonen getestet, für die wir zusätzlich die Interessen und die fluide Intelligenz erheben. Aus diesem Screening wählen wir ein Subsample von ~200 Versuchspersonen aus, die wir umfassend mit einem gut etablierten Intelligenztest untersuchen. Unsere Ergebnisse sollen eine aufrichtige wissenschaftliche Diskussion über die Möglichkeiten und Grenzen informieren, die mit Big Data und Künstlicher Intelligenz einhergehen. Obgleich prädiktive Modellierungsmethoden die zukünftige Diagnostik erleichtern, verbessern oder sogar ersetzen könnten, werfen diese neuen Datenräume auch Fragen für Ethik und Datenschutz auf, für die wir im Supplement dieses Antrages Lösungsvorschläge anbieten.
DFG-Verfahren
Infrastruktur-Schwerpunktprogramme