Detailseite
Lernen aus hochdimensionalen, heterogenen Daten: Maschinelle Lernmethoden in der Ökonometrie
Antragsteller
Professor Dr. Helmut Farbmacher; Professor Dr. Martin Spindler
Fachliche Zuordnung
Statistik und Ökonometrie
Förderung
Förderung von 2020 bis 2023
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 431701914
Durch die fortschreitende Digitalisierung stehen heute große Datensätze mit vielen möglichen Variablen für verschiedene Bereiche des menschlichen Verhaltens zur Verfügung. Daten aus mikroökonomischen Anwendungen zeigen oft Heterogenität in Bezug auf Datenquellen, Endogenität relevanter Variablen und zunehmender Datendimension. Die Analyse großer Mengen hochdimensionaler Daten aus diesem Bereich erfordert daher maßgeschneiderte maschinelle Lernmethoden. In diesem Projekt wollen wir maschinelle Lernmethoden für heterogene Treatmenteffekte in randomisierten Experimenten sowie für Heterogenität in Random-Coefficient-Regressionsmodellen in der Nachfrageschätzung entwickeln und erweitern. In diesem Rahmen werden wir den Least Absolute Shrinkage and Selection Operator (LASSO), die adaptive Version des LASSO, die kausale Version der Random-Forest-Methodik sowie Boosting untersuchen. Ein Schwerpunkt liegt auf der Analyse der Variablen-Selektionseigenschaften dieser Methoden, teilweise in Kombination mit der kürzlich eingeführten Knockoff-Methode zur Kontrolle der False Discovery Rate. Auf der methodischen Seite werden wir theoretische Garantien für die vorgeschlagenen Methoden entwickeln und effiziente Wege zur Erzeugung von Knockoff-Variablen untersuchen. Auf der angewandten Seite werden wir die Methoden in frei verfügbaren Softwarepaketen implementieren, und wir werden sie auf Datensätze aus der Nachfrageschätzung sowie auf randomisierte Experimente anwenden.
DFG-Verfahren
Sachbeihilfen
Internationaler Bezug
China, Großbritannien, USA
Mitverantwortlich
Professor Dr. Alexander Meister