Detailseite
Projekt Druckansicht

Erzeugung und Analyse synthetischer Daten für Transportanwendungen (GASTRA)

Fachliche Zuordnung Verkehrs- und Transportsysteme, Intelligenter und automatisierter Verkehr
Förderung Förderung seit 2025
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 561061973
 
In jüngster Zeit hat sich die Generierung und Nutzung synthetischer Daten, d. h. künstlicher Daten, die reale Daten nachahmen sollen, als nützlicher Ansatz erwiesen, um einige der oben genannten Einschränkungen und Schwierigkeiten zu überwinden. Die Qualität und Vollständigkeit der Daten kann verbessert werden, indem fehlende Werte ergänzt und der Bereich der möglichen Werte erweitert wird. Reale Beobachtungen können ergänzt werden, um das Risiko zu verringern, dass Einzelpersonen identifiziert werden, oder es können rein synthetische Daten generiert werden, die nicht direkt mit tatsächlichen Einzelpersonen in Verbindung gebracht werden. Daten aus verschiedenen Quellen können synthetisiert werden, um einen einheitlichen vollständigen Datensatz mit konsistenten Definitionen und Auflösungen von Variablen zu erstellen, der den Modellierungsanforderungen entspricht. Ein größerer Anteil von Fällen seltener Ereignisse kann mithilfe eines kontrollierten Mechanismus generiert werden, der künstlich ausgewogenere Datensätze erzeugt, aber auch die Berücksichtigung dieser Manipulation bei der Modellierungsaufgabe ermöglicht. Diese Forschungsarbeit zielt darauf ab, verschiedene Methoden zur Generierung synthetischer Daten zu untersuchen, um bestimmte Anforderungen zu erfüllen, ihre Qualität zu bewerten und sie allein oder in Kombination mit realen Daten für das Training und Testen von verkehrsbezogenen Modellen und für deren Anwendung zur Vorhersage von Ergebnissen von „Was-wäre-wenn“-Szenarien zu verwenden. Um die Nutzung der zu entwickelnden Methoden zu fördern, werden sie als Software-Toolbox implementiert, die der Forschungs- und Praxisgemeinschaft als Open-Source-Code zur Verfügung gestellt wird. Ziel 1: Konsolidierung des aktuellen Stands der Technik in der Verkehrsdatenanalyse, Identifizierung von Lücken bei der Datenerfassung, -sammlung und -integration zur Unterstützung der Nutzung für Analyse und Vorhersage; Ziel 2: Erstellung einer Methodik für die Imputation, Generierung und Integration verfügbarer Datensätze für verschiedene Klassen von Datentypen unter Verwendung von Lernprozessen aus den vorhandenen Daten; Ziel 3: Entwicklung einer Open-Source-Toolbox zur Anwendung der Methodik, die von der Forschungsgemeinschaft und Praktikern leicht weiter genutzt, erweitert und eingesetzt werden kann; Ziel 4: Demonstration der Anwendbarkeit der Toolbox auf verschiedene Bereiche, insbesondere (i) naturalistische Fahrdaten und (ii) Vorhersage von Verkehrsflussmerkmalen.
DFG-Verfahren Sachbeihilfen
Internationaler Bezug Israel
Partnerorganisation The Israel Science Foundation
Kooperationspartner Professor Dr. Tomer Toledo
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung