Skalierbare raumzeitliche Statistik für globale Umweltphänomene
Zusammenfassung der Projektergebnisse
Durch die heutige Verfügbarkeit großer Mengen von Erdbeobachtungsdaten werden komplexe Analysen von Umweltphänomenen auf globalem Maßstab ermöglicht. So bilden frei verfügbare satellitenbasierte Messungen kontinuierliche globale Zeitreihen über die Erdoberfläche und Atmosphäre. Die Durchführung komplexer statistischer Analysen dieser Daten führt jedoch schnell zu methodischen und technologischen Hindernissen: Die Datensätze für Analysen sind häufig großvolumig und komplex strukturiert (überlappende Bilder, unterschiedliche Pixelgrößen, etc.). Außerdem treffen gängige geostatistische Methoden strikte Annahmen über Variablen, die auf globalem Maßstab nicht erfüllt werden und sind gleichzeitig äußerst rechenintensiv. Diese Hindernisse führen dazu, dass Forschende viel Aufwand in die Vorverarbeitung der Daten investieren müssen und dass das Potenzial der Daten nicht ausgeschöpft werden kann. Das Projekt “Skalierbare raumzeitliche Statistik für globale Umweltphänomene” hat neue Ansätze erforscht, um die Nutzbarkeit großer Erdbeobachtungsdaten in statistischen Modellen zu vereinfachen und zu skalieren. Zur Vereinfachung des Datenmanagements wurde ein neues Datenmodell (On-Demand Data Cubes) für Satellitenbildzeitreihen entwickelt. Dieses ermöglicht eine rechnerisch skalierbare und interaktive Nutzung großer Datensätze. Um eine recheneffiziente und skalierbare Analyse mittels geostatistischer Verfahren auf globalem Maßstab zu ermöglichen, wurden Multiskalenapproximationen entwickelt, die es erlauben, Vorhersagefehler und Rechenaufwand gegeneinander abzuwägen. In einer Studie konnten raumzeitliche Interpolationsaufgaben im Vergleich zu geostatistischer Interpolation (Kriging) deutlich beschleunigt werden (Speedup-Faktor > 100) bei gleichzeitiger Vergrößerung des Vorhersagefehlers (RMSE) um etwa 6.6%. Strikte Annahmen konnten dabei durch raumzeitlich variierende Kovarianzfunktionsparameter abgeschwächt werden. Die rasante Entwicklung im Bereich der maschinellen Lernverfahren wurde aufgegriffen, in dem ein Deep-Learning Modell zur Interpolation von atmosphärischen Spurengasen basierend auf lückenbehafteten Satellitenbeobachtungen entwickelt wurde. In einer Studie hat sich neben einer äußerst vielversprechenden Recheneffizienz dabei insbesondere die Eignung als dynamisches Modell für kurzfristige Vorhersagen gezeigt. Methodische Forschungsergebnisse wurden in Artikeln und als Open-Source-Software veröffentlicht. Zur Demonstration in praktischen Anwendungen wurden Fallbeispiele für unterschiedliche Umweltvariablen durchgeführt.
Projektbezogene Publikationen (Auswahl)
-
On-Demand Processing of Data Cubes from Satellite Image Collections with the gdalcubes Library. Data, 4(3), 92.
Appel, Marius & Pebesma, Edzer
-
Processing Large Satellite Image Collections as Data Cubes with the gdalcubes R package. OpenGeoHub Summer School, Münster, Germany, Aug 02-06
Appel, Marius
-
Analyzing Multi-Variable Earth Observation Data Cubes. Geospatial Sensing | Virtual 2020, Aug 31- Sep 2
Appel, Marius
-
Creating and Analyzing Multi-Variable Earth Observation Data Cubes in R. OpenGeoHub Summer School, Wageningen, The Netherlands, Aug 17-21
Appel, Marius
-
Spatiotemporal multi-resolution approximations for analyzing global environmental data. Spatial Statistics, 38, 100465.
Appel, Marius & Pebesma, Edzer
-
Analyzing massive amounts of EO data in the cloud with R, gdalcubes, and STAC. OpenGeoHub Summer School, online, Sept 1-3, 2021.
Appel, Marius
-
Implementation of geostatistical models for large spatiotemporal datasets using multi-resolution approximations. Copernicus GmbH.
Appel, Marius & Pebesma, Edzer
-
Multi-resolution approximations to map global phenomena from massive datasets. Symposium: Statistical approaches for analyzing Remote Sensing imagery, online, Jul 23
Appel, Marius
-
Training and validation data for artificial neural networks using three-dimensional partial convolutions to fill gaps in satellite image time series (v0.1.0)
Appel, Marius
-
Efficient Data-Driven Gap Filling of Satellite Image Time Series Using Deep Neural Networks with Partial Convolutions. Artificial Intelligence for the Earth Systems, 3(2).
Appel, Marius
