Detailseite
Projekt Druckansicht

Datentiefe und multivariate Inferenz

Fachliche Zuordnung Statistik und Ökonometrie
Förderung Förderung von 1998 bis 2002
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 5114540
 
In der multivariaten statistischen Analyse verwendet man explorative und schließende Verfahren. Die Tiefe ist eine Zahl, die mißt, wie "zentral" der Punkt in der gegebenen Menge liegt. Einzelne Datenpunkte kann man anhand ihrer Tiefe bezüglich einer geeigneten Menge von Daten ordnen und ihnen auf diese Weise multivariate Ränge zuweisen. Diese sind Basis von multivariaten (skalaren) Rangtests.In der Literatur sind eine Reihe von Vorschlägen gemacht worden, eine solche Tiefe zu definieren. Jede dieser Tiefen definiert einen "Median", den Punkt größter Tiefe, und sogenannte getrimmte Mengen, das sind Mengen von Punkten, die eine bestimmte Mindesttiefe aufweisen.Auf dem Begriff der Datentiefe lassen sich sowohl explorative wie auch schließende statistische Verfahren aufbauen. Hier stellt sich eine Fülle interessanter Fragen:1. Nach den Eigenschaften verschiedener Konzepte von Tiefe, der von ihnen abgeleiteten getrimmten Mengen und der Mediane.2. Nach der Konstruktion geeigneter multivariater Rangtests auf Lage, Skala und Korrelation und den Eigenschaften solcher Tests.3. Nach der Anwendung der Tiefe auf spezielle Probleme der Datenanalyse, insbesondere der Ausreißeridentikikation und der Clusteranalyse.4. Nach der Berechnung der Tiefe und der getrimmten Mengen durch effiziente Algorithmen.Ein großer Teil dieser Fragen ist bereits in den ersten zwei Jahren des Projekts beantwortet worden.
DFG-Verfahren Sachbeihilfen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung