Detailseite
Projekt Druckansicht

Resampling-basierte statistische Inferenzverfahren zur Auswertung komplexer Versuchsanlagen in der Biometrie - Teil II

Fachliche Zuordnung Epidemiologie und Medizinische Biometrie/Statistik
Förderung Förderung von 2014 bis 2024
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 266731560
 
In einem Großteil der Experimente und Studien in den Bio- und Lebenswissenschaften werden mehrere Stichproben gleichzeitig erhoben, beispielsweise wenn Tiere mit unterschiedlichen Dosisstufen eines Medikaments behandelt werden. Dabei sind die Stichprobenumfänge in präklinischen Versuchen in der Regel sehr gering, sodass zur Analyse solcher Daten nur statistische Verfahren verwendet werden können, die bereits für kleine Fallzahlen valide Ergebnisse erzielen. Die Analyse von solchen Daten wird zusätzlich erschwert, wenn die Ergebnisse durch weitere Faktoren (wie z.B. Geschlecht oder Altersstufen) stratifiziert werden. Zur statistischen Auswertung solcher medizinischen Studien und Versuchen (wie bei multizentrischen Studien) werden deshalb häufig sogenannte (i) faktorielle oder allgemeine lineare Modelle verwendet. Werden die Individuen zusätzlich über die Zeit beobachtet, so liegt ein (ii) Repeated Measures Modell vor. Der Unterschied zu den unverbundenen Modellen in (i) liegt darin, dass die Beobachtungen, die am gleichen Subjekt erhoben wurden, nicht notwendigerweise unabhängig sind. Diese Abhängigkeit muss im Modell und den zugehörigen Inferenzverfahren berücksichtigt werden. Die meisten Inferenzverfahren für derartige verbundene und unverbundene Modelle postellieren allerdings häufig spezifische Verteilungsannahmen (wie die Normalverteilung) sowie homoskedastische Fehlerterme. In praktischen Situationen sind diese Annahmen häufig nicht erfüllt, insbesondere in höher faktoriellen Anlagen. Erfüllen die Daten diese Annahmen jedoch nicht, können klassische Schätz- und Testverfahren zu dramatischen Fehlentscheidungen führen. Aus diesem Grund sollen in dem vorliegenden Projekt für (a) allgemeinere Modelle nichtparametrische Tests und Konfidenzintervalle entwickelt werden, die (b) auch bei sehr geringen Fallzahlen das Signifikanzniveau kontrollieren. Dabei unterscheiden wir in (a) zwischen Inferenztechniken für parametrische lineare Modelle mit metrischen Daten und allgemeinere rangbasierte Prozeduren für nichtparametrische Modelle, welche beide jeweils in Verfahren für verbundene und unverbundene Modelle gegliedert werden. Die Verteilungen der Daten werden dabei (außer als metrisch im 1. Fall) als nicht näher spezifiziert angenommen. Zur Lösung des Punktes (b) werden Modell-adäquate Bootstrap-, Permutations- und allgemeinere Resampling-Methoden angewendet. Die neuen Verfahren sollen dabei genau auf die Fragestellungen der Anwender zugeschnitten sein und für verschiedene faktorielle Nullhypothesen von Interesse konstruiert werden. Neben der theoretisch fundierten Entwicklung sollen die Prozeduren auch mit den "klassischen Verfahren" für die jeweiligen Modelle hinsichtlich Niveaukontrolle und Güte in umfangreichen Simulationen miteinander verglichen werden. Außerdem soll zu allen Verfahren Software (R-Pakete) entwickelt werden, die frei zur Verfügung gestellt wird.
DFG-Verfahren Sachbeihilfen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung