Neue multiple Verfahren zur Kontrolle der "False Discovery Rate
Zusammenfassung der Projektergebnisse
Im ersten Teil dieses Forschungsvorhabens wurden zum einen erste richtungweisende Ergebnisse zum Komplex “Abhängigkeit und FDR” (FDR: False Discovery Rate) erzielt, zum anderen wurde eine neue Ablehnkurve zur asymptotischen Kontrolle der FDR entwickelt und eine Vielzahl von theoretischen Resultaten gewonnen. Im zweiten Teil dieses Forschungsvorhabens wurde zunächst untersucht, unter welchen Voraussetzungen an die Abhängigkeitsstruktur der p-Werte man eine Konvergenz der empirischen Verteilungsfunktion der p-Werte unter den wahren Nullhypothesen gegen eine feste Funktion erwarten kann (z.B. im klassischen Glivenko-Cantelli Sinne). Insbesondere multiple Tests für hochdimensionale Datensätze, mit denen Statistiker heutzutage immer öfter konfrontiert werden, werfen oft die Frage auf, ob mögliche Ablehnungen beim multiplen Testen tatsächlich auf falsche Nullhypothesen hindeuten oder von der zugrundeliegenden Abhängigkeit in den Daten hervorgerufen werden. Leider werden in der Praxis häufig multiple Testverfahren, die die FDR unter Unabhängigkeit kontrollieren, unter Abhängigkeit angewandt, obwohl sie zu einer Inflation der FDR führen können. Eine gute Chance der Fehlerkontrolle besteht in Modellen mit schwacher Abhängigkeit. In das Konzept schwacher Abhängigkeit fallen z.B. blockabhängige p-Werte, p-Werte für alle Paarvergleiche und p-Werte zum Testen auf Korrelationen in multivariaten Situationen, allesamt Beispiele von hoher praktischer Relevanz. In diesem Forschungsvorhaben wurden unter der Annahme schwacher Abhängigkeit insbesondere auch für diese Beispiele Voraussetzungen und Testverfahren entwickelt, so dass die FDR (bzw. die FWER (Familywise Error Rate)) zumindest auf einem eingeschränkten Parameterraum asymptotisch oder auch exakt kontrolliert wird. Des Weiteren wurden, basierend auf den Ideen zur AORC, andere mögliche Ablehnkurven entwickelt, die eine flexiblere Kontrolle der FDR bzgl. einer Niveaufunktion in Abhängigkeit des Anteils wahrer Nullhypothesen erlauben. Auf Grund aktueller Entwicklungen wurden zahlreiche über das Projektziel hinausgehende finite und asymptotische Fragestellungen bzgl. spezieller multipler Tests, deren kritische Werte von einem Schätzer für die Anzahl wahrer Nullhypothesen abhängen, bearbeitet. Solche adaptiven bzw. Plug-In Testprozeduren, die sowohl in Verbindung mit der FDR als auch der FWER betrachtet werden, führen in der Regel zu einer höheren Güte. In diesem Forschungsvorhaben konnte erstmals nachgewiesen werden, dass eine Vielzahl von teilweise schon früher vorgeschlagenen Plug-In Tests die FWER kontrollieren. Schließlich wurden erste interessante Resultate bzgl. des Verhaltens sogenannter lokaler Niveaus von speziellen Anpassungstests (u.a. Higher Criticism Tests) erzielt. Insbesondere im Zusammenhang mit wenigen Signalen in großen Datensätzen (Sparsity, Detectability) sind solche als Simultantests auffassbare Verfahren in letzter Zeit verstärkt untersucht worden. Das Studium des Verhaltens lokaler Niveaus kann u.E. entscheidend dazu beitragen, einige der bis heute nicht wirklich gut verstandenen asymptotischen Phänomene solcher Tests besser einzuordnen.
Projektbezogene Publikationen (Auswahl)
- (2007). Dependency and false discovery rate: Asymptotics. Ann. Stat. 35, 1432-1455
Finner, H., Dickhaus, T. & Roters, M.
- (2009). Controlling the familywise error rate with plug-in estimator for the proportion of true null hypotheses. J. R. Stat. Soc. B, 71, 1031–1048
Finner, H. & Gontscharuk, V.
- (2009). On the false discovery rate and an asymptotically optimal rejection curve. Ann. Stat. 37, 596–618
Finner, H., Dickhaus, T. & Roters, M.
- (2010). Asymptotic and Exact Results on FWER and FDR in Multiple Hypotheses Testing. Dissertation, Heinrich-Heine-Universität Düsseldorf
Gontscharuk, V.
- (2010). How to link call rate and p-values for Hardy - Weinberg equilibrium as measures of genome-wide SNP data quality. Statist. Med. 29(22), 2347-2358
Finner, H., Strassburger, K., Heid, I. M., Herder, C., Rathmann, W., Giani, G., Dickhaus, T., Lichtner, P., Meitinger, T., Wichmann, H.-E., Illig, T. & Gieger, C.
- (2012). False discovery rate control of step-up-down tests with special emphasis on the asymptotically optimal rejection curve. Scand. J. Stat., 39, 382– 397
Finner, H., Gontscharuk, V. & Dickhaus, T.
- (2012). How to analyze many contingency tables simultaneously in genetic association studies. Stat. Appl. Genet. Mol. Biol., 11(4), Article 12
Dickhaus, T., Strassburger, K., Schunk, D., Morcillo-Suarez, C., Illig, T. & Navarro, A.
(Siehe online unter https://doi.org/10.1515/1544-6115.1776) - (2012). On adaptive procedures controlling the familywise error rate. J. Stat. Plan. Infer., 142, 65–78
arkar, S., Guo, W. & Finner, H.
(Siehe online unter https://doi.org/10.1016/j.jspi.2011.06.022)