Detailseite
Projekt Druckansicht

Multivariate Tests und multiple Testprozeduren für Abundanz-Daten von Mikroorganismen unter Berücksichtigung phylogenetischer Sequenzinformationen

Fachliche Zuordnung Epidemiologie und Medizinische Biometrie/Statistik
Förderung Förderung von 2014 bis 2019
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 253253386
 
Erstellungsjahr 2017

Zusammenfassung der Projektergebnisse

Im Rahmen des geförderten Projekts wurden der Zusammenhang von phylogenetischen Ähnlichkeiten (bzw. Abständen) von mikrobiellen Spezies (OTUs) und Korrelationen in der Häufigkeit ihres Auftretens (Abundanzen) in Bodenproben untersucht. Die Hoffnung bestand darin, einen deutlichen Zusammenhang zu finden und diesen zur Stabilisierung der Kovarianzschätzung in Abundanzdaten bei typischerweise kleinen Stichprobenumfängen in den ökologischen Studien auszunutzen. Damit sollten dann Modifikationen von bestehenden multivariaten Testmethoden und multiplen Testprozeduren mit höherer Güte als in den Originalvorschlägen gefunden werden. Bei den untersuchten Datensätzen aus Studien des Julius Kühn-Instituts ergab sich jedoch relativ konsistent über alle Studien und Modifikationen der Berechnungsvarianten, dass ein solcher Zusammenhang nicht im nennenswerten Umfang existiert. Damit waren die Ziele einer allgemeinen Gütesteigerung der Verfahren nicht mehr realisierbar. Stattdessen wurde nach Lösungen gesucht, diese Informationen für Modifikationen der Verfahren zu nutzen, welche eine bessere Interpretierbarkeit der Ergebnisse für den Endnutzer bewirken. Im Falle von Hauptkomponenten-basierten Tests gelang das in dem Sinne, dass die bislang genutzten Hauptkomponenten nochmals mittels kanonischer Korrelation zu den phylogenetischen Ähnlichkeitsmaßen rotiert wurden und dadurch in den ersten Hauptkomponenten eine etwas verbesserte Sichtbarkeit der Effekte der untersuchten Faktoren erreichten. Für multiple Testprozeduren mit einer Mischung aus multivariaten und univariaten Hypothesenmengen hat sich besonders die Nutzung der phylogenetischen Informationen in Form der klassischen taxonomischen Einteilung der OTUs in Graphen-basierten Prozeduren bewährt. Hierzu wurde eine verkürzte Version der Focus-Level-Methode aus der Literatur übernommen und für die vorliegende Situation noch einmal leicht vereinfacht. Die Nutzung der taxonomischen Einteilungen als Gerüst für die Auswahl der Merkmalsmengen für die Subhypothesen in der multiplen Prozedur sichert, dass gefundene multivariate Effekte auch immer in einer Anwender-orientierten Weise beschreiben werden können. Der Versuch, bisherige Ansätze für multiples Testen mit univariaten Hypothesen unter Erzeugung von datengenerierten Ordnungen der Hypothesen im Sinne einer möglichst hohen Power durch die Nutzung der Ähnlichkeitsmaße der Sequenzen weiter zu verbessern, erbrachte in den Daten keinen Vorteil, obwohl Simulationsstudien einen möglichen Effekt zeigen, wenn man stärkere Zusammenhänge zwischen Abundanzdaten und Sequenzähnlichkeiten unterstellt. Diese Verfahren sollten deshalb neu aufgriffen werden, wenn es gelingt, andere Genabschnitte für die Sequenzierung zu identifizieren, die einen stärkeren Zusammenhang mit den Abundanzwerten aufweisen. Die Ergebnisse des Projekts wurden publiziert. Sie liefern im Moment schon einen Nutzen durch die Verfahrensmodifikationen im Sinne einer besseren Interpretierbarkeit der Ergebnisse. Sie geben weiterhin eine Vorstellung davon, wie die weitere Entwicklung der Methodik in Kooperation zwischen Mikrobiologen und Biometrikern laufen könnte.

Projektbezogene Publikationen (Auswahl)

 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung