Project Details
Projekt Print View

Multivariate tests and multiple test-procedures for abundance data of microorganisms in consideration of information from phylogenetic sequences

Subject Area Epidemiology and Medical Biometry/Statistics
Term from 2014 to 2019
Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 253253386
 
Final Report Year 2017

Final Report Abstract

Im Rahmen des geförderten Projekts wurden der Zusammenhang von phylogenetischen Ähnlichkeiten (bzw. Abständen) von mikrobiellen Spezies (OTUs) und Korrelationen in der Häufigkeit ihres Auftretens (Abundanzen) in Bodenproben untersucht. Die Hoffnung bestand darin, einen deutlichen Zusammenhang zu finden und diesen zur Stabilisierung der Kovarianzschätzung in Abundanzdaten bei typischerweise kleinen Stichprobenumfängen in den ökologischen Studien auszunutzen. Damit sollten dann Modifikationen von bestehenden multivariaten Testmethoden und multiplen Testprozeduren mit höherer Güte als in den Originalvorschlägen gefunden werden. Bei den untersuchten Datensätzen aus Studien des Julius Kühn-Instituts ergab sich jedoch relativ konsistent über alle Studien und Modifikationen der Berechnungsvarianten, dass ein solcher Zusammenhang nicht im nennenswerten Umfang existiert. Damit waren die Ziele einer allgemeinen Gütesteigerung der Verfahren nicht mehr realisierbar. Stattdessen wurde nach Lösungen gesucht, diese Informationen für Modifikationen der Verfahren zu nutzen, welche eine bessere Interpretierbarkeit der Ergebnisse für den Endnutzer bewirken. Im Falle von Hauptkomponenten-basierten Tests gelang das in dem Sinne, dass die bislang genutzten Hauptkomponenten nochmals mittels kanonischer Korrelation zu den phylogenetischen Ähnlichkeitsmaßen rotiert wurden und dadurch in den ersten Hauptkomponenten eine etwas verbesserte Sichtbarkeit der Effekte der untersuchten Faktoren erreichten. Für multiple Testprozeduren mit einer Mischung aus multivariaten und univariaten Hypothesenmengen hat sich besonders die Nutzung der phylogenetischen Informationen in Form der klassischen taxonomischen Einteilung der OTUs in Graphen-basierten Prozeduren bewährt. Hierzu wurde eine verkürzte Version der Focus-Level-Methode aus der Literatur übernommen und für die vorliegende Situation noch einmal leicht vereinfacht. Die Nutzung der taxonomischen Einteilungen als Gerüst für die Auswahl der Merkmalsmengen für die Subhypothesen in der multiplen Prozedur sichert, dass gefundene multivariate Effekte auch immer in einer Anwender-orientierten Weise beschreiben werden können. Der Versuch, bisherige Ansätze für multiples Testen mit univariaten Hypothesen unter Erzeugung von datengenerierten Ordnungen der Hypothesen im Sinne einer möglichst hohen Power durch die Nutzung der Ähnlichkeitsmaße der Sequenzen weiter zu verbessern, erbrachte in den Daten keinen Vorteil, obwohl Simulationsstudien einen möglichen Effekt zeigen, wenn man stärkere Zusammenhänge zwischen Abundanzdaten und Sequenzähnlichkeiten unterstellt. Diese Verfahren sollten deshalb neu aufgriffen werden, wenn es gelingt, andere Genabschnitte für die Sequenzierung zu identifizieren, die einen stärkeren Zusammenhang mit den Abundanzwerten aufweisen. Die Ergebnisse des Projekts wurden publiziert. Sie liefern im Moment schon einen Nutzen durch die Verfahrensmodifikationen im Sinne einer besseren Interpretierbarkeit der Ergebnisse. Sie geben weiterhin eine Vorstellung davon, wie die weitere Entwicklung der Methodik in Kooperation zwischen Mikrobiologen und Biometrikern laufen könnte.

Publications

 
 

Additional Information

Textvergrößerung und Kontrastanpassung