Detailseite
Projekt Druckansicht

Multiple Protein Alignment Algorithmen mit Splitmetriken und Validierung von Phylogenien

Fachliche Zuordnung Informatik
Förderung Förderung von 1998 bis 2001
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 5132288
 
Für die biologische Analyse und Interpretation von Proteinsequenzen, die zur Zeit im großen Umfang aus Sequenzierungsprojekten gewonnen werden, sind Phylogenien (Stammbäume) und multiple Alignments von essentielles Bedeutung. Sie erlauben das Auffinden von Sequenz- und Struktur-Ähnlichkeiten zu bereits bekannten Proteinen und ermöglichen damit Hypothesen über die molekulare und zelluläre Funktion der neuen Sequenz. Das vorliegende Projekt hat zum Ziel einen Algorithmus zu entwickeln und zu implementieren, der das Lösen der eng verwandten Probleme -Konstruktion der Phylogenie -Konstruktion des multiplen Alignments für eine Menge von Protein-Sequenzen und -Strukturen in einem neuartigen integrierten Ansatz vereint. Das Verfahren basiert auf der Behandlung von Sequenz-Distanzen durch sogenannte Splitmetriken und berechnet entsprechende evolutionäre Netze verschränkt mit den Distanzen. Dabei werden alle mit den unterliegenden Sequenzdaten kompatiblen Bäume und die sie bestimmenden zugehörigen multiplen Alignments berechnet. Der Algorithmus beruht auf einer sukzessiven Berechnung von Profil-Alignments, wie sie auch bei anderen Verfahren eingesetzt werden bzw. einsetzbar sind. Die Qualität dieser Profil-Alignments hat entscheidenden Einfluss auf die Ähnlichkeits- und Distanzmaße und damit auf die Gesamtperformance des Algorithmus. Deshalb ist die Verbesserung und theoretische Absicherung von Profil-Alignments und der zugehörigen Bewertungsfunktionen von vorrangiger Bedeutung für das Projekt.
DFG-Verfahren Schwerpunktprogramme
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung