Ist der quanteninformatische Ansatz zur Modellierung des genetischen Codes geeignet?
Bioinformatik und Theoretische Biologie
Zusammenfassung der Projektergebnisse
Im Laufe des Projektes wurden einige in den letzten Jahren gefundenen Regeln der stochastischen Organisation von Genomen empirisch verifiziert und durch neue Beobachtungen ergänzt. Die neuen Erkenntnisse konnten insbesondere infolge einer quanteninformatischen Modellierung der genetischen Daten gewonnen werden. Auf dieser Grundlage wurden Überlegungen über eine der Regeln der stochastischen Organisation von Genomen gerechte Darstellungsform genetischer Daten vertieft. Ein Ergebnis dieser Überlegungen ist das Konzept der allgemeinen Methode der vektor-metrischen Identifizierung von Genen. Die Hauptidee ist die Zuweisung einer eindeutigen genomischen vektor-metrischen ID zu jedem „n-plet“ (z.B. Codon) innerhalb einer bestimmten Gemeinschaft von „n-plets“ (z.B. innerhalb eines Chromosoms). Komplementär zu einer die stochastische Organisation von Genomen respektierenden Darstellungsform wurde eine Methodik der störresistenten Komprimierung der genetischen Information unter Berücksichtigung der universellen Regeln der stochastischen Organisation von Genomen überlegt. Die Idee hat als Ausgangspunkt den jüngsten Rückgang der Kosten und des Zeitaufwands für die Sequenzierung und Assemblierung kompletter Genome, was zu einem erhöhten Bedarf an Datenspeicherung geführt hat. Infolgedessen wuchs die Bedeutung der effizienten Strategien zur Komprimierung von gewonnenen biologischen Daten. Als ein passender Ansatz wurde die sogenannte arithmetische Kodierung befunden, die als Komprimierungsmethode für biologische Daten bereits bekannt ist. Allerdings wurden bis jetzt bei ihrer Implementierung nicht die spezifischen Regeln der stochastischen Organisation von Genomen berücksichtigt und die DNA-Sequenzen wie ein beliebiger Text komprimiert, was zu starken Limitierungen in der Anwendung führt. Ein weiterer wichtiger Punkt, zu dem im Laufe des Projektes geforscht wurde, ist die Anwendung der fehlererkennenden genetischen Codes für das Design synthetischer Proteine nach dem Vorbild der sogenannten Hecht-Proteine. Es wird erwartet, daß sich daraus ein Potential zur Reduzierung der Kosten und der Erhöhung der Robustheit der Proteine ergibt. In diesem Zusammenhang wurde insbesondere die nukleotide Umgebung der Stop-Codons UAG, UGA und UAA untersucht. Unter anderem wurde der Frage nachgegangen, warum nur UAA ein ’richtiger’ Stop-Codon ist, während UAG und UGA in manchen Organismen unter besonderen Bedingungen auch so interpretiert werden können, dass sie jeweils für eine Aminosäure codieren.
Projektbezogene Publikationen (Auswahl)
-
Computational Analysis of Genetic Code Variations Optimized for the Robustness against Point Mutations with Wobble-like Effects. Life, 11(12), 1338.
Fimmel, Elena; Gumbel, Markus; Starman, Martin & Strüngmann, Lutz
