Detailseite
Projekt Druckansicht

Motiv-basierte Algorithmen zur Detektion funktionaler Klassen von langen, nicht-kodierenden RNS

Antragsteller Professor Dr. Knut Reinert, seit 4/2019
Fachliche Zuordnung Bioinformatik und Theoretische Biologie
Förderung Förderung von 2017 bis 2022
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 388768652
 
Nichtkodierende RNS (ncRNS), d.h. Transkripte, welche nicht Proteine kodieren, haben im letzten Jahrzehntvermehrt Aufmerksamkeit erfahren, da einige genomweite Hochdurchsatzstudien gezeigt haben, das mehr als 75% des Genomes in nichtkodierende RNS transkripiert wird. NcRNS haben eine Schlüsselfunktion in mehreren biologischen Prozessen: angefangen von Entwicklungprozessen über Differenzierung bis zur Entwicklung von Krankheiten. Dies geschieht z.B. durch Mechanismen der transkriptionellen und post-transkriptionellen Genregulierung. Die Größe der ncRNS variert stark; von kleinen RNS Molekülen mit ca. 20 Nukleotiden zu RNS mit hunderttausenden von Nukleotiden.In diesem Antrag wollen wir uns mit langen ncRNS (>200 Nukleotide) beschäftigen. Man schätzt, dass es ca. 20000 solche lncRNS im Genom gibt, die alle bestimmte Expressionsmuster haben. Obgleich es eine solch große Zahl von lncRNS gibt, kennt man nur von wenigen die genaue Funktion; in der Tat ist sie für die meisten unbekannt.LncRNS evolviert sehr schnell. Aus diesem Grunde ist es etabliertes Wissen, dass Methoden, welche nur die Primärsequenz in Betracht ziehen weniger zur Analyse geeignet sind als Methoden die auch die Sekundärstruktur der RNS benutzen. Wichtig wären insbesondere Methoden die auch Pseudoknoten, G-Quadruplexe und intramolekulare Triplexe verarbeiten können, da solche Strukturen bekannterweise funktionale Aspekte der lncRNS repräsentieren.Methoden, die die globale Sequenz-Struktur Ähnlichkeit von RNS betrachten sind nützlich, allerdings muss man damit rechnen, dass viele lncRNS nur lokal konservierte Muster aufweisen. In unserem Antragwerden wir uns mit verschiedenen Aspekten in Verbindung mit der Suche und dem Clustering von lncRNS beschäftigen. Das Vorhandensein solcher gemeinsamer Motive kann darauf hinweisen, dass lncRNS gewisse Funktionalitäten teilen und wird uns erlauben, eine erste, umfängliche funktionale Klassifikation von lncRNS durchzuführen. Im Detail haben wir zwei Hauptziele, die von den beiden Antragstellern verantwortlich bearbeitet werden werden.1) Wir möchten Algorithmen entwickeln und implementieren, mit denen wir RNS Sequenzen aus gegebenen Familien paarweise und multipel alignieren können; dann wollen wir Methoden entwicklen um probabilistische, globale und lokale Motive aus den Alignments zu generieren, wobei wir experimentell ermittelte Nebenbedingungen dabei benutzen möchten können. Schliesslich wollen wir Methoden entwickeln, um diese Motive schnell und sensitiv in großen, genomischen Sequenzen suchen zu können.2) Wir möchten die unter 1) entwickelten Methoden erweitern und für lncRNS Sequenzen gemeinsamen Sequenz-Struktur Motiven berechnen. Basierend auf diesen Motiven und anderen genomischen Daten möchten wir unbekannte lncRNAS klassifizieren können und damit neue Familien von lncRNS finden und funktionell annotieren.
DFG-Verfahren Sachbeihilfen
Ehemalige Antragstellerin Dr. Annalisa Marsico, bis 4/2019
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung