High-Performance Computing (HPC) Cluster

Fachliche Zuordnung Informatik

Förderung Förderung in 2010

Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 184631690

Erstellungsjahr 2016

Zusammenfassung der Projektergebnisse

Mit Hilfe des Computing-Cluster konnten wir viele berechnungsintensive Projekte durchführen, die wir mit unseren bestehenden Resources nicht bewätligt hätten. So konnten wir zum Beispiel hunderten von Tausend nicht-kodierenden RNAs nach sequenz- und strukturähnlichkeit clustern. In den letzten Jahren wurde festgestellt, dass ein Großteil des Genoms nicht für Protein kodiert sondern sogenannte nicht-kodierende RNA (60-80%, im Vergleich zu 1,2% Protein-kodierende Bereiche). Für ein Großteil ist die Funktion nicht bekannt. Clustering ist eine der wenigen Möglichkeiten, hier durch Erkennen von Gemeinsamkeiten eine funktionale Annotation zu erhalten. Die Vergleich hinsichtlich Sequenz und Struktur ist aber sehr aufwendig (O(n^4)) und muss für quadratisch viele Paare berechnet werden. Wir haben dann ähnlich komplexe Verfahren verwendet, um moderne Hochdurchsatz-Experimente wie zum Bsp. CLIP-seq für die Detektion von RNA-Protein-Interaktionen. Hier muss ein komplexes Modell auf Basis einen Graph-Kernels ebenso auf zehn bis hundert von tausenden bekannten Bindestellen gelernt werden. Ein Graph-Kernel kodiert jede Bindestelle mit ihrer Struktur als ein Feature-Vektor von allen möglichen Sub-Graphen der Sequenz/Struktur. Ein weiterer wichtiger Einsatzgebiet, das ohne den Compute-Cluster nicht möglich gewesen wäre, ist der Freiburger Galaxy-Server. Er wurde im Rahmen des Sonderforschungsbereich Medizinische Epigenetik als zentrale Bioinformatik-Analyse eingeführt und hat bereits mehr als 200 Benutzer. Er ist hiermit einer der grösten Server in Deutschland, wir sind einer der führenden Gruppe in der Entwicklung von Galaxy, 500 der weltweit Galaxy ist ein Workflow-Management-System und erlaubt es, viele Aufgaben einfach als Standard-Workflows zu etablieren. Wir konnten sogar viele experimentelle Gruppen darin trainieren, dass sie einfache Standard-Aufgabe in der Analyse von Hochdurchsatz-Sequenzier-Daten selbst durchführen können. Ein sehr wichtiges Merkmal ist die Reproduzierbarkeit der Analysen, da das System die Versionen und Parameter der aufgerufenen Programmen und Datenbanken speichert.

Projektbezogene Publikationen (Auswahl)

Exact pattern matching for RNA structure ensembles. In Proceedings of the 16th International Conference on Research in Computational Molecular Biology (RECOMB 2012)
Schmiedl, Christina; Möhl, Mathias; Heyne, Steffen; Amit, Mika; Landau, Gad M.; Will, Sebastian & Backofen, Rolf
GraphClust: alignment-free structural clustering of local RNA secondary structures. Bioinformatics, 28 no. 12 pp. i224-i232, 2012
Heyne, Steffen; Costa, Fabrizio; Rose, Dominic & Backofen, Rolf
Navigating the unexplored seascape of premiRNA candidates in single-genome approaches. Bioinformatics, 28 no. 23 pp. 3034-41, 2012
Mendes, Nuno D.; Heyne, Steffen; Freitas, Ana T.; Sagot, Marie-France & Backofen, Rolf
CRISPRmap: an automated classification of repeat conservation in prokaryotic adaptive immune systems. Nucleic Acids Res, 41 no. 17 pp. 8034-44, 2013
Lange, Sita J.; Alkhnbashi, Omer S.; Rose, Dominic; Will, Sebastian & Backofen, Rolf
SPARSE: Quadratic time simultaneous alignment and folding of RNAs without sequence-based heuristics. In Minghua Deng, et al. editors, Proceedings of the 17th International Conference on Research in Computational Molecular Biology (RECOMB 2013), volume 7821 of LNCS, pages 289-290. Springer Berlin Heidelberg, 2013
Will, Sebastian; Schmiedl, Christina; Miladi, Milad; Möhl, Mathias & Backofen, Rolf
Tandem Stem-Loops in roX RNAs Act Together to Mediate X Chromosome Dosage Compensation in Drosophila. Mol Cell, 51 no. 2 pp. 156-73, 2013
Ilik, Ibrahim Avsar; Quinn, Jeffrey J.; Georgiev, Plamen; Tavares-Cadete, Filipe; Maticzka, Daniel; Toscano, Sarah; Wan, Yue; Spitale, Robert C.; Luscombe, Nicholas; Backofen, Rolf; Chang, Howard Y. & Akhtar, Asifa
Dynamic DNA methylation orchestrates cardiomyocyte development, maturation and disease. Nat Commun, 5 pp. 5288, 2014
Gilsbach, Ralf; Preissl, Sebastian; Grüning, Björn A.; Schnick, Tilman; Burger, Lukas; Benes, Vladimir; Würch, Andreas; Bönisch, Ulrike; Günther, Stefan; Backofen, Rolf; Fleischmann, Bernd K.; Schübeler, Dirk & Hein, Lutz
GraphProt: modeling binding preferences of RNA-binding proteins. Genome Biol, 15 no. 1 pp. R17, 2014
Maticzka, Daniel; Lange, Sita J; Costa, Fabrizio & Backofen, Rolf
An updated evolutionary classification of CRISPR-Cas systems. Nat Rev Microbiol, 2015
Makarova, Kira S.; Wolf, Yuri I.; Alkhnbashi, Omer S.; Costa, Fabrizio; Shah, Shiraz A.; Saunders, Sita J.; Barrangou, Rodolphe; Brouns, Stan J. J.; Charpentier, Emmanuelle; Haft, Daniel H.; Horvath, Philippe; Moineau, Sylvain; Mojica, Francisco J. M.; Terns, Rebecca M.; Terns, Michael P.; White, Malcolm F.; Yakunin, Alexander F.; Garrett, Roger A.; van der Oost, John; ... & Koonin, Eugene V.
RC3H1 post-transcriptionally regulates A20 mRNA and modulates the activity of the IKK/NF-kappaB pathway. Nat Commun, 6 pp. 7367, 2015
Murakawa, Yasuhiro; Hinz, Michael; Mothes, Janina; Schuetz, Anja; Uhl, Michael; Wyler, Emanuel; Yasuda, Tomoharu; Mastrobuoni, Guido; Friedel, Caroline C.; Dölken, Lars; Kempa, Stefan; Schmidt-Supprian, Marc; Blüthgen, Nils; Backofen, Rolf; Heinemann, Udo; Wolf, Jana; Scheidereit, Claus & Landthaler, Markus

Servicenavigation

Hauptnavigation

High-Performance Computing (HPC) Cluster

Zusammenfassung der Projektergebnisse

Projektbezogene Publikationen (Auswahl)

Zusatzinformationen

Servicenavigation

Hauptnavigation

High-Performance Computing (HPC) Cluster

Zusammenfassung der Projektergebnisse

Projektbezogene Publikationen (Auswahl)

Zusatzinformationen

Textvergrößerung und Kontrastanpassung