Detailseite
Projekt Druckansicht

GAIUS - Wartungsarbeiten für die Nachhaltigkeit von AUGUSTUS

Fachliche Zuordnung Bioinformatik und Theoretische Biologie
Förderung Förderung von 2018 bis 2021
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 391397397
 
AUGUSTUS ist ein Werkzeug für die strukturelle Annotation von Genen in Genomsequenzen. Diese Art der Genannotation ist eine klassische Bioinformatikaufgabe um die Exon/Intron Struktur innerhalb von Genomsequenzen zu identifizieren. Die strukturelle Annotation wird üblicherweise von RNA-Seq und Homologiedaten von verwandten Genomen unterstützt. Außerdem wird ein kladenspezifisches statistisches Modell mit tausenden an das Zielgenom angepassten Parametern benötigt. Genvorhersagen werden sehr häufig durchgeführt, insbesondere auf neu sequenzierten Genomen. In der letzten unabhängigen Messung war AUGUSTUS eines der genausten Werkzeuge. Zum Beispiel wurde mit 61% die höchste Genlevel Sensitivität für menschliche proteinkodierende Gene erreicht. Seit Jahren beobachten wir eine steigende Zitatanzahl, sowie eine hohe Anzahl von Downloads von AUGUSTUS und eine starke Nutzung unserer Webservices. AUGUSTUS wurde in verschiedenen Forschungsprojekten entwickelt, zum Beispiel zur Berücksichtigung von Homologie und von RNA-Seq, für Automatisierung des Trainings und zur Annotation von mehreren Genomen gleichzeitig. AUGUSTUS ist als Open Source C++ Quellcode verfügbar. Außerdem werden zwei Webservices für die Nutzung bereitgestellt. Nichtsdestotrotz gibt es erhebliche Defizite bezüglich der Benutzbarkeit und der Quellcodequalität. Die Benutzbarkeitsprobleme sind insbesondere für weniger computererfahrene Biologen problematisch. Durch diese Probleme entsteht ein hoher Zeitaufwand, wodurch Nutzer dazu getrieben werden andere, weniger geeignete Werkzeuge zu verwenden. Dies kann zu fehlerhaften Experimenten führen. Weiter ist zu bemängeln, dass es derzeit keine Möglichkeit gibt, Ergebnisse oder Parameter für bestimmte Spezies zu teilen. Der bisherige Fokus in der Entwicklung von AUGUSTUS lag ausschließlich auf neuen Verfahren, nicht jedoch auf der Qualität des Quelltextes als solchem. Daher ist die Weiterentwicklung von AUGUSTUS zunehmend problematisch. Weiterhin ist der Quelltext zwar frei verfügbar, das Entwicklungsrepositorium ist jedoch privat an der Universität Greifswald verortet. Dies erschwert es anderen Forschern, sich an der Entwicklung von AUGUSTUS zu beteiligen. Die oben genannten Probleme sollen im GAIUS Projekt adressiert werden. Wir werden die Benutzbarkeit durch bessere Dokumentation, einfacher zu benutzende Interfaces und einheitliche Pipelineskripte verbessern. Ein Repositorium zum Teilen von Parametern und weiteren Daten wird die Nachnutzung von Erkenntnissen anderer Arbeiten vereinfachen und gleichzeitig die Replizierbarkeit der Forschung fördern. Probleme mit lokalen Installationen werden durch die Verfügbarkeit eines Debianpakets und fertigen virtualisierten Umgebungen gelöst werden. Wir beabsichtigen, das Ausrollen von Updates in WebAUGUSTUS durch DevOps Technologien zu unterstützen. Außerdem werden wir die technische Schuld im Quelltext durch weitere Testfälle und Refaktorisierung reduzieren.
DFG-Verfahren Forschungsdaten und Software (Wiss. Literaturversorgung und Informationssysteme)
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung