Elucidating the potential of microRNAs : towards a functional landscape of microRNAs in the model organisms Tribolium castaneum and Galleria mellonella
Datum
Autor:innen
Betreuer/Gutachter
Weitere Beteiligte
Herausgeber
Zeitschriftentitel
ISSN der Zeitschrift
Bandtitel
Verlag
Lizenz
Zitierlink
Zusammenfassung
Insects have been utilized by humans for thousands of years. At first in a very primitive way as direct food provider for example for honey or as material source like lac dye or silk. Nowadays, with emerging technical possibilities, resources and needs, the usage of insects, as the world s largest animal class, is getting much more skillful.Technologies like Next Generation Sequencing emerged in the past decades, enabling a broad scientific community to study organisms, like insects, at a molecular genetic level for a comparable cheap price. This technological jump led to findings that promoted insects as valuable model organisms and resource of molecules for various applications. For example, the study of effects of pathogens to an insect organism and a potential transfer of knowledge to humans.One of the emerging fields in the molecular genetic research is the investigation of gene expression regulation by microRNAs. Since their misregulation can lead to serious malformations of body parts, cancer and even death, the large research community is diversified and the numbers of microRNA publications is increasing to nearly 18,000 per year. Despite their popular impact, the in silico analysis of microRNAs needs the knowledge of a broad portfolio of task-specific tools and settings in order to compute results. Furthermore, due to their small size of only around 21 nucleotides, the assignment of a corresponding mRNA is a non-trivial task, leading to a broad variety of approaches in the laboratory and in silico. On the one hand, the target prediction algorithms mostly try to generalize microRNA behavior and filter for microRNA-mRNA bindings with these features. This leads to a large number of false-positives. On the other hand, many of the laboratory approaches are not high- throughput, making a validation of microRNA targets time consuming. With Next Generation Sequencing, certain methods (like CLIP-sequencing) are able to raise signals of microRNA binding sites on mRNAs in a high-throughput manner. However, these methods have the drawback that they are very difficult to perform. Datasets are therefore very rare in public databases. Within this thesis I present the assessment of a best practice workflow for microRNA analysis, providing a guideline for other researchers. My benchmarking of microRNA isoform tools not only identified the most suitable tool for high-throughput pipelines, but also highlighted the broader impact on microRNA isoforms in Tribolium castaneum early development. Outgoing from the assessment, I created a scripted workflow which was then translated into a novel pipeline, called microPIECE, covering the widely used microRNA analysis tasks, including microRNA isoform detection, combined with a novel microRNA target prediction approach that relies on transferred and evolutionary conserved CLIP-sequencing data from closely related species. This approach makes the previously mentioned rare data available to other species.Finally, I applied my pipeline exemplarily to Galleria mellonella in order to identify the impact of microRNAs to the immune response against pathogenic Escherichia coli strains, indicating a benefit for human pathogen investigations and shedding light on a potential insect utilization for humans.The results of my research are publicly available in three different scientific journals (BMC Bioinformatics, JOSS- Journal of Open Source Software and Nature Scientific Reports). The source code of the microPIECE pipeline, as well as a Docker environment is available via GitHub.com.
Insekten wurden bereits vor Tausenden von Jahren vom Menschen genutzt. Zuerst nur auf eine sehr primitive Art und Weise als Nahrungsquelle für beispielsweise Honig oder als Quelle für Material, wie beispielsweise Schellack oder Seide. Heutzutage, mit voranschreitenden technischen Möglichkeiten, Ressourcen und Methoden, wird die Nutzbarkeit von Insekten, als weltweit größte Tierklasse, um einiges anspruchsvoller.Technologien wie Next Generation Sequencing kamen im Laufe der letzten Dekaden hinzu und ermöglichten einer breiten wissenschaftlichen Community die Erforschung von Organismen, wie beispielsweise Insekten, auf einer molekulargenetischen Ebene, zu einem vergleichsweisen günstigen Preis. Dies führte zu Entdeckungen, die Insekten als wertvolle Modell- Organismen qualifizierte. Beispielsweise konnte die molekulargenetische Auswirkung von Pathogenen auf den Organismus von Insekten untersucht werden, deren Ergebnisse Rückschlüsse auf die Funktion im Menschen ermöglichen.Eines der aufstrebenden Bereiche in der Molekulargenetik ist die Erforschung von Genexpressions-Regulation durch microRNAs. Eine Fehlregulation dieser microRNAs kann zu schwerwiegenden Fehlbildungen von Körperteilen, Krebs und sogar zum Tode führen. Dementsprechend divers ist auch die Forschungs-Community und die Zahl der microRNA Publikationen steigt auf fast 18.000 Artikel pro Jahr. Trotz ihres populären Einflusses ist die in silico Analyse von microRNAs immer noch anspruchsvoll und benötigt eine große Anzahl an spezifischen Programmen und Einstellungen zur Auswertung der Rohdaten. Weiterhin ist die Bestimmung von mRNA Zielgenen aufgrund der recht kleinen Größe von durchschnittlich 21 Nukleotiden der microRNAs keine einfache Aufgabe. Dies führte zu einer Vielzahl an Lösungsansätzen, sowohl im Labor, als auch in silico. Auf der einen Seite versuchen sogenannte Target-Prediction-Algorithmen das Verhalten von microRNAs zu generalisieren und nach microRNA-mRNA Bindungen mit diesen Eigenschaften zu filtern. Das führt zu einer großen Zahl von Falsch-Positiven. Auf der anderen Seite sind viele der im Labor eingesetzten Methoden zur Validierung nicht für den Hochdurchsatz geeignet, was die Validierung der Vorhersagen zeitaufwändig macht. Mit Hilfe von Next Generation Sequencing wurden Methoden (wie bspw. CLIP-Sequenzierung) etabliert, die es ermöglichen microRNA Bindestellen im Hochdurchsatz zu identifizieren. Jedoch haben diese Methoden den Nachteil, dass sie schwierig umzusetzen sind und ihre Datensätze deshalb auch selten in öffentlich Datenbanken zu finden sind.In dieser Thesis präsentiere ich das Assessment eines Best-Practice Workflows für die microRNA Analyse, die als Leitfaden für andere Wissenschaftler (m/w/d) dienen kann. Mein Benchmark von microRNA Isoform Analyse-Programmen hat nicht nur das beste Tool für die Hochdurchsatz Analyse identifiziert, es hat auch den Einfluss von microRNA Isoformen im frühen Entwicklungsstadium von Tribolium castaneum beleuchtet. Ausgehend von diesem Assessment habe ich einen Workflow mit einzelnen Skripten entwickelt, der wiederum in eine zusammenhängende Pipeline mit dem Namen microPIECE konvertiert wurde. Sie deckt die am weitesten verwendeten microRNA Analysen ab, inklusive microRNA Isoform Detektion, in Kombination mit meinem neu entwickelten Zielvorhersage-Ansatz, welcher auf den Transfer von evolutionär konservierten CLIP-Sequenzierdaten von nah verwandten Spezies setzt. Diese Methode macht die vorher erwähnten, seltenen Datensätze auch für andere Spezies nutzbar.Schließlich habe ich meine Pipeline exemplarisch an Galleria mellonella angewendet, um den Einfluss von microRNAs auf die Immunantwort gegenüber pathogenen Escherichia coli Stämmen zu identifizieren und eine mögliche Übertragbarkeit auf den Menschen herzustellen.Die Ergebnisse meiner Forschungen sind öffentlich verfügbar und in drei verschiedenen wissenschaftlichen Journalen erschienen (BMC Bioinformatics, JOSS - Journal of Open Source Software und Nature Scientific Reports). Der Quellcode der microPIECE Pipeline, sowie die Docker-Umgebung sind auf Github.com verfügbar.