Genomsequenz des probiotischen Enterococcus faecalis Symbioflor 1 (DSM 16431) und vergleichende Genomanalyse mit den Stämmen E. faecalis V583, E. faecalis OG1RF und E. faecalis 62

Datum

2013

Betreuer/Gutachter

Weitere Beteiligte

Herausgeber

Zeitschriftentitel

ISSN der Zeitschrift

Bandtitel

Verlag

Zusammenfassung

Enterococcus faecalis Symbioflor 1 (DSM 16431) ist ein Bakterienstamm, welcher Hauptbestandteil eines probiotischen Medikamentes mit dem Namen Symbioflor 1 ist. Enterokokken gelten als fakultativ pathogene Gattung. Um die Bedrohung durch mögliche Pathogenitätsfaktoren auszuschließen und um den Stamm - als Inhaltsstoff eines Medikamentes - genauer zu definieren, wurde deshalb die Entscheidung getroffen, das Genom des E. faecalis Symbioflor 1 zu sequenzieren. Zunächst wurde eine Plasmid-Shotgun-Bibliothek des Stamms sequenziert und assembliert. Hieraus resultierte ein Assembly mit 702 Contigs (Domann et al. 2007). Um die Aussagekraft bezüglich der Pathogenitätsfaktoren zu erhöhen und um den Stamm genauer zu untersuchen, sollte der Stamm möglichst komplett sequenziert werden und die Lücken zwischen den Contigs geschlossen werden. Aufgrund der hohen Anzahl der Contigs wurde daher zunächst von der Firma Roche eine 454-Sequenzierung der chromosomalen DNA des Stammes durchgeführt. Mit dem Newbler-Assembler wurden 206.726 dieser 454-Reads zusammen mit 13.131 der Sanger-Reads der Plasmid-Bibliothek zu 69 Contigs > 500 bp assembliert. Von diesen konnten 45 am Referenzstamm E. faecalis V583 ausgerichtet werden. Die Lücken zwischen diesen Contigs wurden sukzessive mittels PCRs geschlossen. Für große Lücken wurde zusätzlich eine Fosmid-Shotgun-Bibliothek der chromosomalen DNA des E. faecalis Symbioflor 1 mit 1.440 Klonen erzeugt, deren Inserts ansequenziert werden konnten um die Ausrichtung von Contigs zueinander festzustellen. Das Resultat ergab ein zirkuläres Genom von 2.790.147 bp mit zwei zu diesem Zeitpunkt noch offenen Lücken. Die Annotation des Genomes erfolgte halbautomatisch mit GenDB, wobei wiederum das Genom von E. faecalis V583 als Referenz diente. Insgesamt besitzt der Stamm 2.714 codierende Sequenzen (CDS), welche im Schnitt 302 Aminosäuren codieren. Es sind 12 rRNA-Gene vorhanden, die sich auf 4 Loci verteilen, und 63 tRNA-Gene. Der MLST-Typ des Stammes ist 248. Über phylogenetische Analysen konnte eine relativ nahe Verwandtschaft zu den Stämmen E. faecalis V583, E. faecalis OG1RF und E. faecalis 62 gezeigt werden. Es konnten 189 für E. faecalis Symbioflor 1 spezifische Gene gefunden werden. Die Analyse bestätigte die weitgehende Abwesenheit von putativen Pathogenitätsfaktoren. Der Stamm kann daher als unbedenklich angenommen werden und wurde in Folge dessen von Risikogruppe 2 auf 1 herabgestuft. Die nahezu komplette Genomsequenz bietet zukünftig die Möglichkeit, den Keim anhand spezifischer Sequenzen molekularbiologisch nachzuweisen sowie Transkriptions-Analysen durchzuführen und gezielt Mutanten zu erstellen, um die Wirkung von unbekannten Proteinen zu überprüfen, insbesondere im Hinblick darauf, möglicherweise probiotisch wirksame Faktoren zu entdecken. Des Weiteren kann er als Referenz für zukünftig sequenzierte Enterokokken-Stämme dienen.


Enterococcus faecalis Symbioflor 1 (DSM 16431) is a bacterial strain which is the main component of a probiotic medicament named Symbioflor 1. Enterococci are a facultative pathogenic genus. In order to exclude the danger caused by putative pathogenic traits and to further define the strain - as an ingredient of a medicament - it was decided to sequence the genome of E. faecalis Symbioflor 1. Initially a plasmid-shotgun-library of the strain was sequenced and assembled, resulting in 702 contigs (Domann et al. 2007) To increase the validity concerning the lack of pathogenic traits and to further investigate the strain, the strain should be sequenced as completely as possible and the gaps between contigs should be closed. Because of the high number of contigs, the next step was a 454-sequencing of chromosomal DNA of the strain done by the Roche company. Using the Newbler assembler an assembly of 69 contigs > 500 bp was created by including 206,726 of said 454-reads and 13,131 of the Sanger-reads of the forementioned plasmid-library Of those contigs, 45 could be mapped to the reference strain E. faecalis V583. The gaps between those contigs were successively closed by PCR. For larger gaps a fosmid-shotgun-library of 1,440 clones was created. The inserts of said library were sequenced in order to align contigs to each other. The result was a circular genome of 2,790,147 bp including two gaps that are still open The genome sequence was then annotated semi-automatically using GenDB. E. faecalis V583 was used as a reference for annotation. The strain possesses 2,714 coding sequences (CDS), each coding on average for 302 amino acids. Additionally, there are 12 rRNA-genes that are distributed among 4 loci, and 63 tRNA-genes. The MLST-type of the strain is 248. The phylogenetic analysis revealed a close relationship to the strains E. faecalis V583, E. faecalis OG1RF and E. faecalis 62. 189 genes could be found that were specific for E. faecalis Symbioflor 1. The analysis confirmed the absence of most putative pathogenic traits. Therefore the strain can be considered safe and it was downgraded from BSL (biosafety level) 2 to BSL1. The almost complete genome sequence will provide the opportunity to detect the germ on the basis of specific sequences using molecular biological techniques. It will also enable transcription analyses and the creation of mutants in order to investigate the role of unknown proteins, especially to discover possible probiotic traits. Additionally, the sequence can serve as a reference for future Enterococcus strains.

Beschreibung

Inhaltsverzeichnis

Anmerkungen

Erstpublikation in

Sammelband

URI der Erstpublikation

Forschungsdaten

Schriftenreihe

Erstpublikation in

Giessen : VVB Laufersweiler

Zitierform