Mikroben-Analyse: Durchblick im Datenmeer
Sequenziermaschinen fördern gigantische Datenmengen zutage. Münchener Bioinformatiker haben ein Tool entwickelt, mit dem sich Sequenzen von Bakterien aus aller Welt durchforsten lassen.
Mikrobielle Gemeinschaften nehmen in Ökosystemen weltweit eine Schlüsselposition ein. Sie spielen bei essenziellen biologischen Funktionen vom Kohlenstoff- über den Stickstoffkreislauf in der Umwelt bis hin zur Regulation von Immun- und Stoffwechselprozessen in tierischen oder menschlichen Körpern eine wichtige Rolle. Sie eingehender zu erforschen, ist daher das Ziel vieler Wissenschaftler.
Bei Bakterien wird die ribosomale RNA entziffert
Genomforscher weltweit setzen inzwischen voll auf sogenannte Next Generation Sequencing-Technologien (NGS): Die aktuellen Geräte können mit geringem personellem Aufwand innerhalb kürzester Zeit eine wahre Flut von Sequenzierungs-Daten produzieren. Die Sequenzanalyse sogenannter bakterieller 16S-rRNA-Gene ist heutzutage die häufigste unter den Identifikationsmethoden von Bakterien. Die 16S-rRNA-Gene gelten als ideale molekulare Marker für die Rekonstruktion von Verwandtschaftsgraden unter Organismen, weil an ihnen die gesamte Entwicklungsgeschichte eines Organismus abgelesen werden kann. Die Abkürzung rRNA steht für ribosomale Ribonukleinsäure.
Gigantischer Berg aus Rohdaten
Im Sequenz Read Archive (SRA), eine öffentliche bioinformatische Datenbank fürs Archivieren von Sequenzen, sind inzwischen über 100.000 solcher 16S-rRNA–Sequenzen als Datensätze zusammengekommen. Denn die neuen technischen Verfahren der DNA-Sequenzierung haben den Umfang und die Komplexität genomischer Forschungsdaten in den vergangenen Jahren explosionsartig anwachsen lassen. Im SRA schlummern Datensätze, die in ihrer Gesamtheit bisher nicht auswertbar sind. „Über all die Jahre wurden aber nicht nur Sequenzen von humanen Umgebungen wie Darm oder Haut genommen, sondern ebenso vom Boden oder aus dem Ozean“, erklärt Thomas Clavel vom Zentralinstitut für Ernährungs- und Lebensmittelforschung (ZIEL) an der TU München.
Plattform führt Datensätzen zusammen
„Wir haben jetzt ein Tool geschaffen, womit sich diese Datenbanken in relativ kurzer Zeit durchsuchen lassen, um Verwandtschaften unter Bakterien zu erkennen“, sagt Clavel . Die neue Plattform heißt Integrated Microbial Next Generation Sequencing (IMNGS) und ist über www.imngs.org allgemein zugänglich. Wie IMGS funktioniert, wird am Beispiel des Darmbakteriums Acetatifactor muris im Fachjournal „Scientific Reports“ detailliert beschrieben.
„Ein Wissenschaftler kann damit binnen einiger Stunden eine Abfrage durchführen, um zu überprüfen, in welcher Art von Proben wie etwa Boden- oder Darmproben das ihn interessierende Bakterium noch zu finden ist – beispielweise ein pathogener Erreger aus dem Krankenhaus. Diese Querverbindungen auszulesen war bisher nicht möglich.“
Grundlage für die Routinediagnostik
Bald könnten solche bioinformatischen Sequenzierungen aus der täglichen klinischen Routinediagnostik nicht mehr wegzudenken sein. Ein kritischer Punkt ist dabei aber, dass die vielen Unterarten der mikrobiologischen Gemeinschaften beschrieben werden müssen, da sie nicht ganz so leicht identifiziert und nummeriert werden können. „Das wird die große Herausforderung sein“, sagt Clavel – „die Qualität der Daten ist noch nicht gut genug, die Beschreibungen der einzelnen Proben in der Datenbank sind unvollständig und somit die Vergleichsmöglichkeiten per IMNGS derzeit noch eingeschränkt.“
pg