Wenn es Menschen zu heiß wird, dann gehen sie in den Schatten. Pflanzen hingegen können sich nicht fortbewegen und haben daher im Laufe der Evolution zahlreiche Wege gefunden, sich an wechselnde Umweltbedingungen anzupassen. Im Verlauf der Züchtung hin zu maximalen Erträgen sind viele dieser Eigenschaften in Hochleistungssorten jedoch wieder verlorengegangen: Bei recht stabilen klimatischen Bedingungen in Mitteleuropa und gepflegt und geschützt durch die Landwirte stellten die entsprechenden Gene keinen Selektionsvorteil mehr da. Mit der Klimakrise nehmen Wetterextreme nun in Stärke und Häufigkeit zu, Ackerpflanzen sind häufiger mit Dürre oder Starkregen konfrontiert, ebenso wie mit neuen Schädlingen und Krankheiten. Das Forschungsprojekt SHAPE möchte deshalb die gesamte genetische Vielfalt der Gerste erfassen, um diese für die Pflanzenzüchtung verfügbar und robustere Sorten möglich zu machen.
50 bis 70 Genome für ein Pangenom
In der bundeszentralen Ex-situ-Genbank in Gatersleben lagern mehr als 20.000 Gerstenmuster aus der ganzen Welt – gewissermaßen die ganze Vielfalt an einem Ort. „Die alle zu vollständig sequenzieren, wäre aber viel zu teuer“, erläutert Nils Stein vom Leibniz-Institut für Pflanzengenetik und Kulturpflanzenforschung (IPK), der das Forschungsprojekt koordiniert. Seine Arbeitsgruppe leitete 2017 die Veröffentlichung des Referenzgenoms der Gerste – die erste vollständige und hochaufgelöste Erbgutsequenz. Fünf Milliarden Basenpaare identifizierten die Fachleute und brachten sie in die richtige Reihenfolge, doppelt so viele wie beim Menschen. Jetzt treibt Steins Team gemeinsam mit internationalen Partnern die Arbeit am sogenannten Pangenom voran. Darunter verstehen Fachleute die Summe aus dem Kerngenom – jenem Teil, der allen Gerstenpflanzen gemein ist – und den individuellen Variationen aller Gerstenpflanzen.
Etwa 50 bis 70 Gerstengenome, die alle regionalen Subpopulationen abdecken, wären erforderlich, um das Pangenom zu ermitteln, schätzt Stein. Im ersten Förderzeitraum von SHAPE von November 2016 bis Oktober 2019 sollten zunächst zwei bis drei weitere Genome das Referenzgenom ergänzen. Für mehr hätte das Budget von rund 2,46 Mio. Euro aus der Initiative „Pflanzenzüchtungsforschung für die Bioökonomie“ angesichts der damals verfügbaren Technologien nicht gereicht. Dass es dann doch mehr geworden sind, lag an der rasanten Weiterentwicklung der Sequenzierungsmethoden.
Technologische und finanzielle Hürden
„Es gab zu Beginn des Projekts die Absicht, die günstigere Shotgun-Sequenzierung zu nutzen“, erinnert sich Stein. „Eigentlich ist dabei die Länge der sequenzierten Fragmente, aus denen das Genom dann zusammengesetzt werden muss, zu kurz, um die langen repetitiven Genomabschnitte der Gerste zu überspannen.“ Die Fragmente hätten so nicht zweifelsfrei zusammengesetzt werden können. Eine israelische Firma hatte dafür eine Lösung gefunden, hielt allerdings Teile der Methode geheim. „So gab es bei Publikationen die Kritik, dass die Methode eine Black-Box sei, und auch die Kosten für das proprietäre Bioinformatikkonzept waren hoch“, sagt Stein. Daraufhin machten sich die Forscher daran, selbst die Datenverarbeitung bei der Shotgun-Methode weiterzuentwickeln. „Wir konnten schließlich die Kosten für eine Sequenzierung um den Faktor drei bis vier senken“, freut sich der Pflanzengenetiker. Inzwischen hat das Bundesministerium für Bildung und Forschung (BMBF) eine zweite Förderperiode bewilligt, die bereits läuft. Hier wird schon die dritte Generation an Sequenzierungstechniken eingesetzt. „Bis zum Jahresende werden wir damit 30 weitere Genome sequenziert haben“, berichtet Stein. In nur vier Wochen könne man inzwischen ein ganzes Gerstengenom genauer sequenzieren als alle bislang öffentlich zugänglichen Gerste-Sequenzen. „Im Vergleich zu vor zehn Jahren ist das heute ein völlig neues Spiel.“
Dadurch werden sich einige Fragen, zu denen der erste Förderzeitraum bereits Hinweise gegeben hat, genauer beantworten lassen: Wie viele große Unterschiede, also strukturelle Variation, gibt es bei Gerste? Und welche Rolle spielen diese jeweils für die Populationen und für die Züchtung? Als strukturelle Veränderung bezeichnen die Fachleute Unterschiede über längere Abschnitte eines Chromosoms, im Gegensatz zu Punktmutationen, wo nur eine einzelne DNA-Base ausgetauscht ist. Die sind zwar für die Marker-gestützte Züchtung ebenfalls wichtig. Noch bedeutsamer sind aber jene Fälle, bei denen ein längerer Abschnitt eines Genoms beispielsweise entfallen ist, verdoppelt wurde oder vielleicht in umgekehrter Reihenfolge wieder eingebaut wurde, eine sogenannte Inversion.
Bedeutsame Inversionen entdeckt
„Inversionen sind besonders interessant – und in der Züchtung problematisch“, erklärt Stein. „Dort ist keine Rekombination möglich, wenn die Inversion nur bei einer Elternpflanze vorliegt.“ Die unterschiedlichen Merkmale der Elternpflanzen innerhalb dieses Abschnitts können sich in den Nachkommen nicht neu kombinieren, eine züchterische Optimierung von Genen in diesem Bereich ist mit klassischen Methoden ausgeschlossen.
Die größte Inversion, die das Team bei einem der sieben Gerstenchromosomen gefunden hat, ist 140 Millionen Basenpaare lang. „Dafür, dass es das bei Gerste gibt, existierte vorher keinerlei Evidenz, nur Mutmaßungen“, erzählt Stein. Eine andere der gefundenen Variationen tauchte häufig auf, könnte somit den betroffenen Pflanzen einen Evolutionsvorteil gebracht haben, spekuliert der Experte. „Wir wissen, in diesem Bereich liegen Gene, die an der Blühregulation beteiligt sind.“ Eine Inversion konnte das Projekt zurückverfolgen bis zu seiner mutmaßlichen Entstehung durch Mutationszüchtung in den 1960er Jahren. „Danach wurde sie unbewusst mitselektiert und ist daher heute in den europäischen Sorten weit verbreitet.“
Schlummerndes Züchtungspotenzial heben
Herausgefunden haben die Forschenden auch, dass nur etwa zwei Prozent des Gerstengenoms für Proteine kodieren. Der größte Anteil entfällt auf repetitive DNA, die lange als unwichtig erachtet wurde und deren Bedeutung die Wissenschaft erst langsam erschließt. Nicht zuletzt ergab das Projekt, an dem neben dem IPK das Helmholtz Zentrum München und die KWS AG beteiligt waren, dass die Summe der einzigartigen Sequenzen im Pangenom mit 600 Millionen Basenpaaren gut 50% größer ist als in einem individuellen Gerstengenom. Daraus wird deutlich, wie viel Information über die genetische Vielfalt der Gerste beim bisherigen Referenzgenom fehlen muss – und welches Potenzial für die Züchtung dort schlummert. SHAPE wird es in absehbarer Zeit gehoben haben.
Autor: Björn Lohmann