KI-Software sagt Raumstruktur von Proteinen voraus

KI-Software sagt Raumstruktur von Proteinen voraus

Forscher des Karlsruher Instituts für Technologie haben eine KI entwickelt, die nicht dem Prinzip der Bilderkennung, sondern der Sprachübersetzung folgt.

Fibronektin spielt bei der Wundheilung eine bedeutende Rolle. Die Grafik zeigt einen wichtigen Teil des Proteins mit Kontaktpaaren (jeweils gleichfarbige Kugeln).
Fibronektin spielt bei der Wundheilung eine bedeutende Rolle. Die Grafik zeigt einen wichtigen Teil des Proteins mit Kontaktpaaren (jeweils gleichfarbige Kugeln).

Der Mensch besitzt zwischen 80.000 und 400.000 unterschiedliche Proteine. Welche Funktion diese hochspezialisierten Moleküle erfüllen, wird wesentlich durch ihre räumliche Struktur definiert. Es ist jedoch schwierig, anhand der Aminosäurenabfolge, aus der ein Protein besteht, vorherzusagen, zu welcher Raumstruktur sich das jeweilige Protein zusammenfaltet. Forscher des Karlsruher Instituts für Technologie (KIT) haben nun einen neuen Ansatz entwickelt, um mittels Künstlicher Intelligenz (KI) solche Prognosen zu treffen.

Vorhersage ist bislang aufwendig und teuer

„Es ist sehr einfach zu bestimmen, aus welchen Aminosäuren eine Proteinkette besteht. Proteinstrukturen direkt experimentell zu bestimmen, ist aber sehr aufwendig und kostet Millionen“, erläutert Alexander Schug vom KIT. Schon heute gebe es dafür KI-basierte Ansätze. „Aktuell werden dafür vor allem Methoden aus der Bildverarbeitung eingesetzt“, ergänzt Datenanalyst Markus Götz. Neuronale Netze sind gut darin, Muster zu erkennen. Sie identifizieren so jene Bausteine der Proteine, die deren Raumstruktur bestimmen. Denn die räumliche Anordnung der Aminosäurenkette entsteht dadurch, dass sich bestimmte Bausteine aneinander anlagern und so die Kette krümmen.

Zusammenhänge analog zu den Teilen eines Satzes

Der bisherige KI-Ansatz hat allerdings das Problem, dass die entscheidenden Kontaktpartner innerhalb der Aminosäurenabfolge oft weit entfernt voneinander liegen. Diese sind jedoch für die Raumstruktur besonders wichtig. „Daher verfolgen wir stattdessen einen Ansatz aus der automatisierten Sprachübersetzung“, erklärt Götz die Besonderheit der neuen KI. „Wir betrachten die Aminosäureketten als Sätze, die in eine andere Sprache übersetzt werden.“ Diese selbstlernenden neuronalen Netze können erkennen, welche Teile eines Satzes miteinander in Bezug stehen. Analog für Proteine bedeutet das, dass sie erkennen, welche Aminosäuren miteinander einen Kontakt bilden.

Prognosen auch für unbekannte Proteinsequenzen

Trainiert haben die Forscher ihre KI mit dem Wissen darum, welche Kontaktpaarungen in bekannten Proteinsequenzen evolutionär erfolgreich waren. Dazu zählt das Team um Götz vor allem solche, die sich von Art zu Art zwar unterscheiden, aber zu funktionsgleichen Proteinen geführt haben, beispielsweise beim Hämoglobin. „Wir erwarten, dass das System so auch Rückschlüsse auf den Aufbau unbekannter Proteinsequenzen ziehen kann“, resümiert Datenanalyst Götz das Potenzial des neuen Ansatzes.

bl