„Unsere generative KI spricht die Sprache der Proteine“

„Unsere generative KI spricht die Sprache der Proteine“

Birte Höcker

Beruf: Biochemikerin

Position: Professorin an der Universität Bayreuth

Biochemikerin Birte Höcker
Vorname
Birte
Nachname
Höcker

Beruf: Biochemikerin

Position: Professorin an der Universität Bayreuth

Biochemikerin Birte Höcker

Die Biochemikerin Birte Höcker von der Universität Bayreuth nutzt Künstliche Intelligenz für die Herstellung maßgeschneiderter Proteine. Hier spricht sie über das Potenzial von Sprachmodellen – die ähnlich wie ChatGPT funktionieren – für die Entwicklung völlig neuartiger Biomoleküle.

Birte Höcker forscht am Institut für Biochemie der Universität Bayreuth. Die Professorin entwickelt mit ihrer Arbeitsgruppe digitale Werkzeuge für das Protein-Design. Künstliche Intelligenz (KI) eröffnet für Höcker hochinteressante und vielversprechende Möglichkeiten, Methoden der Sprachverarbeitung für die Herstellung maßgeschneiderter Proteine zu nutzen. Generative KI-Technologien können Proteine kreieren, die in der Natur nicht vorkommen oder in der Evolution noch nie existiert haben.

Frage

Wie verändern KI-basierte Methoden die Entwicklung von Designer-Proteinen für Forschung und Industrie?

Antwort

KI-Technologien haben in den vergangenen Jahren die Proteinforschung und die Möglichkeiten für die Herstellung maßgeschneiderter Proteine transformiert. KI-Algorithmen wie AlphaFold2 sind in kürzester Zeit zum integralen Bestandteil strukturbiologischer Analysen weltweit geworden. Ebenso gibt es mittlerweile eine Reihe von KI-basierten Werkzeugen für das Design neuer Proteine. Dabei kommen oft Sprachmodelle zum Einsatz wie zum Beispiel bei ProGen, ProtGPT2 oder Chroma.

Frage

Wie funktioniert das KI-basierte Sprachmodell ProtGPT2, das Sie mit Ihrem Team entwickelt haben?

Antwort

ProtGPT2 ist wie ChatGPT ein Modell zur Verarbeitung natürlicher Sprache. Unser Sprachverarbeitungsmodell haben wir mit 50 Millionen Sequenzen natürlicher Proteine trainiert. Nun versteht es nicht nur die Sprache der Proteine, sondern kann sie auch kreativ anwenden. Jetzt lassen sich damit Proteine entwerfen, die durch Faltung stabile Strukturen annehmen und in diesem Zustand dauerhaft funktionstüchtig sind. Diese Einblicke in die unermesslich weite Welt möglicher Proteine öffnen die Tür zu einer innovativen Forschung, die bisher unbekannte Proteine auf neuartige Weise erzeugt.

Frage

Was sind weitere besondere Merkmale von ProtGPT2?

Antwort

Die meisten Proteine, die bisher de novo entworfen wurden, haben idealisierte Strukturen. Bevor sie angewendet werden können, sind in der Regel aufwendige Funktionalisierungsprozesse erforderlich, beispielsweise das Einfügen von Erweiterungen und Hohlräumen. ProtGPT2 hingegen erzeugt Proteine, die von Hause aus eine derart ausdifferenzierte Struktur besitzen, dass sie in ihrer jeweiligen Umgebung bereits einsatzfähig sind. Wir haben zudem Hinweise, dass das Modell Proteine kreieren kann, die in der Natur nicht vorkommen und in der Geschichte der Evolution womöglich noch nie existiert haben.

Frage

Welche Proteine haben Sie besonders in den Blick genommen?

Antwort

Wir interessieren uns sehr für sogenannte TIM-barrel Proteine, die häufig enzymatisch aktiv sind, aber arbeiten auch viel mit Bindeproteinen, die sich zur Herstellung von Sensoren für kleine Moleküle eignen. Einerseits interessiert uns welche Proteinstrukturen überhaupt möglich sind, andererseits versuchen wir zudem Proteine für bestimmte Anwendungen zu entwickeln. Hierbei faszinieren uns sowohl Enzyme für den Plastikabbau genauso wie Alternativen für Reagenz-Antikörper als auch die Konstruktion von Motorproteinen.

Frage

Welche spannende Entwicklungen beobachten Sie derzeit in der Protein-Design-Szene?

Antwort

Die Entwicklungen sind rasant. Es entstehen laufend neue Werkzeuge und sie werden allgemein zugänglicher. Zudem sind die Erfolgsquoten enorm gestiegen. Früher sind viele Designs bereits an der Herstellung (Expression in Bakterienzellen) gescheitert. Heute beobachten wir eine deutliche Verbesserung in den Eigenschaften und der Handhabung vieler Designer-Proteine, so dass wir ganz neue Fragen stellen und Herausforderungen angehen können.

Interview: Philipp Graf