Der Chemienobelpreis ehrt dieses Jahr eine sehr junge Entwicklung: die Analyse von Struktur und Funktion von Proteinen mithilfe von künstlicher Intelligenz. Sie macht es möglich, ganz neue Proteine synthetisch zu kreieren – etwa ein Molekül, das das Corona-Virus detektieren kann.
Im Vergleich zu anderen Nobelpreisträgern sind sie jung: David Baker, 62, Demis Hassabis, 48, und John M. Jumper, Ende 30, haben den Nobelpreis für Chemie erhalten. Denn anders als andere Entdeckungen brauchten ihre Leistungen nicht Jahrzehnte, um in realen Nutzen für die Welt umgemünzt zu werden.
Schon heute ist klar, dass das, was sie herausgefunden haben, unsere Welt verändern wird: Sie haben dazu beigetragen, die Bausteine des Lebens zu entschlüsseln, die Proteine.
Der eine in der öffentlichen Forschung, die anderen beiden bei Google, haben sie an ähnlichen Problemen gearbeitet, manchmal sogar um die Lösung derselben Herausforderung gewetteifert. Besonders Hassabis und Baker sind herausragende Persönlichkeiten, die in ihren Feldern schon vor dem Nobelpreis berühmt waren. Nicht nur wegen ihrer Entdeckungen, sondern auch wegen ihrer besonderen Art, Probleme anzugehen.
Die grosse Frage nach dem Code des Lebens
Proteine sind die Bausteine des Lebens. Aus ihnen entstehen Knochen und Gewebe. Und auch die Botenstoffe im Körper, etwa die Hormone, sind Proteine. Bis heute kennen wir etwa 200 Millionen von ihnen. Wie sie aufgebaut sind: Diese Frage stellten sich Wissenschafter seit den 1950er Jahren.
Proteine bestehen aus Aminosäuren, die wie Perlen auf einer Schnur in einer bestimmten Abfolge aneinandergereiht sind. Mehr als 500 dieser Perlen können es sein, und weil es 20 verschiedene Aminosäuren gibt, sind Milliarden unterschiedlicher Kombinationen möglich. Die Perlenkette ist noch dazu auf einzigartige Weise gefaltet. Der Zusammenhang zwischen den Bestandteilen eines Proteins und seinen Eigenschaften war lange ein Rätsel.
1972 erhielt der Chemiker Christian Anfinsen den Nobelpreis für seine Arbeit zu den Proteinen. Er konnte zeigen, dass die Art und Weise, wie ein Protein im dreidimensionalen Raum gefaltet ist, durch die Zusammensetzung der Aminosäuren definiert ist. In seiner Dankesrede postulierte er damals die These, dass man dereinst für jede beliebige Aminosäurenkombination die dreidimensionale Form – und damit die Eigenschaften des Proteins – werde vorhersagen können.
Die Wissenschafter Baker, Hassabis und Jumper haben genau das geschafft und konnten sogar neue Proteine mit ganz bestimmten Eigenschaften herstellen. Dafür haben sie, gut 50 Jahre nach Anfisen, wiederum einen Nobelpreis erhalten.
David Baker hat als Erster ein künstliches Protein erschaffen
David Baker ist heute 62 Jahre alt und hat sich als Biochemiker sein ganzes Leben mit den Rätseln der Proteinstruktur befasst. Er und sein Team entwickelten vor gut 20 Jahren ein Computerprogramm namens «Rosetta», um den Zusammenhang zwischen Struktur, Form und Funktion von Proteinen zu entschlüsseln.
Mithilfe dieses Programms gelang es David Baker und seinem Team im Jahre 2003 erstmals, ein völlig neues Protein zu kreieren, das in der Welt vorher nicht existiert hatte. Und tatsächlich, wenn das Protein im Labor hergestellt wurde, hatte es fast die Form, die das Computerprogramm vorhergesagt hatte und verhielt sich wie erwartet. Es war die Geburt des neuen Forschungsfeldes Protein-Design.
In den letzten 20 Jahren hat David Baker mit seinem Team diverse neue Proteine entwickelt. Jüngst etwa eine Art Biosensor, der zu leuchten beginnt, wenn er mit Sars-CoV-2 in Kontakt kommt. Dafür haben die Forscher ein Protein geschaffen, das sich an die Proteine auf der Oberfläche des Virus bindet. In Zukunft könnte der Sensor die heute verwendeten PCR-Tests ersetzen oder gar das Virus blockieren, sobald er an dessen Oberflächenproteine angedockt hat.
Das ursprüngliche Computerprogramm Rosetta entwickelten Baker und sein Team seit 2003 kontinuierlich weiter. Es enthält neben der Struktur und Form von Proteinen auch biophysikalische Informationen wie etwa die Polarität und Ladung von Aminosäuren. Damit gelang es Baker und seinem Team im Jahre 2017 etwa, einen Detektor für das hochwirksame Betäubungsmittel Fentanyl zu kreieren.
Bruno Correia, Bioinformatiker und Proteindesigner an der EPFL, hat mit Baker zusammengearbeitet und hebt hervor, was Baker für die ganze Forschungsgemeinschaft geleistet hat: «Er hat immer öffentlich den Code seiner Programme geteilt. Er wollte nicht den ganzen Ruhm für sich. Und er hat es geschafft, mit dieser Einstellung das ganze Feld zu prägen und voranzubringen – ganz abgesehen davon, dass er ein Genie ist.»
Hassabis und Jumper lösen das Rätsel der Form der Proteine
Die grosse Frage, wie sich aus Aminosequenzen die dreidimensionale Form der Proteine vorhersagen lässt, hat schliesslich Demis Hassibis gelöst.
Als Student hatte Hassibis zum ersten Mal von dem Rätsel der Proteinfaltung gehört. Ein Freund erklärte ihm das Problem und dass es bisher noch nicht gelöst sei. Heute sagt der Computerwissenschafter, er habe schon damals gedacht, dass dieser Anwendungsfall wie gemacht für KI sei. Was Algorithmen gut könnten, sei, grundlegende Zusammenhänge in grossen Datenmengen zu finden und daraus Vorhersagen abzuleiten.
Und Daten zu Proteinen gab es zuhauf: In mühsamer Laborarbeit haben Generationen von Doktorandinnen und Forschern herausgefunden, wie sich verschiedene Kombinationen von Aminosäuren falten, und diese Daten festgehalten und offen verfügbar gemacht. Wer seine Arbeiten publizieren wollte, musste auch die genauen Strukturkoordinaten der untersuchten Proteine in einer öffentlichen Datenbank anlegen.
In der sogenannten CASP-Challenge (das steht für Critical Assessment of Protein Structure Prediction, also Systematische Bewertung der Proteinstrukturvorhersage) wetteifern Teams aus der ganzen Welt seit 1994 darum, wer das beste Programm zum Vorhersagen der Proteinform hat.
Google schlägt Rekorde in der Proteinanalyse
In der Zwischenzeit hatte Hassabis das KI-Startup DeepMind gegründet. Dort entwickelte er 2016 Alphago, die erste KI, die es schaffte, im Brettspiel Go den Weltmeister zu besiegen. Kurz darauf kaufte Google das Startup und Hassabis leitete es weiterhin.
Hassabis setzte ein Team um seinen Mitarbeiter John Michael Jumper auf das Problem der Proteinfaltung an. Zusammen entwickelten sie das KI-Programm Alphafold. Es sollte in der Proteindatenbank einen Zusammenhang zwischen Aminosäuresequenzen der Proteine und ihrer dreidimensionalen Form errechnen. Dafür arbeitet das Programm mit den 200 Millionen bekannten Proteinsequenzen und der Struktur von etwa einer Million Proteine.
Bereits im Jahr 2018 schlug das KI-Programm Alphafold von Deepmind den CASP-Rekord. Durch die zweite Version des Programms gelang 2020 der grosse Durchbruch: Die Vorhersagen waren mit grossem Abstand besser als jene aller bisherigen Programme, darunter auch das damalige Programm des Teams von Baker.
Kritik an jüngsten Entscheidungen von Google
Ohne die jahrzehntelange Vorarbeit der Strukturbiologie wäre Alphafold allerdings nie möglich geworden. In der Schweiz wird zum Beispiel am Paul-Scherrer Institut zu Proteinstrukturen geforscht. Nach Angaben dort tätiger Experten sind etwa Wissenschafter am Synchrotron der Schweiz (SLS) für gut fünf Prozent der Einträge in der Protein-Datenbank zuständig.
Kurz, die Datenbank wurde von Wissenschaftern aus der Grundlagenforschung aufgebaut. Deswegen stösst die jüngste Eröffnung von Google, dass Alphafold3, die neueste Version der Software, nicht mehr öffentlich zugänglich sei, unter Wissenschaftern auf Kritik. Ohne öffentlich zugängliche Daten wird nämlich nobelpreiswürdige Forschung in Zukunft kaum möglich sein.