https://www.faz.net/aktuell/wissen/kuenstliche-intelligenz-macht-ernst-im-biolabor-17079732.html

Proteinfaltung vorhersagbar? : Künstliche Intelligenz macht ernst im Biolabor

Komplexer geht immer: Dieser Ionen-Kanal, der in einer Zellmembran verankert ist, ist aus vielen Untereinheiten aufgebaut - zu schwierig auch für AlphaFold. Bild: Scripps Research Institute

Lebenswissenschaftler verneigen sich. Doch hat DeepMind mit seiner lernenden Maschine „AlphaFold“ wirklich ein Jahrzehnte altes Problem der Biologie gelöst, wie behauptet wird? Eine Umfrage unter unabhängigen Experten.

          7 Min.

          „Tja, wenn ein Computerprogramm den Nobelpreis gewinnen könnte….“. Richard Dawkins, einer der arrivierten, international bekanntesten Evolutionsbiologen aus England, alles andere jedenfalls als ein Wissenschaftler im Silicon-Valley-Fieber, hat in seinem Tweet die Begeisterung für den jüngsten Erfolg des Google-Ablegers „DeepMind“ auf den Punkt gebracht. Die Hardcore-Fans Künstlicher Intelligenz (KI) werden womöglich mit den Schultern zucken, der Gebrauchswert von „AlphaFold“ im Alltag und zur Befriedigung des Spieltriebs ist überschaubar. Für die Biologie allerdings im Allgemeinen und die Bioinformatik im Besonderen ist den Experten kein Superlativ zu schade. Vom Heiligen Gral der Biologie ist die Rede, was allerdings voraussetzt, dass es in der Biologie viele Heilige Grale geben muss, so oft wie dieses Wort in den vergangenen siebzig Jahren Bioforschung schon gefallen ist.

          Joachim Müller-Jung
          Redakteur im Feuilleton, zuständig für das Ressort „Natur und Wissenschaft“.

          Deshalb zuerst kurz erklärt, was genau die neue Version der Deep-Mind-KI nun geschafft hat, was Bioinformatikern aus Fleisch und Blut Jahrzehnte lang nicht vergönnt war. Eine neue Entwicklungsstufe von „AlphaFold“ soll das Proteinfaltungsproblem gelöst haben. Seit mehr als einem halben Jahrhundert, eigentlich seit Beginn der Molekularbiolgie, die in den fünfziger Jahren mit der Entzifferung der DNA-Doppelhelix so richtig Fahrt aufgenommen hatte, versucht man, dieses Problem zu lösen. Wie entsteht aus einer im Erbgut programmierten Abfolge von Aminosäuren die dreidimensionale Gestalt des Proteins? Mit anderen Worten: Wie wird aus einer Kette ein Körper. Ein Protein – und davon gibt es Millionen verschiedene im Körper – kann aus Dutzenden oder Tausenden von aneinander geketteten Aminosäure-Bausteinen aufgebaut sein.

          Die Art und Weise aber, wie diese Kettenglieder bei der Bildung durch Ribosomen im Zellplasma miteinander chemische Bindungen eingehen, ist aus dem genetischen Code nicht ablesbar. Für ein Protein, das aus mehr als Hunderten Aminosäuren besteht, gehen die Möglichkeiten der „Verklumpung“ rechnerisch in astronomische Höhen. Deshalb war die Biologie bei der Aufklärung der Proteinstruktur immer auf viele, extrem aufwändige Präparations- und Analysetechniken angewiesen – auf Röntgentechniken etwa oder auf die Elektronenmikroskopie.

          Warum die Vorhersage der 3-D-Struktur so wichtig ist, lässt sich in der Covid-19-Krise besonders gut verstehen: Nur, wenn unsere Antikörper und Immunzellen ganz exakt an die empfindliche Stelle des Coronavirus binden, sind die Immunwaffen in der Lage, den Erreger am Eintritt in die Zellen zu behindern und damit unschädlich zu machen. Für die Pharmabranche ist die KI deshalb besonders vielversprechend. Hätte man die Proteinfaltung im Griff, könnte man viel schneller und gezielter Arzneimittel entwickeln.

          Eine goldene Nuss also, die bisher nur keiner knacken konnte. Bis eben jetzt eben, behauptet DeepMind.  

          Nach der Präsentation von AlphaFolds jüngstem Wettbewerbserfolg kündigte DeepMind-Chef Demis Hassabis sogar an, die 3D-Analyse der gesamte Proteinmaschinerie eines menschlichen Körpers „in wenigen Monaten“ erreichen zu können.
          Nach der Präsentation von AlphaFolds jüngstem Wettbewerbserfolg kündigte DeepMind-Chef Demis Hassabis sogar an, die 3D-Analyse der gesamte Proteinmaschinerie eines menschlichen Körpers „in wenigen Monaten“ erreichen zu können. : Bild: AFP

          Bei der KI, die der Firma zufolge das Proteinfaltungsproblem weitgehend gelöst haben will, handelt es sich um ein tiefes neuronales Netzwerk der neuesten Generation. Komplizierte Proteine aus vielen Untereinheiten können damit aber offenbar noch nicht vorhergesagt werden, sondern nur „Single Domain“-Proteine. Auch die Veränderungen, die Proteine durch Veränderungen der Umwelt oder durch pathologische Fehlbildungen annehmen können, sind für die KI offenbar noch nicht dechiffrierbar. Noch ist auch in technischer Hinsicht das KI-Geheimnis von AlphaFold  nicht in allen Details offen gelegt. Es gibt weder den Quellcode noch eine aktuelle Publikation. Immerhin: DeepMind will demnächst ein Methodenpaper publizieren. Beim diesjährigen Branchenwettbewerb CASP14 („Critical Assessment of protein Structure Prediction) soll AlphaFold aber schon sein Potential gezeigt haben – geprüft von unabhängigen Experten sozusagen. Die dreidimensionale Faltungsstruktur von 70 der im Wettbewerb zu lösenden 100 Proteinsequenzen sollen mit der  selbstlernenden Maschine so präzise vorhergesagt worden sein wie Experimentatoren, die gleichzeitig ihre Strukturvorhersagen auf der Basis von experimentellen Verfahren wie der Kristallstrukturanalyse mit Röntgenstrahlen, Cryo-Elektronen-Tomographie oder der multidimensionalen NMR-Spektroskopie machten.

          Wir dokumentieren im Folgenden Stellungnahmen ausgewiesener Experten, die das „Science Media Center Germany“ (SMC) in Köln zusammengetragen hat.

          Dr. Jan Kosinski,
          Gruppenleiter, Europäisches Laboratorium für Molekularbiologie (EMBL), Hamburg

          „Wow, das ist ein Durchbruch! Es gibt natürlich Einschränkungen und Aspekte, die verbessert werden müssen, bevor das Problem der Strukturvorhersage endgültig gelöst ist, aber die Genauigkeit und Erfolgsrate von AlphaFold ist beispiellos. Ich kann es kaum erwarten, diese Methode für meine Proteine einzusetzen.“

          Dr. Jürgen Cox, Leiter der Forschungsgruppe „Computational Systems Biochemistry“, Max-Planck-Institut für Biochemie, Martinsried bei München:

          „Der ‚Critical Assessment of protein Structure Prediction‘ Wettbewerb ist ein sehr guter Maßstab zur Beurteilung, inwiefern Vorhersagemethoden der Proteinstruktur gute Ergebnisse liefern. Hier ist insbesondere darauf zu achten, dass die vorherzusagenden Strukturen neu genug sind – in dem Sinne, dass die zu bewertenden Methoden diese Proteinstruktur in ihrer Trainingsphase noch nicht kannten. Nur dann kann man davon ausgehen, dass die Methode mit allgemeinen abstrahierten Regeln arbeitet, um Strukturen vorherzusagen. AlphaFold besteht diesen Test mit Bravour und mit solch guten Ergebnissen, dass man wahrscheinlich davon ausgehen kann, dass das verbesserte AlphaFold tatsächlich den Code geknackt hat…

          Die Möglichkeit, Proteinstrukturen schnell und präzise vorherzusagen, eröffnet ungeahnte Möglichkeiten für das Verständnis von Krankheiten und ihrer Heilung. Die Funktion von Proteinen hängt eng zusammen mit ihrer dreidimensionalen Struktur. Viele Krankheiten basieren auf der Störung der regulären Funktionsweise von Proteinen. Die Beziehung zwischen der DNA und der Funktionsweise von Proteinen, Zellen, Geweben, Organen und dem ganzen Körper wird durch die Strukturvorhersage ein enormes Stück weiter zusammengeführt. Wir kennen das menschliche Erbgut schon lange, aber es sind trotzdem noch viele Fragen offen, die nun eine bessere Möglichkeit der Beantwortung vor sich haben.“

          Prof. Dr. Helmut Grubmüller, Direktor der Abteilung für theoretische und computergestützte Biophysik, Max-Planck-Institut für biophysikalische Chemie, Göttingen:

          „Dies ist zweifelsohne eine beachtliche Leistung und ein deutlicher Fortschritt, der viele andere Ansätze in den Schatten stellt. Ist damit das Proteinfaltungsproblem ‚weitgehend gelöst‘, wie die Autoren der Studie schreiben? Wenn statt einer zweitägigen Wettervorhersage mit 60 Prozent Zuverlässigkeit nun eine dreitägige Vorhersage mit 80 Prozent Genauigkeit gelingt – ist damit das Wettervorhersageproblem gelöst? Ich denke, das wäre etwas übertrieben.“

          Prof. Dr. Jens Meiler, Leiter des Instituts für Wirkstoffentwicklung, Universität Leipzig und Professor für Chemie, Pharmakologie und Biomedizinische Informatik, Vanderbilt University, Nashville:

          „Soweit ich die Resultate von AlphaFold schon bewerten kann, sieht es so aus, als ob wiederum ein großer Fortschritt gelungen ist. Das ist toll und wird unser Forschungsfeld vorantreiben! Ich wäre allerdings vorsichtig hier von der ‚Lösung‘ des Problems zu reden. Wissenschaftlicher Fortschritt ist häufig nicht eine Ja- oder Nein-Entscheidung, sondern ein iterativer Prozess in kleinen oder größeren Schritten. Wenn sich die Ergebnisse so bestätigen, ist dies ein großer Schritt in diesem Prozess. Man kann aber auch noch kritische Fragen stellen: So ist die Vorhersage der Proteinfaltung ja offenbar nicht bei 100 Prozent der Beispiele gelungen. Auch ist die Vorhersage abhängig von der Auswertung Tausender bekannter Proteinstrukturen, das heißt, dass das grundlegende Proteinfaltungsproblem noch nicht ohne Zuhilfenahme dieses Wissens (wir sagen ,de novo‘) gelöst werden kann. Das limitiert die Übertragung in andere Forschungsfelder.“

          Prof. Dr. Andrei Lupas, Direktor des Max-Planck-Instituts für Entwicklungsbiologie, Tübingen:

          „Ich habe in CASP14 eines der Teams geleitet, welches die eingereichten Strukturvorhersagen begutachtet hat, und war zutiefst von der Qualität der Modelle von AlphaFold und deren Vorsprung vor den besten nächsten Gruppen beeindruckt. Wir haben selber mehrere Proteine als Targets zur Vorhersage eingereicht, darunter eines, für das wir kristallographische Diffraktionsdaten bis 3,5 Angström hatten, die Struktur aber seit einem Jahrzehnt nicht hatten lösen können. Mit der Vorhersage von AlphaFold als Suchmodell konnten wir die Struktur in einer halben Stunde lösen.“

          Prof. Dr. Gunnar Schröder, Leiter der Forschungsgruppe Computational Structural Biology, Institut für Biologische Informationsprozesse, Strukturbiochemie, Forschungszentrum Jülich GmbH:

          „AlphaFold ist im Grunde, wie eine Person zu kennen, die innerhalb weniger Stunden eine Proteinstruktur experimentell bestimmen kann, uns aber nicht sagt, wie sie das macht…

          Ich habe allerdings bisher keine Informationen darüber, wie viele Strukturen AlphaFold in CASP14 nicht (!) richtig lösen konnte. Ich sehe nur den mittleren GDT, der ist zwar sehr hoch, aber von einer Lösung des Faltungsproblems würde ich erwarten, dass sie für alle Proteine funktioniert. Zum Vergleich: In CASP13 im Jahr 2018 hatte AlphaFold ‚nur‘ 24 von 43 der schwierigen Strukturen gelöst.

          Wir gehen davon aus, dass in Zukunft jeder Mensch sein Erbgut entschlüsselt haben wird. Da sich das Erbgut der Menschen unterscheidet, unterscheiden sich auch seine Proteine. Jeder Mensch hat also leicht unterschiedliche Proteine. Wir werden aber nicht in der Lage sein, für jeden Menschen seine eigenen Proteinstrukturen experimentell zu bestimmen. Mit Hilfe von Strukturvorhersagemethoden – wie zum Beispiel AlphaFold – geht das nun aber…

          Das schnell wachsende Gebiet der personalisierten Medizin könnte damit sogar zur personalisierten molekularen Medizin werden, bei der wir Wirkstoffe und Therapie in Zukunft auf die persönlichen Proteinstrukturen eines einzigen Patienten zuschneiden.“

          Prof. Dr. Alexander Schug, Leiter der Forschungsgruppe „Multiscale Biomolecular Simulation“, Karlsruher Institut für Technologie (KIT):

          „Absolut herausragend ist die berichtete Genauigkeit des Verfahrens. Für eine vergleichbare Genauigkeit waren bisher aufwändige Experimente nötig, um neue Proteinstrukturen untersuchen zu können. Vorhersagen neuer Strukturen würden gleichzeitig weitere Validierungen ermöglichen. Ferner könnten strukturgebende Verfahren in Zukunft deutlich vereinfacht werden, was neben der Grundlagenforschung auch für die pharmazeutische und medizinische Forschung relevant ist…

          Spannend ist in dem Zusammenhang auch ‚die gesellschaftliche Perspektive‘ der Forschung. Wollen wir als Gesellschaft, dass große internationale Technologieunternehmen Forschung zu KI so wesentlich vorantreiben, oder wollen wir in der öffentlichen Forschung an Universitäten und Forschungseinrichtungen unabhängige Kompetenz in der Schlüsseltechnologie KI halten?“

          Dr. Sameer Velankar, Gruppenleiter Protein Data Bank in Europe, European Bioinformatics Institute, Europäisches Laboratorium für Molekularbiologie (EMBL-EBI), Cambridge:

          „Derzeit haben weniger als ein Prozent der Proteine im Menschen experimentell bestimmte Strukturen. Die Strukturvorhersage kann 3-D-Strukturen für Sequenzen liefern, für die experimentell bestimmte Strukturen nicht verfügbar sind. Die Fortschritte, die DeepMind mit der AlphaFold-Methode erzielt hat, sind aufgrund der bemerkenswerten Erfolgsrate bei der Vorhersage von 3-D-Strukturen besonders bedeutsam.“

          Weitere Themen

          Topmeldungen

          Hamja Ahsan

          Neuer Documenta-Streit : Der Mann, der den Kanzler beschimpft

          Der britische Künstler und Documenta-Teilnehmer Hamja Ahsan schmäht Olaf Scholz als Faschisten. Und beschimpft auch alle anderen Deutschen. Ist das Kunst? Und muss man es sich gefallen lassen?

          Newsletter

          Immer auf dem Laufenden Sie haben Post! Die wichtigsten Nachrichten direkt in Ihre Mailbox. Sie können bis zu 5 Newsletter gleichzeitig auswählen Es ist ein Fehler aufgetreten. Bitte versuchen Sie es erneut.
          Vielen Dank für Ihr Interesse an den F.A.Z.-Newslettern. Sie erhalten in wenigen Minuten eine E-Mail, um Ihre Newsletterbestellung zu bestätigen.