https://www.faz.net/-gwz-8viy4

Durchbruch mit DNA-Speicher : Die Festplatte für die Ewigkeit

Alle Videos, Bilder, E-Mails und sonstige Dateien von 600 Smartphones können in dieser geringen Menge an Erbsubstanz gespeichert werden, die sich in dem Teströhrchen (rechts) befindet. Bild: Tara Brown Photography/University of Washington

Alle Daten der Welt in einem Kilo verpackt, fehlerfrei gesichert bis ans Ende der Tage? Mit Chips bräuchte es dazu nicht nur eines Energiewunders. Zwei Biologen haben einen „DNA-Brunnen“ programmiert, der die Erbsubstanz als Datenspeicher sexy macht.

          Kein Datenspeicher der Welt und auch alle Magnetspulen zusammen würden es nicht schaffen, sämtliche digitalen Daten abzuspeichern, die heute rund um den Globus produziert werden. Mit dem Erbmaterial DNA wäre das eine Leichtigkeit. Buchstäblich. Ein Kilogramm der Erbsubstanz, die chemisch als Desoxyribonukleinsäure bezeichnet wird und wie ein langer, unsichtbarer und extrem dünner kodierter „Lebensfaden“ in jeder unserer Körperzellen schwimmt, würde theoretisch  ausreichen, die gesamten Daten der Welt abzuspeichern – und zwar  Hunderttausende von Jahren lang, sofern die DNA kühl und trocken gelagert wird.  Das Leben selbst hat es vorgemacht. Höhlenfunde von menschlichen Knochenfragmenten haben gezeigt, dass im Genom jeder Zelle Gigabyte an genetischen Daten mit dem Bauplan des Menschen praktisch unbeschadet erhalten bleiben. Die Frage ist nur: Kann man so einen hocheffizienten molekularen Datenspeicher auch technologisch herstellen – und zu konkurrenzfähigen Preisen? 

          Joachim Müller-Jung

          Redakteur im Feuilleton, zuständig für das Ressort „Natur und Wissenschaft“.

          Eine überzeugende  Antwort auf den ersten Teil der Frage haben Molekularbiologen und Bioinformatiker  jetzt wohl geliefert : Ja, die extreme Datendichte und Stabilität des Genoms lässt sich schon mit den heutigen Mitteln der Bioingenieure und Programmierer nutzen.  Fünf Jahre, nachdem der Harvard-Genetiker George Church zum ersten Mal kommerzielle Digitalinformation auf DNA-Schnipsel abgespeichert hatte, haben jetzt Wissenschaftler der Columbia University und des New York  Genome Center einen Weg gefunden, die  Datenspeicherkapazität und –qualität synthetisch erzeugter Erbsubstanz noch einmal radikal zu steigern. Mit einer  Speicherkapazität von 215 Petabyte pro Gramm DNA ist man damit schon sehr nahe an der theoretischen Datendichte des Erbmaterials. 

          In der aktuellen Ausgabe der Zeitschrift „Science“ kann man nachlesen, wie Yaniv Erlich und Dina Zielinski diesen ingenieurwissenschaftlichen Triumph als mögliche Eintrittspforte in eine neue digitale Ära feiern. „Mit unserer effizienten und robusten Kodierstrategie , die praktisch unbegrenzte Speicherung und Wiedergewinnung von digitalen Informationen erlaubt, sind wir näher an der Shannon-Kapazität der DNA-Speicherung als jemals zuvor“, schreiben die beiden Autoren.

          DNA-Speicher sind Energiewunder

          Noch wachsen die Speicherkapazitäten der gängigen Datenspeicher dank der Miniaturisierung der Chips exponentiell an,  doch Moores Gesetz hin oder her – auf lange Sicht sind die Bit- und Bytespeicher  auf Siliziumbasis viel zu instabil und auch viel zu ineffizient. Dazu kommt: Großcomputer verschlingen viele Megawatt an Leistung. Das gilt für Rechner auf Siliziumbasis wie auch für solche mit Magnetspeicher, die immerhin die Daten sehr viel dichter packen können. Theoretisch, so hat David Markovitz, ein amerikanischer Neurowissenschaftler im vergangenen Jahr in „Nature“ vorgerechnet, wäre zwar ein riesiges Datenzentrum denkbar, ausgestattet mit Abertausenden von Magnetspeichern, die Exabyte – mehr als eine Milliarde Gigabyte – aufnehmen, „aber so ein Rechenzentrum würde allein an Baukosten mehr als eine Milliarde Dollar verschlingen, mehr als zehn Jahre Bauzeit in Anspruch nehmen und Hunderte Megawatt Strom jährlich verbrauchen“. Angesichts der exponentiellen Zunahme an Datenkapazitäten wäre der Speicher praktisch schon bei der Fertigstellung veraltet.

          DNA-Strang, Träger der Erbinformation.

          In einem Gramm DNA dagegen  könnte man dreimal so große Datenmengen abspeichern (und zwar fehlerfrei), wie der Supercomputer des Deutschen Klimarechenzentrums enthält.  Wie das geht? Die beiden New Yorker Forscher haben dazu einen mehrstufigen Algorithmus genutzt, der im Prinzip  als „Fountain Code“  (etwa: Brunnen-Code) in der Youtoube-Szene schon länger bekannt ist. Im Prinzip geht es darum, jeden Baustein in dem langen DNA-Faden  so effektiv und fehlerfrei wie möglich als Informationseinheit zu nutzen. Maximale Datenverpackung, damit die Informationen nur so  sprudeln.  Keine Information darf verloren gehen, Redundanz erzeugt Genauigkeit. Deshalb haben die Forscher ihren „DNA-Brunnen“  so programmiert, dass er die digitale Information möglichst optimal und verlustfrei in die biologische Sprache der Erbsubstanz übersetzt. Jede Informationseinheit wird in Abertausende kleiner „DNA-Häppchen“ eingeschrieben  – nicht einmal, sondern vielfach. Dazu werden DNA-Sequenzen genutzt, die möglichst leicht und sicher wieder ausgelesen werden können. Informationsmüll wird schon während der Speicherproduktion aussortiert. Auf die Weise ist es Erlich und Zielinski gelungen, jeden DNA-Baustein fast optimal als Bitspeicher zu nutzen. Jeder einzelne DNA-Schnipsel wurde mit einem Barcode versehen, damit es am Ende bei der Wiedergewinnung der Daten zu keinerlei falschen Zuordnungen kommt. 

          Stummfilm und Betriebssystem im Erbmaterial

          Für ihren Testlauf haben sie eine komprimierte Datei mit 2,15 Megabyte in einen biologischen Speicher aus 72.000 DANN-Schnipseln übersetzt. Enthalten darin: die Daten für ein Computerbetriebssystem, den berühmten französischen Stummfilm „Die Ankunft eines Zuges auf dem Bahnhof in La Ciotat“ aus dem späten 19. Jahrhundert, eine 50-Dollar-Geschenkkarte von Amazon, einen Computervirus, die Information einer der Pioneer-Plaketten, die auf interstellaren amerikanischen Raumsondern installiert wurde, und ein pdf-file mit einer Arbeit von Claude Shannon, einem der ersten Informationstheoretiker und Wegbereiter des digitalen Zeitalters. 

          Nimmt man die Schnelligkeit heutiger Prozessoren zum Vergleich, dann ging der ganze Speichervorgang nicht gerade leicht von der Hand, er war sogar extrem mühselig.  Das Schreiben, Übertragen und auch das Wiedergewinnen der Information aus dem DNA-Speicher dauerte Stunden, ja Tage. Geschwindigkeit also ist sicher nicht die Stärke der molekularen Speicher, so schnell werden sie moderne Memory Sticks in der Hinsicht nicht ersetzen können. Aber wenn es um die Datendichte und die Genauigkeit angeht, ist der molekulare Speicher praktisch unschlagbar: Null Fehler beim Abspeichern und Auslesen der Datei.  Und minimaler Energieverbrauch, wenn man die DNA-Schnipsel nach der Herstellung beispielsweise  in Siliziumkörner einbettet. In dem trockenen Mineral gibt es praktisch keinen Verschleiß des biologischen Materials.

          Machbar und wünschenswert ist die DNA-Speicherung also durchaus, das dürfte auch jenen einleuchten, die noch immer an die Zukunft der konventionellen Silizium- und Magnetspeicher glauben – und dafür Milliarden Dollar in die Weiterentwicklung investieren. Entscheidend für die Branche ist aber nicht die Machbarkeit, sondern die Antwort auf den zweiten Teil der Ausgangsfrage: Sind die biologischen Speicher auf effizient und kostengünstig  genug?  An dieser Stelle müssen Erlich und Zielinski Kreide fressen: 7000 Dollar allein für die Synthese der vergleichsweise mickrigen zwei Megabyte aus den Biobausteinen der DNA  und nochmal 2000 Dollar für das Auslesen der DNA-Schnipsel in der Sequenziermaschine sind Größenordnungen zu viel, um daraus ein Geschäftsmodell zu basteln. „Das ist noch eine echte Hürde“, räumen die zwei Forscher ein. Doch an den Kosten soll es nicht scheitern. Wenn statt der teuren, supergenauen chemischen Syntheseapparate, die heute verwendet werden, weniger genaue DNA-Maschinen und diese in großer Zahl eingesetzt würden, so die Hoffnung der Forscher, könnten die Kosten um Größenordnungen sinken – vielleicht nicht ganz so stark, wie sie  in der Genanalytik gesunken sind. Aber es könnte reichen, um die Langzeitspeicherung mit DNA attraktiv zu machen. Und was die Ungenauigkeit der DNA-Schreibgeräte angeht, so wären die Algorithmen des DNA-Fountain-Verfahrens effektiv genug, um die fehlerhaften DANN-Informationsschnipsel zuverlässig im Herstellungsprozess auszusortieren.

          Weitere Themen

          Das Beste kommt noch

          Alles im grünen Bereich : Das Beste kommt noch

          Sieben Jahre sind eine lange Zeit. Auch für eine Gartenkolumne. Ich mache nun Schluss damit. Dank an die Leser für Lob und Kritik, es war mir ein Vergnügen.

          Topmeldungen

          Newsletter

          Immer auf dem Laufenden Sie haben Post! Abonnieren Sie unsere FAZ.NET-Newsletter und wir liefern die wichtigsten Nachrichten direkt in Ihre Mailbox. Es ist ein Fehler aufgetreten. Bitte versuchen Sie es erneut.
          Vielen Dank für Ihr Interesse an den F.A.Z.-Newslettern. Sie erhalten in wenigen Minuten eine E-Mail, um Ihre Newsletterbestellung zu bestätigen.