Home
http://www.faz.net/-gyc-wzsp
HERAUSGEGEBEN VON WERNER D'INKA, BERTHOLD KOHLER, GÜNTHER NONNENMACHER, FRANK SCHIRRMACHER, HOLGER STELTZNER

Langzeitarchivierung Das digitale Daten-Desaster

 ·  Alles vergänglich und unzulänglich: Das wohl wichtigste Versprechen des Digitalzeitalters wurde gebrochen. Die Tücke digitaler Technik ist ihre begrenzte Haltbarkeit. Wie man dem Verlust seiner privaten Daten begegnen kann.

Artikel Bilder (1) Lesermeinungen (10)

Was man als Null und Eins besitzt, kann man eben nicht getrost nach Hause tragen: Das wohl wichtigste Versprechen des Digitalzeitalters wurde gebrochen. Stand am Anfang der Gedanke, dass Digitales aller Art durch seine entmaterialisierten binären Inhalte der herkömmlichen analogen Speichertechnik in jeder Hinsicht überlegen ist, stellt sich jetzt Ernüchterung ein. Bibliotheken, Archive, Unternehmen, Behörden, Medien und Universitäten müssen sich schon lange mit dem Problem auseinandersetzen, dass nicht einmal 30 Jahre alte digitale Informationen für immer verloren sind.

Sei es, dass die Datenträger nicht mehr lesbar sind, die erforderlichen Laufwerke fehlen oder sich die früher verwendeten Dateisysteme und Speicherformate heute nur mit immensem Aufwand erschließen. Die amerikanische Raumfahrtbehörde Nasa kann auf Tausende ihrer Magnetbänder von Weltraummissionen nicht mehr zugreifen. Archive von Zeitungen und Fernsehanstalten weisen große Lücken auf, die Beispiele sind Legion. Während der Historiker des 19. Jahrhunderts akribisch kleinste Änderungen, handschriftliche Zusätze oder Randbemerkungen an einem wichtigen Schriftstück en detail nachverfolgen kann, erstickt der Chronist dieses Jahrhunderts an Unmengen belanglosen Materials einerseits, und das wenige Wichtige andererseits ist im digitalen Nirwana untergegangen.

Die realistische Lebenserwartung der beliebten Speichermedien

Nun trifft das digitale Vergessen die privaten Haushalte. Wir haben unsere Bestände durchforstet und stießen auf selbstgebrannte Musik-CDs, gerade mal zehn Jahre alt, die sich nicht mehr abspielen ließen. Bei Spielfilmen, die wir mit einem DVD-Rekorder am Fernsehgerät aufgenommen haben, macht die eine oder andere Scheibe schon nach fünf Jahren schlapp. Lassen sich solche Verluste aus der Welt der Unterhaltung schnell verschmerzen, wiegt der Tod eines wichtigen Datenträgers mit Texten, Fotos oder E-Mails schwerer. Werben die großen Hersteller von CD- und DVD-Rohlingen mit einer Haltbarkeit zwischen 30 und 100 Jahren, liegt die realistische Lebenserwartung der beliebten Speichermedien bei zwei bis zehn Jahren, äußern die Fachleute aus Archiven und Bibliotheken, die sich in „Nestor“, dem „Kompetenz-Netzwerk Langzeitarchivierung“, zusammengeschlossen haben.

Während der größte Teil unseres Wissens und unserer Kultur digital erstellt und gespeichert wird und der Rückgriff auf das überlieferte Wissen vergangener Zeiten eine der wichtigsten Grundlagen von Kultur und Wissenschaft ist, gibt es bisher kein sicheres Verfahren der digitalen Langzeitspeicherung. Man kann mühelos ein 300 Jahre altes Buch lesen, aber nicht mehr das 30 Jahre alte elektronische Manuskript auf einer 8-Zoll-Diskette.

Der Datenträger Papier hält auch Hunderte von Jahren

Die Zugriffsmethoden auf das Buch haben sich in den vergangenen Jahrhunderten nicht grundlegend geändert: Es gibt ein einheitliches Kodiersystem (das Alphabet), das wir noch heute interpretieren können, und die einzelnen Seiten sind in ein Objekt (Buch) eingebunden, dessen Gestaltung auf bekannten Konventionen beruht. Die Seiten sind numeriert und in der Reihenfolge des Textes gebunden. Der Datenträger Papier ändert bei guter Lagerung seine Form auch nach Hunderten von Jahren nicht. Die einzelnen Informationselemente (Buchstaben) sind dauerhaft an einem festen Platz angebracht, es gibt auf der Außenseite des Buchs eine Bezeichnung des Inhalts, den Titel, um ein Buch schnell von anderen zu unterscheiden. Und schließlich ist ein Buch hinreichend stabil und transportabel.

Nicht nur, dass im Computerzeitalter alle diese Konventionen nicht gelten. Sondern jede Technik, die in den vergangenen 30 Jahren zunächst als sicher, fortschrittlich oder zukunftsträchtig galt, erwies sich als ebenso hinfällig und unzureichend wie die jeweilige Vorgängerin, und die Prognosen von Herstellern und Experten waren falsch. Und weiterhin: Die Tücke digitaler Daten liegt darin, dass sich der Gehalt digitaler Dokumente nicht auf das reduzieren lässt, was man ausdrucken oder sich am Bildschirm anzeigen lassen kann. Man denke an multimediale oder interaktive Inhalte.

Fortwährendes Umkopieren auf frische Datenträger

Die eingangs erwähnten Institutionen laborieren schon lange an diesem Problem, und derzeit scheint es nur einen Ausweg zu geben: Fortwährendes Umkopieren auf frische Datenträger, Mehrfachsicherungen und ständige Aktualisierung von Hard- und Software mitsamt Übertragung und Konvertierung der Datenbestände, um morgen auf die Inhalte von gestern zugreifen zu können. Die Schwierigkeiten sind vertrackt. Beispielsweise stellt die Migration auf ein neues Format nie ein exaktes Abbild der alten Daten her. Will man sich dieser aufwendigen und teuren Modernisierungsfalle entziehen, bleibt nur das Papierarchiv.

Im Folgenden konzentrieren wir uns auf die Frage, mit welchen Strategien der private Computernutzer seine persönliche Datenhaltung zukunftssicher gestalten kann. Das betrifft sowohl die Speichermedien als auch die Datenformate. Um mit Letzteren zu beginnen: Je offener ein Format ist, desto länger ist wahrscheinlich seine Verfügbarkeit. Vieles spricht dafür, dass der Wirrwarr aus den Anfangszeiten der Computertechnik allmählich ein Ende findet. Gab es früher ein buntes Nebeneinander unterschiedlicher Textprogramme und Tabellenrechner mit jeweils inkompatiblen Speicherformaten, fokussiert sich nun alles auf die aktuelle Microsoft-Office-Familie und Open Office. Zwar konkurrieren hier zwei unterschiedliche Standards miteinander, aber beide sind hinsichtlich ihrer Dateiformate von der Internationalen Organisation für Normung (ISO) anerkannt.

Die wichtigen Standards: Microsoft Office, Open Office und PDF

Die Informationen liegen nun nicht mehr binär und kodiert vor, sondern in XML (Extensible Markup Language) und können deshalb mit jedem Texteditor geöffnet werden. Das verspricht eine hohe Zukunftssicherheit. Man sollte auf eines dieser beiden transparenten Formate umsteigen. Sie sind robuster als binäre Formate und kommen zudem dank Komprimierung mit wesentlich geringeren Dateigrößen aus. Für Office 2003 gibt es von Microsoft gratis ein „Compatibility Pack“ zum Umstieg auf Office Open XML, und wer ganz alte Textdateien in ein aktuelles Format konvertieren will, sollte einen Blick auf Corels Word Perfect Office werfen.

Ein weiterer wichtiger Standard ist selbstverständlich PDF von Hersteller Adobe. Das „Portable Document Format“ ist quasi das elektronische Equivalent zum Papierdokument. Die PDF-Software Acrobat bindet sich wie ein Druckertreiber ins Betriebssystem ein und gibt das Originallayout von Seiten inklusive der Schriften, Formatierung, Graphiken, Fußnoten und Tabellen originalgetreu wieder. Acrobat wurde 1993 vorgestellt, das Leseprogramm ist kostenlos. Wer selbst PDF-Dokumente erzeugen möchte, findet neben dem teuren Original von Adobe eine Reihe günstiger anderer Angebote.

Auch in der Fotografie gibt es mehr gute als schlechte Nachrichten

Viele Programme wie etwa Open Office bieten einen direkten PDF-Export ohne Zusatzsoftware an. Das Dateiformat ist offengelegt und in der PDF/A-Variante zur Langzeitarchivierung von der ISO als Stand der Technik anerkannt. PDF-Dokumente lassen sich betriebssystemübergreifend lesen, schreiben und bearbeiten, mit einem Kennwortschutz versehen, und sie sind nicht ohne weiteres zu manipulieren. PDF als elektronischer Ausdruck empfiehlt sich immer dann, wenn etwas dokumentarisch so festgehalten werden soll, wie es derzeit ist. Viele Scanner setzen eine eigene PDF-Engine ein, man kann nachträglich eine Texterkennung (OCR) über das PDF laufen lassen, in der Datei nach Textstellen suchen oder Textteile kopieren.

Auch im Bereich der Fotografie gibt es mehr gute als schlechte Nachrichten. Das JPEG-Format der „Joint Photographic Experts Group“ ist zwar nicht das beste aller Bildformate, wohl aber der unumstrittene Standard. Für die Langzeitarchivierung gibt es keine Alternative, wenngleich anspruchsvolle Fotografen ihre Aufnahmen im Rohdatenformat Raw sichern. Dieses bietet eine höhere Bildqualität, mehr Flexibilität bei der Nachbearbeitung und einen größeren Dynamikumfang, benötigt aber ein Vielfaches an Speicherkapazität. Allerdings sind die unterschiedlichen Raw-Formate proprietär, nicht offengelegt und teilweise sogar verschlüsselt. Wer seine Bilder im Photoshop von Adobe bearbeitet, muss zudem mit jeder neuen Kamerageneration kostenpflichtig auf den gerade aktuellen Photoshop „updaten“. So wundert es kaum, dass eine Openraw-Initiative die Kamerahersteller auffordert, ihre Rohdatenformate offenzulegen und zu standardisieren.

Die Geschichte digitaler Musik und der falsche Standard

Weit von jedweder Standardisierung entfernt ist hingegen die E-Mail. Während im Büro meist mit Microsoft Outlook gearbeitet wird, das ebenso leistungsfähig wie kompliziert und in seinem Binärformat intransparent ist, gibt es für den PC daheim keine Lösung von der Stange. Zur Langzeitarchivierung raten wir kurz und knapp: Was wichtig ist, in eine PDF-Datei umwandeln und speichern. Der Acrobat macht es besonders leicht, ganze Ordner in einem Rutsch zu konvertieren. Wer Google vertraut, mag sämtliche Nachrichten in ein Googlemail-Postfach kopieren. Die derzeit unentgeltlich bereitgestellten 7 Gigabyte reichen für einige zehntausend E-Mails.

Schließlich Multimedia: Die Geschichte digitaler Musik liefert ein gutes Beispiel, was einem passieren kann, wenn man auf den falschen Standard setzt: Sony stellte zu Anfang der neunziger Jahre die Mini Disc mit dem Atrac-Kompressionsverfahren vor, und diese Technik wusste zu begeistern. Mit den kleinen portablen Geräten gelingen Aufnahmen in hervorragender Qualität, die auf einer wiederbeschreibbaren Mini-Diskette aufgezeichnet werden. Für alle Experten war klar: Das ist der Nachfolger der Compact-Kassette. Indes hatte die Mini Disc einen großen Nachteil: Die Aufzeichnungen ließen sich nicht digital auf den PC übertragen, und die Kopierschutzgängelung war haarsträubend. So setzte sich dann von der Mitte der neunziger Jahre an das MP3-Format des Fraunhofer-Instituts für Integrierte Schaltungen durch. Wie bei der Mini Disc wird das Musiksignal stark eingedampft, also verlustbehaftet komprimiert. Aber MP3 war von Anfang an ein offenes Format, und das war das Ende der Mini Disc.

Bei Videos fehlt bis jetzt ein klarer Favorit unter den Standards

Wer digitale Musik im Internet mit Kopierschutz oder digitaler Rechteminderung (DRM) kauft, kann sicher sein, dass sie in wenigen Jahren mit dem nächsten Computer oder tragbaren MP3-Spieler nicht mehr abspielbar ist, auch wenn Unternehmen mit Euphemismen wie „Plays for Sure“ (Microsoft) das Gegenteil behaupten. Musik mit DRM muss man also nicht archivieren. Man sollte darauf achten, nur DRM-freie Titel im MP3-Format zu kaufen und dieses Format beim Import eigener CDs einzustellen (etwa bei iTunes von Apple). Bei Videos fehlt bis jetzt ein klarer Favorit unter den Standards, und wer mal mit dem Handy, mal mit dem Kamkorder aufnimmt, kennt das Chaos unterschiedlicher und inkompatibler Formate. Nach unserer derzeitigen Einschätzung hat Mpeg 4 AVC/H.264 die besten Chancen für die Zukunft. Es ist die effizienteste und modernste Variante der großen Mpeg-4-Sippe, die mit knappen Datenraten auskommt und dennoch gute Bildqualität liefert.

Damit sind wir gleich bei der Frage nach dem passenden Speichermedium. Während vorbespielte Audio-CDs und Video-DVDs mit Glück durchaus 20, 30 Jahre oder länger halten, sind selbstgebrannte Scheiben in Verruf geraten. Selbst die großen Markenhersteller lassen nur noch in indischen oder südostasiatischen Billigfabriken fertigen, wie „c't“-Redakteur Hartmut Gieselmann sagt. Qualitätshersteller seien fast vollständig vom Markt verschwunden, und je billiger der Rohling, desto häufiger die Datenfehler. Ordentliche Medien bekomme man nur noch bei Spezialanbietern, die beispielsweise Krankenhäuser und Versicherungen belieferten. Davon abgesehen, ist Selbstgebranntes möglichst dunkel bei konstanter Temperatur aufzubewahren.

Eine regelmäßige Kontrolle des Filmbestands ist ratsam

Für den Fernseh- und Videofreund mit Sammlerambitionen gibt es zur DVD jedoch keine Alternative. Die Bluray-Scheibe für HDTV ist noch empfindlicher. Neben der Verwendung hochwertiger Rohlinge ist eine regelmäßige Kontrolle des Filmbestands ratsam. Manche beschädigte DVD lässt sich mit etwas Glück am PC auslesen und kopieren. Besonders wertvolle Schätze - etwa die Kamkorder-Aufnahmen von Familienfeiern - sollte man im DVD-Format auf Festplatte überspielen.

Überhaupt ist die Festplatte momentan das Speichermedium der Wahl für den privaten Computernutzer. 500 Gigabyte sind schon für weniger als 100 Euro im Angebot. Es spricht also nichts dagegen, neben der internen PC-Festplatte eine zweite oder dritte zur Datensicherung anzuschaffen. Besonders praktisch (und sehr schnell) ist der „Datenhafen“ von Aldi/Medion-PCs mit der e-Sata-Schnittstelle. Hier kann man das externe Laufwerk ohne Kabelwirrwarr oder Netzteil mit einem Handgriff einsetzen. 500 Gigabyte sind allemal ausreichend für das Zehn-Jahres-Archiv eines fleißigen Amateurfotografen, und mit eigenen Texten oder E-Mails wird man eine solche Platte vermutlich nie füllen. Auch wenn die Festplatte nur drei bis fünf Jahre hält, bietet sie momentan das beste Preis-Leistungs-Verhältnis und ausgereifte Technik für die Langzeitarchivierung, die wöchentlich oder monatlich weitgehend automatisch erfolgen kann, wenn man eine logische Struktur in die zu sichernden Ordner und Laufwerke bringt. Unter „eigene Dateien“ alles Private abzulegen, wie Windows es vorschlägt, ist gewiss keine gute Lösung. Besser räumt man eine Partition der Festplatte für seine Daten frei und kopiert dann alles in einem Rutsch.

Methoden der Langzeitarchivierung

Bei der Migration (Konversion) wird das Archivgut von einer alten Generation der Computertechnik (Hard- und/oder Software) auf die aktuelle Generation umgestellt, wobei Schwierigkeiten der Kompatibilität, Interoperabilität und der Verfälschung des Ausgangsmaterials aufgeworfen sind, wenn beispielsweise das neue Format Eigenschaften des alten nicht enthält. Es ist nicht für alle Formate eine funktional identische Konversion möglich.

Beim Umkopieren, etwa von Tonbändern auf CDs, steht die Substanzerhaltung im Vordergrund. Beim „Refreshing“ von digitalen Medien verfolgt man das Ziel, dass die einzelnen Bits „frisch, wie neu“ auf den Datenträger gelangen, wodurch sich ihre Haltbarkeit verlängern soll. Umkopieren setzt allerdings voraus, dass auch in Zukunft geeignete Hard- und Software vorhanden ist, um die Medien zu lesen.

Bei der Emulation werden Archivinhalte für virtuelle Rechner oder virtuelle Umgebungen aufbereitet. So bleiben die ursprünglichen Daten unverändert, allerdings müssen fundierte Kenntnisse über alte Hard- und Software vorhanden sein.

  Weitersagen Kommentieren Merken Drucken
Weitersagen

Jahrgang 1964, Redakteur im Ressort „Technik und Motor“.

Jüngste Beiträge

Es werde Licht

Von Georg Küffner

Die optimale „Reiseausrüstung“ zu finden, braucht Zeit und Erfahrung. Geschäftsreisende und Vielfachurlauber kennen sich damit bestens aus. Mehr