Home
http://www.faz.net/-gqz-70ql7
HERAUSGEGEBEN VON WERNER D'INKA, BERTHOLD KOHLER, GÜNTHER NONNENMACHER, FRANK SCHIRRMACHER, HOLGER STELTZNER

Archivierung des Internets Am Boulevard der toten Links

 ·  Wie speichert man das Internet? Und was ist überliefernswert? Archivierungsprojekte tasten sich langsam durch den Nebel. Das Archiv des deutschen Netzes ist nur vor Ort zu besichtigen.

Artikel Bilder (1) Lesermeinungen (3)
© Röth, Frank Ortstermin Internet: in der Frankfurter Nationalbibliothek soll das Archiv des deutschen Netzes seinen festen Zugangsort haben

Das Internet archivieren? Warum nicht gleich die Milchstraße in Geschenkpapier packen? Hatte die Gutenberg-Welt ihre festen Rhythmen, so ist das Digitale eine Kultur permanenten Überschreibens, die jeden archivarischen Schnitt zufällig oder unmöglich macht. Der Wikipedia-Artikel zum Irak-Krieg hat mehrere tausend Versionen und wird vielleicht gerade wieder überarbeitet. Soll man ihn um 12 oder um 15 Uhr, am Mittwoch oder am Freitag speichern, im Februar oder im April?

Die Frage, was vom Netz bleiben soll, beantwortete bisher der neue Universalismus der Netzkultur, der sich aus einem positivistischen Aufklärungsverständnis, dem quantitativen Denken der Informatik und den schieren Rechenkapazitäten fast wie von selbst ergibt. Wissen heißt hier anhäufen. Man speichert zunächst einmal, was die Technik hergibt. Weil sie die Aufzeichnung des Lebens bis in den Pulsschlag beim Joggen erlaubt und die Digitalkultur dem Augenblick so wenig traut, dass sie an seinem Abbild wie an einer Droge klebt, ist das sehr viel. Würden viele ihre digitalen Archive komplett anschauen, hätten sie die nächsten Jahrzehnte nichts anderes zu tun. Die Gegenwartserfahrung droht so in einem Dokumentarismus des jüngst Vergangenen zu versinken oder auf eine Zukunft verschoben zu werden, die nie stattfinden wird.

Künftige Historiker werden vor einem Meer von Quellen stehen, aber auch vor gewaltigen Lücken. Man spricht mit Blick auf die ersten digitalen Jahrzehnte vom digital dark age. Abspielgeräte veralten und werden ausgetauscht, Daten gehen verloren. Während sich die Gesamtmenge von Jahr zu Jahr verdoppelt, laufen die Projekte zur Langzeitarchivierung erst langsam an. Vieles wird nicht mehr gedruckt, aber auch noch nicht gespeichert. Welches Speichermedium nimmt sich etwa der Hyperfiction an, einer Form kollaborativer Literatur im Internet, die sich über verschiedene Datenträger ausbreiten kann? Was ist mit den virtuellen Kunstobjekten, deren Exitus Kunsthistoriker beklagen, weil niemand sich um ihre Speicherung kümmert? Nicht jeder Chat wird fehlen. Oft korrigiert der Schwund auch einen Speicherfetisch.

Das Archiv als Schnappschuss

Es gibt in Deutschland einen Adressaten für diesen Totalitätswahn: die Deutsche Nationalbibliothek in Frankfurt. Der Kultusminister erteilte ihr vor sechs Jahren den Sammelauftrag für elektronische Publikationen. Seither zerbricht man sich in Frankfurt den Kopf über die Frage, wie die fließende Architektur des Netzes sinnvoll zum Stocken zu bringen ist. Die holistische Vorgabe war noch ganz nach den Bedingungen der Buchkultur gedacht. Was mehr als vier Seiten und 25 Exemplare zählt, nahm automatisch seinen Weg ins Archiv. Bei den elektronischen Medien heißt Speicherung dagegen auch Kanonisierung. Die Bestände wachsen exponentiell, redaktionelle Filter fallen weg. Man sollte meinen, an der Nationalbibliothek brüteten vielköpfige Expertenkomitees von früh bis spät über Selektionskriterien. Tatsächlich ist es der Nebenjob eines kleinen Teams von Bibliothekaren. An ein Expertengremium, wie es die British Library eingerichtet hat, ist jetzt noch nicht zu denken.

Man hat in Frankfurt schnell den Universalanspruch beiseitegelegt und sich auf eine Strategie der kleinen Schritte besonnen. Man ging die gewohnten Wege, begann mit Einzelpublikationen, die man sich bei den Verlagen, Universitäten und Fachgesellschaften abholte. Man könnte auch sagen: bei den Instanzen der Buchdruckwelt. Bald sollen Suchroboter neue Publikationen automatisch abgrasen, ein Warmlaufen für die nächste Stufe, die in diesem Sommer endlich gezündet werden soll: die Archivierung dynamischer Websites, die sich nur mit Robotern bewältigen lassen wird. In Testläufen durchforstete ein Algorithmus schon einmal alle Seiten, die auf .de enden. Das deutsche Netz ist damit längst noch nicht im Blick.

Man wird, das weiß man in Frankfurt, dem Internet immer nur hinterherlaufen. Einen großflächigen Angriff mit Suchrobotern schließt man für die Zukunft nicht aus, hat sich aber auch hier zunächst für einen begrenzten, qualitativen Ansatz entschieden. Seiten von Behörden und Verbänden sollen den Anfang machen, alles, was gut greifbar ist. Es ist, als würde man von den Büchern nur die handlichsten oder das Weltkulturerbe nach der Autobahnnähe auswählen. An die ozeanischen Volumen der Großdatenforschung denkt man noch gar nicht. Und es gibt viele Grauzonen: Wie steht es mit Akten, mit Software, mit virtuellen Museumsrundgängen? Von Katzenbildern und Intimbekenntnissen sollen künftige Generationen jedenfalls nichts erfahren, keine sozialen Netzwerke, Blogs, Chatrooms, die in ihrer fluktuierenden Struktur ohnehin schwer fassbar sind. Auch gewerbliche Seiten oder dynamische Datenbanken wie Wikipedia bleiben ausgeklammert. Privatseiten nur, wenn es sich um Personen des öffentlichen Lebens handelt.

Aussichtsloser Holismus

Auch die Online-Ausgaben von Zeitungen sind nach den Worten der Bibliotheksleiterin Ute Schwens bald an der Reihe. Man hat es dann mit Objekten zu tun, die sich am Tag rund 100.000 Mal ändern. Der einzelne Artikel mag in seinen vielen Versionen noch rekonstruierbar sein, in seiner Wanderschaft über Rubriken und Kanäle und seinen wechselnden Kontextbedeutungen wird man ihm nicht mehr folgen können. Eine einigermaßen repräsentative Speicherung in sinnvollen Intervallen ist zwar vorstellbar, bedeutet aber immensen Aufwand.

Das Aussichtslose einer Gesamtspeicherung lässt sich am Beispiel des amerikanischen Internetspiegels Archive.org eindrucksvoll studieren. Seit 1996 macht die sogenannte Wayback Machine in regelmäßigen Abständen Schnappschüsse sämtlicher Websites. Die Schnitte wirken beliebig, die blinden Flecken dominieren. In manchen Monaten werden Nachrichtenseiten mehr als einhundertmal, in anderen kein einziges Mal gespiegelt. Oft haben sich die Seiten schon geändert, wenn der Roboter seinen Durchlauf beendet hat. Andere Seiten werden auf Bitte ihrer Besitzer gar nicht archiviert, das gesamte Deep Web bleibt außen vor.

Selektion ohne Kriterien

Das Marbacher Literaturarchiv hat sich einen bescheideneren Auftrag gesetzt. Auf der Seite Literatur-im-Netz.de lichtet es in vierteljährlichen Schnappschüssen gut 150 literarische Blogs und Zeitschriften ab. Man konzentriert sich auf einen Gegenkanon experimenteller Literatur, der das Medium in seiner hypertextuellen Struktur spiegelt, während Literatur, die ohne inhaltlichen Reflex den Medienwechsel vollzog, ausgeblendet bleibt. Das Archiv ist ein Torso mit undurchsichtigen Kriterien. Auf die Weddinger Browserboys oder Henrikes Tagebuch könnte die Nachwelt zur Not verzichten. Warum Joachim Lottmann und Bazon Brock mit ihren Blogs arrivieren, während Rainald Goetz draußen bleibt: auch das ein Rätsel. Erst recht mit den für würdig befundenen „kulinärrischen Versen“ des oberfränkischen Bloggers Ramsenthaler im Ohr: „Die Bratwurst ist, man glaubt es kaum, des Oberfrankens schönster Traum.“ Ist ja nur Internet.

Auch in Marbach überlagern die technischen die ästhetischen Probleme. Wie geht man mit Websites um, die nur in Apple-Formaten erscheinen? Wie mit dem Kopierschutz bei E-Books, wie mit Passwörtern und wechselnden Erscheinungsweisen der Objekte? Wie beweist man ihre Authentizität? E-Books etwa sind Dateien, die meistens auf den Servern der Verlage lagern. Besitz heißt nur Zugriffsrecht. E-Books mit restriktivem Kopierschutz sind im Grunde nicht archivierbar oder müssten mit den Verlagen einzeln verhandelt werden. Das entsprechende Budget gibt es in Marbach nicht. Bald wird der Nachlass des Medienhistorikers Friedrich Kittler auf der Schillerhöhe ankommen, nicht nur ein Bündel von Papieren und Büchern, sondern auch ein Konglomerat von Programmen.

In Frankfurt hat man Rechner von Atari und Commodore nachgebaut, um die Dateien der ersten Computergeneration abzulesen. Migrationsverfahren heben die Dateien von einer Speicherversion auf die nächste. Das elektronische Archiv muss mit dem ständigen Wechsel der Dateiformate, der Software und Hardware rechnen. Wie öffnet man eine Floppy Disc auf einem heutigen Computer? Wie überlistet man Kopierschutzmechanismen? Digitales Archivieren heißt permanente Wartung eines Geräteparks.

Reterritorialisierung des Netzes

Im Zuge der Urheberrechtsdebatte ist klargeworden, dass vor dem Traum von der universalen Bibliothek Milliarden von Rechteanfragen stehen. Anders als die großen Weltbibliotheksprojekte hat die Nationalbibliothek nur in zweiter Linie mit ihnen zu tun. Der gesetzliche Auftrag erlaubt ihr das automatische Speichern, solange der Zugang auf die Bibliotheksräume begrenzt bleibt. Dem deterritorialisierten Medium werden gewissermaßen die Flügel gestutzt.

Manche Seiten dürfen aus persönlichkeitsrechtlichen Gründen nur mit behördlicher Erlaubnis eingesehen werden. Schwierig auch die Frage, wie die Hypertextstruktur des Netzes archiviert werden soll. Im fragmentarischen Netzarchiv führen viele Links in Sackgassen. In Frankfurt arbeitet man an stabilen Links. Im Notfall bleibt zur Ansicht nur der Weg in die Lesesäle der Bibliothek. Dann sieht man mal wieder etwas von der Landschaft. „Im Sinne des Netzes“ ist es natürlich nicht.

  Weitersagen Kommentieren Merken Drucken
Weitersagen

Jahrgang 1975, Redakteur im Feuilleton.

Jüngste Beiträge