16.08.2011 · Teilchenbeschleuniger und mehr: Dafür steht das Cern. Durch Forschungsprogramme, die sich mit der Reduzierung riesiger Datenmengen beschäftigen, wird die in Genf entwickelte Software allerdings auch für jeden PC und Internet-Nutzer bedeutsam.
Von Peter WelcheringDie Programmierer am europäischen Kernforschungszentrum Cern in Genf interessieren sich in erster Linie für Urknall-Simulationen. Deshalb entwickeln sie Algorithmen für die Steuerung des größten Teilchenbeschleunigers und schreiben Software für die Analyse von zwei Protonenstrahlen, die aufeinanderstoßen. Aber die hier in der Grundlagenforschung entwickelte Software hat den Alltag vieler Menschen nachhaltiger verändert als andere PC-Trends.
„Wir machen hier doch nur Grundlagenforschung.“ Das hört sich fast entschuldigend an, als uns Jean-Michel Jouanigot, der Direktor des Cern-Datenzentrums, begrüßt. Mitunter hat man das Gefühl, als seien die äußerst erfolgreichen Softwareanwendungen, die hier entwickelt wurden, den Wissenschaftlern etwas peinlich. Tim Berners-Lee zum Beispiel entwarf vor 20 Jahren eine Verwaltungssoftware und Dokumentenbeschreibungssprache, um Forschungsdokumente einfacher austauschen zu können. Daraus entstand das World Wide Web. Eher verhalten gesteht man diese Konsequenzen der Entwicklungsarbeit von Berners-Lee am Cern ein, um sogleich gegenzuhalten: „Aber eigentlich wollte er nur die Arbeit mit den Forschungsdokumenten verbessern.“
Im Openlab I genannten Forschungsrechenzentrum programmierte man Netzwerkmanagement-Werkzeuge zur effizienten Verteilung der riesigen Datenflut, die bei jeder Urknallsimulation im Teilchenbeschleuniger anfällt. In einem solchen Experiment wird pro Sekunde ein Petabyte Daten erzeugt, das sind eine Billiarde Bytes - die Datenmenge eines Videos von 40 Jahren Länge. Diese Daten müssen schnell und fehlertolerant auf mehr als 140 Rechenzentren in aller Welt verteilt und nach der Auswertung zurückgeschickt werden. Ohne die in Genf entwickelten Netzwerk-Tools könnten heutige Internet-Knotenrechner die enormen Datenmengen im WWW nicht mehr bewältigen.
Die Bilder der Antimaterie gingen um die ganze Welt
Bis zum Frühjahr 2012 läuft das Forschungsprogramm Openlab III. Hier geht es nicht mehr um die Verteilung riesiger Datenmengen, sondern um deren Reduzierung. Die Teilchenphysiker haben Computerprogramme für die Visualisierung und Bildbearbeitung entwickelt, mit denen sie das Aufeinanderprallen zweier Teilchen quasi „fotografieren“ und danach auswerten können. Daraus entstehen demnächst medizinische Analyseprogramme für die Kernspintomographie. Auch Auswertungsalgorithmen für satellitengestützte Tsunami-Warnsysteme sind bereits in Arbeit. Erstmals eingesetzt wurde ein solcher Prototyp bei der Flut in Pakistan im Jahr 2010. Dadurch konnten Evakuierungsmaßnahmen früher eingeleitet werden.
Grundlage für solche Softwarepakete sind Auswertungsalgorithmen, mit denen beispielsweise 300 Atome Antiwasserstoff analysiert wurden, die von den Physikern in einem Magneten für mehrere Minuten isoliert worden waren. Die Bilder von der gewonnenen Antimaterie gingen um die ganze Welt. Entstanden sind sie im „Large Hadron Collider“ genannten Teilchenbeschleuniger. Eigens für dieses Experiment gefertigte Detektoren, Analysesoftware und Visualisierungswerkzeuge sind für die atemraubenden Fotos verantwortlich. „Sie können sich solch einen Detektor als riesige Digitalkamera vorstellen“, erläutert der belgische Physiker François Briard. Der bei diesem Experiment verwendete Atlas-Detektor hat 100 Millionen Sensorpunkte. Das entspräche einer Digitalkamera mit einer Auflösung von 100 Megapixeln. Dabei schafft diese „Kamera“ zudem 600 Bilder in der Sekunde.
„Diese reduzierten Daten haben es in sich“
„Mit unseren Visualisierungswerkzeugen werden diese Aufnahmen zu dreidimensionalen Bildern berechnet“, schildert Briard: „Entscheidend sind dann aber nur die Bilder von der eigentlichen Kollision der Teilchen.“ Und die müssen durch eigens entwickelte Algorithmen herausgesucht werden. „Das ist so eine Art Data-Mining der besonderen Art“, sagt der Computerexperte Bill Johnson, der für Hewlett-Packard im Cern-Openlab-Board sitzt. „IT-Infrastruktur für diese Art von Grundlagenforschung zu entwickeln führt zu einem regelrechten Innovationsfeuerwerk, davon profitieren alle“, sagt Johnson. Deshalb sieht er auch kein Problem darin, am Cern mit Vertretern konkurrierender Unternehmen zusammenzuarbeiten. Man lerne so viel für die Entwicklung neuer Produkte, dass der Gedanke der Konkurrenz unwichtig werde.
Das ist auch beim Data-Mining für den Urknall der Fall gewesen. Die Daten dieser Experimente werden 100 Meter unter der Erde eingesammelt. Dort liegt nämlich der runde Tunnel des Teilchenbeschleunigers, der 27 Kilometer lang ist. Kommt es hier zu einer Kollision von hochbeschleunigten Teilchen, entstehen enorme Datenmengen, die teilweise direkt Van Ort und Stelle reduziert werden müssen.
„Das machen in einem ersten Schritt einige tausend Prozessoren im Teilchenbeschleuniger, mit deren Hilfe alle irrelevanten Informationen in Bezug auf die Teilchen entfernt werden“, sagt Jean-Michel Jouanigot. Auf diese Weise wird aus einem Petabyte je Sekunde ein Gigabyte. Je nach Länge des Experiments kommen aber immer noch erhebliche Datenmengen zusammen, die im Rechenzentrum in einer langen Kette von Bearbeitungsprozessen weiter reduziert werden. Dafür haben die Entwickler des Openlab III Filtersysteme und Algorithmen für die Mustererkennung so geschickt miteinander verknüpft, dass letztlich aus 20 Billiarden Bytes nur noch ein oder zwei Milliarden Bytes übrig bleiben. „Diese reduzierten Daten haben es aber in sich“, meint François Briard. Denn in ihnen sind die Ergebnisse des Experiments gewissermaßen komprimiert.
Jährlich werden 7000 Hardwareeinheiten ausgetauscht
Die Reduzierung und Komprimierung setzt eine Rechenkapazität voraus, die am Cern nicht vorgehalten werden kann. „In Genf verarbeiten wir nur 20 Prozent der Daten eines Experiments, 80 Prozent werden im weltweiten Grid verarbeitet“, so Jean-Michel Jouanigot. Über das WWW werden mit der in ihrer Leistungsfähigkeit wohl bisher einzigartigen Datengrid-Anwendung die im Experiment gewonnenen und im Teilchenbeschleuniger grob reduzierten Daten auf bis zu 200 Auswertungsrechenzentren verteilt. Die Ergebnisse werden wieder nach Genf überspielt und dort dauerhaft mit den anderen Experimentaldaten archiviert. Allein dafür halten Jean-Michel Jouanigot und seine Mitarbeiter Bandspeicher mit einer Kapazität von 34.000 Terabyte und Plattenlaufwerke mit rund 45.000 Terabyte vor. Hinzu kommen noch weitere 50.000 Speichermodule.
Gegenwärtig bereiten die Physiker und Computerexperten am Cern die nächste Generation ihres Forschungsrechenzentrums vor. Openlab IV geht im Frühjahr an den Start und beschäftigt sich mit drahtlosen Netzwerk-Infrastrukturen. Viel Wind ist dabei. Das Kürzel „Wind“ steht für „Wireless Network Deployment“, also drahtlose Netzwerk-Infrastrukturen. Dadurch sollen nicht nur neue Drahtlos-Anwendungen möglich werden, sondern auch die erheblichen Wartungs- und Reparaturarbeiten reduziert werden.
Denn in jedem Jahr werden am Cern 7000 Hardwareeinheiten ausgetauscht. Das zieht einen enormen Verkabelungsaufwand nach sich. An den Speichereinheiten ereignen sich jedes Jahr ungefähr 1000 Fehleralarme. Durch das Frühwarnsystem sind zwar bislang Datenverluste und Systemausfälle vermieden worden. Aber auch hier ist der Aufwand auf der rein physischen Netzebene enorm. Eine intelligente Drahtlos-Infrastruktur soll für Verbesserungen sorgen. Im Teilchenbeschleuniger wird für die Datenkommunikation der Feldbus verwendet. Dieses robuste System hat sich auch in der Industrie durchgesetzt. Nun erwarten Netzwerkexperten mit Spannung, welche Ergebnisse Openlab IV bei der Drahtlos-Infrastruktur bringt.