https://www.faz.net/-gy9-8i56z

Spurensuche im Internet : So fahndet der Geheimdienst NSA nach Programmierern

  • -Aktualisiert am

Die Zentrale der National Security Agency (NSA) in Fort Meade im amerikanischen Bundesstaat Maryland. Bild: dpa

Wer hat es geschrieben? Die amerikanische National Security Agency (NSA) betreibt Spurensuche in Text und Code und will damit anonymen Programmierern auf die Schliche kommen – kein einfaches Vorhaben.

          4 Min.

          Programmieren lässt sich erlernen wie Sprachen. Deshalb kann man Software-Entwickler an ihrem Programmierstil genauso gut erkennen wie Romanautoren an ihrem Schreibstil. Die Computerlinguisten haben sich bei der Entwicklung der „stilometrischen“ Analysen zur Identifizierung von Programmierern bei den Literaturwissenschaftlern bedient. Die haben nämlich mit einer Software für die Mustererkennung und Algorithmen maschinellen Lernens zum Beispiel herausgefunden, dass Joanne K. Rowling die Autorin des Romans „Der Ruf des Kuckucks“ ist. Auf dem Buchdeckel steht zwar der Name Robert Galbraith. Es gab aber sofort nach dem Erscheinen des Romans Gerüchte, dass ein ganz anderer Autor als der bis dato unbekannte Galbraith den Roman geschrieben habe.

          Eine Gruppe junger Literaturwissenschaftler hatte daraufhin den Schreibstil des Romans und die Textstruktur analysiert. Sie fanden große Ähnlichkeiten zu den Harry-Potter-Romanen. Und tatsächlich stellte sich heraus, dass Frau Rowling ein neues Pseudonym gewählt hatte. „Autoren können identifiziert werden, indem die Struktur ihres Textes und ihre individuellen Ausdrucksformen mathematisch analysiert werden“, sagt Aylin Caliska-Islam von der Princeton University, die sich seit ihrer Dissertation mit der Frage beschäftigt, wie Software-Entwickler mit ihrem Programmierstil identifiziert werden können.

          Programmtext statt Literaturwerk

          Dafür ist mittlerweile eigene Analyse-Software entwickelt worden. Sie wird mit besonderen Stil-Beispielen trainiert. Bisher unbekannte Texte werden so auf Ähnlichkeiten zu Schreibstilen bekannter Autoren analysiert. Wie ein Romanautor seinen Text in deutscher oder englischer Sprache schreibt, verfasst ein Software-Entwickler seinen Programmtext in C++, Java oder PHP.

          „Weil wir wissen, dass Programmieren genauso gelernt wird wie Sprachen, können wir die stilometrischen Methoden zur Identifizierung eines Autors nutzen, um herauszufinden, wer ein bestimmtes Programm geschrieben hat“, berichtet Caliska-Islam. Die Art, Klammern zu setzen, Variablennamen zu vergeben, Leerzeichen einzufügen und die Struktur, die ein Programm-Quelltext aufweist, geben den einzigartigen Stil eines Programmierers wieder. Allerdings kann der Programmierer nur dann identifiziert werden, wenn schon bekannte Programme von ihm vorliegen - bei Autoren ist das nicht anders.

          Millionenbeträge für die Aufstockung der Datenbank

          Die Verantwortlichen des technischen Geheimdienstes der Vereinigten Staaten, der National Security Agency (NSA), nehmen deshalb viel Geld in die Hand, um flächendeckend Arbeitsproben von Programmierern in ihrer Stilometrie-Datenbank zu erfassen. Die Rede ist von einem zweistelligen Millionenbetrag. So will die NSA noch stärker als bisher Programmierwettbewerbe an Colleges und Universitäten finanzieren, deren Ergebnisse sie verwerten darf. Die Software-Experten aus Fort Meade veranstalten sogar eigene Sommerschulen fürs Programmieren, mit denen sie vor allen Dingen junge Informatiker ansprechen wollen. Mit Barcamps, die im Umfeld von Hackerveranstaltungen wie der Black Hat Conference veranstaltet werden, wollen die NSA-Verantwortlichen Quelltexte von bisher unbekannten Hackern für ihre Datenbank ergattern.

          Weitere Themen

          VW Passat Variant Video-Seite öffnen

          F.A.Z.-Fahrbericht : VW Passat Variant

          Der Passat ist ein VW-Klassiker wie der Golf. Die achte Generation fährt ausgereift und fast schon alleine. Im Spitzenmodell ist uns aber der Verbrauch zu hoch.

          Der andere Bibliothekar

          Hans Magnus Enzensberger : Der andere Bibliothekar

          „Wir drucken nur Bücher, die wir selber lesen möchten“ – so kündigten Hans Magnus Enzensberger und der Verleger Franz Greno 1985 die „Andere Bibliothek“ an. Eine Würdigung des Feuilletons zum 90. Geburtstag ihres einstmaligen Herausgebers.

          Topmeldungen

          Seit September 2017 gilt das WLTP, ein weltweit harmonisiertes Prüfprogramm. Hier eine Abgasprüfung beim TÜV Rheinland.

          Das Grenzwert-Drama : 95 Gramm

          Von 2020 an dürfen Neufahrzeuge in Europa im Schnitt nur noch vier Liter Benzin oder dreieinhalb Liter Diesel verbrauchen. Wie es zu einem Grenzwert kam, der die Grenzen der Physik sprengt.
          Motorrad-Taxi in der Hauptstadt Yaounde

          Bevölkerungswachstum in Afrika : Kinder als Altersvorsorge

          Kamerun gilt als „Afrika im Kleinen“. Dort lässt sich beobachten, weshalb die Bevölkerung des Kontinents so schnell wächst. Der Gefahren dieser Entwicklung ist sich kaum jemand bewusst.

          Newsletter

          Immer auf dem Laufenden Sie haben Post! Abonnieren Sie unsere FAZ.NET-Newsletter und wir liefern die wichtigsten Nachrichten direkt in Ihre Mailbox. Es ist ein Fehler aufgetreten. Bitte versuchen Sie es erneut.
          Vielen Dank für Ihr Interesse an den F.A.Z.-Newslettern. Sie erhalten in wenigen Minuten eine E-Mail, um Ihre Newsletterbestellung zu bestätigen.