Digital Humanities (6/6) : Wie die Nomaden in Athen entdeckt wurden
- -Aktualisiert am
Mauerdetail mit dem niedergeschriebenen Stadtrecht von Gorty Bild: Picture-Alliance
Was ist dem seltenen Nebeneinander zweier Wörter zu entnehmen? Ein Projekt der Universität Leipzig untersucht, wohin methodische Zufallsfunde in der Altertumskunde führen.
Optimistische Selbstgewissheit und skeptische Zurückhaltung – zwischen diesen Gegensätzen bewegen sich viele Geisteswissenschaftler, wenn es um die Haltung zu den Digital Humanities geht. Im Bereich der Textwissenschaften hat Franco Moretti mit dem Gegensatzpaar von Distant reading und Close reading umrissen, wie man aus der schieren Menge von Daten durch algorithmenbasierte Auswertung mit den Methoden etwa des Textmining, des Clustering oder des Topic Modeling neue Zusammenhänge aus sehr großen Text- und Datenmengen erkennen kann. Dabei drängt sich aber die Frage auf: Wie genau verhält sich dieser Ansatz zum Close reading, wie es sich in der traditionellen, historisch-philologischen Textanalyse etabliert hat?
Für die textorientiert arbeitenden Altertumswissenschaften ist diese Frage aufgrund ihrer besonders komplexen Überlieferungssituation höchst relevant. Einerseits hat man in den Altertumswissenschaften bereits in den achtziger Jahren des vergangenen Jahrhunderts mit der Digitalisierung von Textkorpora begonnen, so dass heute die erhaltene Literatur der Antike in einer Vollständigkeit digitalisiert vorliegt, die ihresgleichen sucht. Andererseits weist die Überlieferungsgeschichte der Texte selbst viele Zwischenstufen auf und ist geprägt von sehr unterschiedlichen Editionspraktiken. Dass gerade diese komplexe Struktur ein weites Feld von Anwendungsmöglichkeiten für die Methoden des Information Retrieval bietet, soll hier an einem Beispiel illustriert werden.
Ein einziges Mal in der gesamten griechischen Literatur
Im Rahmen verschiedener Projekte aus der BMBF- und DFG-Förderung haben wir an der Universität Leipzig in der Zusammenarbeit von Altertumswissenschaftlern und Informatikern Methoden aus dem Textmining zur Anwendung für unsere digitale Textanalyse adaptiert. Ein methodisch besonders interessanter Weg hat sich aus der Kookkurrenzsuche ergeben. Kookkurrenzen, ganz allgemein: das gemeinsame Auftreten etwa zweier Wörter innerhalb eines Satzes oder Abschnittes, können auch semantische Zusammenhänge anzeigen. Interessant sind jene Kookkurrenzen, die weder offensichtlich und geläufig sind noch durch herkömmliche Suchstrategien erkannt werden können, wie sie sich aus der Verwendung von Lexika, Nachschlagewerken, Konkordanzen, Indizes, Suchprogrammen mit einfacher oder Boolescher Wortsuche entwickelt haben.
Kookkurrenzen, die im gesamten Textkorpus der antiken griechischen Literatur lediglich ein- bis dreimal auftreten, sind, wenn sie nicht gerade in den Werken der sehr bekannten, das heißt vielgelesenen Autoren enthalten sind, nur durch den Zufall zu finden. Das Phänomen des „glücklichen Zufalls“, das heißt in diesem Fall einer wissenschaftlichen Entdeckung, die unbeabsichtigt gelingt, weil ursprünglich etwas ganz anderes gesucht wurde, ist wissenschaftshistorisch von Robert Merton als „serendipity“ wiederentdeckt worden. Darunter ist die Entdeckung eines meist nicht beabsichtigten Ergebnisses zu verstehen. Demgegenüber basiert das geläufige Verständnis etwa der explorativ vorgehenden Suche auf einer analytisch definierten Suchstrategie.