„Ordnung ist der Schlüssel zur besseren Suche“, sagt Ralf Schweiger, Leiter der Arbeitsgruppe „XML-Anwendungen“ am Institut für Medizinische Informatik der Uni Gießen. Wer sein vorbildlich aufgeräumtes Arbeitszimmer betritt, glaubt ihm sofort.
Mit der gleichen Systematik widmet sich Schweiger der Suche im 'World Wide Web‘. Die beliebteste Suchmaschine, Google, liefert oft einen Wust von Informationen, die zu sichten Stunden, wenn nicht gar Tage dauern würde. „Der Laie, der allgemeine Informationen sucht, findet vielleicht etwas Ansprechendes unter den ersten zehn Treffern. Der Experte aber, der mehr als nur einen Lexikoneintrag sucht, muß sich lange durchwühlen, der Erfolg ist ungewiß“, beschreibt Schweiger das Dilemma.
XML als Lesehilfe für Computer
Auf der Website der 'Giessener Elektronischen Bibliothek‘ (http://geb.uni-giessen.de/geb/) bekommt er schneller, was er sucht: Geordnete Informationen in einem definierten Suchraum. Denn hier sucht LuMriX, eine „intelligente Suchmaschine“. Das sechsköpfige Forscherteam der Arbeitsgruppe XML hat sie entwickelt, um dem Web-weiten Chaos ein Ende zu setzen. Der Name setzt sich aus den Internetstandards XML und URI (Uniform Resource Identifier) zusammen. XML bedeutet eXtensible Markup Language und ist der Schlüssel zu mehr Ordnung und somit zum Erfolg, weil die „Kennungssprache“, so die Übersetzung, „erweiterbar“ ist. Die Autoren können maßgeschneiderte „Tags“ erfinden, wie
Computer können zwar riesige Texte in Bruchteilen von Sekunden nach Worten durchsuchen. Die Bedeutung der Zeichenfolgen aber können sie nicht erfassen. XML erschließt somit neue Möglichkeiten der Textauswertung und ergänzt etablierte Datenbank- und Dokumentationssysteme. LuMriX nutzt die Struktur von XML-Dokumenten und bietet deshalb einen Vorteil gegenüber Suchmaschinen wie 'Google‘ oder 'Yahoo‘, die hauptsächlich in HTML-Seiten suchen. Im Unterschied zu XML sind in HTML (Hyper Text Markup Language) die Kennungen fest vorgegeben und dienen vor allem der Anzeige im Web-Browser, wie das Beispiel Herzinfarkt (b: bold, also Fettdruck) deutlich macht.
Die Suchmaschine denkt mit
XML ist seit 1998 standardisiert und somit im 'World Wide Web‘ nichts Neues. „Es gibt bislang aber keine allgemeinen Suchverfahren, die das Ordnungspotential von XML ausschöpfen“, sagt Ralf Schweiger. Er und sein Team hätten LuMriX „genau mit dieser Zielsetzung entwickelt“. LuMriX durchsucht „beliebige Themen-Netze“, die mittels dem ISO-Standard 'Topic Maps‘ repräsentiert und aus unterschiedlichen Dokumenten (PDF, HTML, XML, RDF, etc.) selbstständig aufgebaut werden.
Seit zweieinhalb Jahren ist die Suchmaschine der Forschungsgruppe im Einsatz. „Wir haben gezeigt“, so Ralf Schweiger, „daß mit Hilfe von XML-Standards die Qualität der Suchergebnisse gegenüber einer Volltext-Suche deutlich optimiert werden kann.“ Auch in der 'Giessener Elektronischen Bibliothek‘ hätten die Anwender den Sinn der Ordnung schnell erkannt. Mithilfe einer XML-strukturierten Beschreibung werden Diplomarbeiten, Dissertationen und andere wissenschaftliche Arbeiten „schnell und zuverlässig“ aufgespürt. Das i-Tüpfelchen: Gibt man in die Suchmaske den Begriff „Herzinfarkt“ ein, werden auch Dokumente zum Thema „Infarktenstehung im Herzmuskel“ gefunden - die Suchmaschine denkt mit, trennt und kombiniert die Suchbegriffe im Hintergrund.
Mehr als 20 Projekte
Seit März ist die neue XML-basierte Arzneimittel-Hausliste des Gießener Universitätsklinikums für das klinische Fachpersonal freigeschaltet. LuMriX sucht anhand von Wirkstoffen, Handelsnamen und Diagnosen die Medikamente im Warenlager der hauseigenen Apotheke, die per elektronischem Warenkorb angefordert werden können. Insgesamt hat das Team um Ralf Schweiger mehr als 20 Projekte auf die Beine gestellt. Auf www.lumrix.de findet der Anwender unter anderem ein medizinisches Nachschlagewerk mit verschiedenen Diagnose- und Operationsschlüsseln sowie eine Suche im Bürgerlichen Gesetzbuch (BGB).
Bislang durchforstet LuMriX begrenzte und definierte Suchräume. Die Gießener Bibliothek könnte aber auch mit anderen Bibliotheken zusammengeschaltet werden, sagt der Informatiker. Die dezentrale Organisation von LuMriX stelle sicher, daß die Dokumente von Fachleuten gepflegt und die Suchlast auf viele Rechner verteilt werden könne. XML für die Recherche in großen Dokumentenbeständen zu nutzen, sei noch Gegenstand der Forschung. „Wir sehen uns momentan nicht als Konkurrenz für 'Google‘ oder 'Yahoo‘“, betont Ralf Schweiger. Noch wäre das auch schwierig. Hinter dem System von 'Google‘ stecken mehr als 10 000 Rechner, hinter dem von LuMriX bisher nur einer. Platz für weitere Rechner wäre noch.
Im gegenüberliegenden Zimmer der Forschergruppe zum Beispiel. Ralf Schweiger geht über den Flur und öffnet die Tür. Auf dem Tisch liegen Zettel herum, stapeln sich Akten und leere Kaffeetassen. Na also. Im Chaos entfaltet sich erst das wahre Genie, das Ordnung ins 'World Wide Web‘ bringt.