"Flipper" fischt im Internet

TU-Informatiker präsentieren den ersten deutschsprachigen WWW-Suchdienst, der mit Web-Robotern arbeitet

So schön bunt und vielfältig wie der Internet-Dienst World Wide Web ist, so schwierig kann es sein, eine ganz bestimmte Information in dem ungeordneten Netz zu finden. Beispielsweise, wenn man die Online-Veröffentlichung eines Forscher-Kollegen sucht, dessen WWW-Adresse man nicht mehr weiß. Oder wenn man wissen möchte, wer sich in der Welt des Web mit einem Thema wie "Abfallentsorgung bei Großveranstaltungen" auseinandergesetzt hat. Hilfe bieten hier Suchdienste, die eine Stichwortsuche auf allen WWW-Dokumenten ermöglichen. Der erste automatisierte Suchdienst, der sich ausschließlich auf deutschsprachige Dokumente konzentriert, wurde jetzt am Fachbereich Informatik der TU Berlin entwickelt. Sein freundlicher Name: Flipper.

Flipper
Suchdienste sind Computer, die das Netz regelmäßig durchsuchen, Dokumente anfordern und deren Inhalte indexieren. Wer sich als Nutzer an einen dieser Suchdienste wie Alta Vista oder Lycos wendet, kann dann eine einfache Schlagwortsuche durchführen und erhält Adressen von WWW-Seiten mit den entsprechenden Suchbegriffen. Allerdings suchen diese Dienste WWW-Dokumente weltweit. Wer nur deutschsprachige Dokumente sucht, mußte bisher mit langen Listen fremdsprachiger Dokumente zurechtkommen und diese langwierig nach den deutschen Fundstellen durchforsten.

Eine Web-Suchmaschine namens "Flipper" speziell für deutschsprachige Dokumente wurde jetzt im Rahmen einer Diplomarbeit am Fachbereich Informatik entwickelt. Der einprägsame Name, der an den hilfreichen Delphin aus der gleichnamigen 60er-Jahre-Fernsehserie erinnert, entstand in Anlehnung an das Fachgebiet KIT/FLP (Kommunikations- und Informationssysteme / Formale Modelle, Logik und Programmierung), wo der chinesische TU-Student Benhui Chen seine Arbeit anfertigte.

"Flipper indexiert ausschließlich deutschsprachige Dokumente, die aber nicht unbedingt nur im deutschsprachigen Raum liegen müssen", erklärt Oli Kai Paulus, wissenschaftlicher Mitarbeiter bei FLP und Betreuer der Diplomarbeit: "Wir hoffen, daß damit das Suchen im Web einfacher wird und man eben nicht mehr mit 10000 Fundstellen wie bei Alta Vista konfrontiert ist, wenn man vorher weiß, daß es sich um ein deutschsprachiges Dokument handeln soll."

Momentan hat das TU-Suchsystem fast 130000 Seiten indexiert. "Damit liegen wir weit vor dem Umfang der anderen deutschen WWW-Indexe wie web.de und dino", freut sich der TU-Informatiker. Das hat einen einfachen Grund: Während die Konkurrenz-Systeme ihre WWW-Adressen von menschlichen Mitarbeitern suchen und eingeben lassen, läßt Flipper sogenannte Web-Roboter arbeiten. Paulus: "Das sind autonome Programme, die für uns auf WWW-Servern nach Dokumenten suchen. Sie bewegen sich von einem Dokument über Hyperlinks zu einem nächsten und überprüfen dabei die Häufigkeit von deutschen Wörtern. Wenn es genügend sind, schicken die Robots die WWW-Seite an den Flipper-Rechner." Dort werden die Seiten auf der Festplatte gesammelt und mit dem Information-Retrieval-Programm freeWAIS-sf nach Schlagwörtern indexiert. Die rund 130000 Dokumente sind derzeit in vollem Umfang auf dem Flipper-Rechner abgespeichert und nehmen 400 Megabyte Festplattenspeicher ein.

Nutzerinnen und Nutzer mit einer Suchanfrage können in dem Index nach beliebigen Stichwörtern oder Namen suchen - abgesehen von sogenannten Stopwörtern, wie "der", "die" und "das". Flipper sucht nach einem oder mehreren Schlagwörtern, ebenso nach Teilen eines Schlagworts: Der Begriff "Küche*" listet beispielsweise Dokumente auf, in denen Worte vorkommen, die mit "Küche" anfangen: Informationen zur Küchenmeisterausbildung, eine Wohnungsanzeige mit einer Küchenzeile oder eine Kinokritik aus Köln zum Film "Der Indianer im Küchenschrank".

NACH GEWICHT GEORDNET

Gut gelöst ist die Präsentation der Schlagwortliste: Sie ist nach dem "Gewicht" der Dokumente sortiert. Gewicht entspricht in diesem Zusammenhang der Häufigkeit, mit der die Suchwörter in den indexierten Dokumenten vorkommen. Außerdem werden die einzelnen Ergebnisse mit WWW-Adresse und dem Textzusammenhang angezeigt, d. h. einige Wörter vor und nach dem Suchwort werden ebenfalls aufgelistet. Ebenfalls sehr freundlich ist ein sogenannter Wartungsroboter. Er überprüft in regelmäßigen Abständen, ob die referenzierten WWW-Dokumente überhaupt noch im Netz vorhanden sind.

Die ersten Reaktionen, die bei den TU-Informatikern seit Betriebsbeginn im Mai ankommen, sind gut, wie sich im WWW-Gästebuch des Suchdienstes nachlesen läßt. Auch kommerzielles Interesse hat sich schon gezeigt, berichtet Flipper-Betreuer Paulus: "Wir stehen zur Zeit in Verhandlungen mit einem Verlagshaus und Werbeagenturen. Die möchten Flipper entweder selber nutzen oder Werbung darauf plazieren."

Wer mit Flipper als Reisebegleiter im WWW surfen möchte, wendet sich an Flipper http://www.flp.cs.tu-berlin.de/flipper/

René Schönfeldt


© 6/'96 TU-Pressestelle