Tiefer schürfen

Informatiker Dr. Philipp Schaer ist seit 2016 Professor für Information Retrival an der Fakultät für Informations- und Kommunikationswissenschaften (Bild: Thilo Schmülgen/TH Köln)

Bei Suchmaschinen vertrauen wir den vorgeschlagenen Ergebnissen: Die obersten Treffer werden schon die richtigen sein. Meinungsvielfalt bieten die Top-Ten-Ergebnislisten aber kaum. Prof. Dr. Philipp Schaer vom Institut für Informationswissenschaften untersucht, ob das World Wide Web nicht mehr zu bieten hat.

Donald Trump und Nico Rosberg waren 2016 die in Deutschland am meist gesuchten Personen – sagt Google in seiner Top-Charts-Analyse. Außerdem bewegte die Menschen vor allem der Brexit, warum Prince gestorben ist, wie Pokemon Go funktioniert und natürlich die Fußball-EM. Ach ja, und was hat Böhmermann noch gleich gegen Erdogan gesagt?
 
Die Antworten auf solche Fragen beziehen wir mittlerweile aus dem Internet. Fakt ist auch, dass sich die Mehrheit der Fragestellerinnen und Fragesteller mit den ersten fünf, maximal den ersten zehn Links in der Trefferliste begnügt – und die unterscheiden sich von Suchmaschine zu Suchmaschine nur geringfügig durch die Reihenfolge der Treffer. Es tummeln sich immer die gleichen Anbieter von Wissen, Nachrichten und Konsumartikeln auf den obersten Plätzen. Und das ist auch gut so, werden die Suchmaschinenanbieter  entgegnen: Denn ihre Aufgabe ist es, uns die wirklich relevanten Treffer aus dem unendlichen Fundus an Informationen zu filtern und zu gewichten.

Wo beginnt der Longtail?
Doch bedeutet das im Umkehrschluss, dass die Mehrheit der Webseiten tatsächlich nicht die inhaltliche Relevanz bietet, die der Nutzer sucht? Der sogenannte Longtail ist der riesige Wurmfortsatz in der Trefferliste jeder Suchmaschine, der kaum Beachtung findet. Schon alleine bei der Bestimmung, wo der Longtail beginnt, gehen die Meinungen auseinander. "Manche finden, der Longtail beginnt bereits auf der zweiten Seite der Trefferliste, also ab Platz elf", sagt Dr. Philipp Schaer. Für den Professor für  Information Retrieval am Institut für Informationswissenschaften ist der Longtail ein Forschungsgegenstand, bei dem es sich lohnt, ihn einmal näher zu untersuchen. Immerhin handelt es sich je nach Suchanfrage um mehrere Millionen Webseiten.

In einer Studie hat Schaer zusammen mit Kollegen von der HAW Hamburg und des GESIS – Leibniz-Instituts für Sozialwissenschaften die Relevanz des Longtails untersucht: Sind die Ergebnisse auf den hinteren Plätzen von Websuchmaschinen inhaltlich tatsächlich schlechter? Dazu hat er die Suchmaschine Million Short eingesetzt. Sie verwendet die Ergebnisse von Microsoft Bing und kann dabei die Treffer von populären Webseiten wie Wikipedia, Amazon oder anderen großen Plattformen verwerfen. Für die Studie sichteten die Probandinnen und Probanden zu bestimmten Themengebieten drei Ergebnisgruppen. Einmal die ungefilterten Suchergebnisse mit allen populären Webseiten, eine zweite Gruppe ohne die 10.000 populärsten und eine dritte, in der die eine Million populärsten Seiten fehlten. Dadurch erhielten die Probanden eine Trefferliste, die sich extrem von dem gewohnten Bild unterschied, zum Beispiel bei der Suchanfrage "Umweltministerin Angela Merkel".

Nicht immer seriös, manchmal zu spezifisch
Es zeigte sich aber, dass es keine signifikanten Unterschiede zwischen den drei Gruppen gab, wenn es um die Relevanz der Webseiten geht. Auch im Longtail waren die Probandinnen und Probanden mit den Suchergebnissen genauso zufrieden wie mit den ersten zehn Treffern in der Ergebnisliste. "Allerdings zeigten die Teilnehmerinnen und Teilnehmer bei unserer Umfrage leichte Bedenken bei der Zuverlässigkeit einiger Treff er im Longtail," so Schaer. "Anders als in den Top-Ten wurde die Seriosität einiger Quellen bezweifelt – was nachvollziehbar ist, da sich unter den Suchergebnissen auch private Blogs befinden. Außerdem wurden einige Webseiten als zu spezifisch empfunden. Bei den populären Seiten sind dagegen Bezahlschranken ein störender Faktor."

Mit der Studie, für die Philipp Schaer auf dem Conference and Labs of the Evaluation Forum 2016 im portugiesischen Évora mit dem Best-Poster-Award ausgezeichnet wurde, geht es  ihm nicht um Erkenntnisse zur Suchmaschinenoptimierung. Vielmehr beschäftigt ihn die Frage, mit welchem Alleinstellungsmerkmal sich eine Suchmaschine von der Konkurrenz unterscheiden kann.

"Aus der Sicht der Diversität bieten Suchmaschinen mittlerweile neben Text auch andere Medientypen an wie Videos, Social-Media und Livestreams. Das ist ein erster Schritt, aber inhaltlich herrscht meist eine Informations-Oligarchie." Denn bisher filtern Suchmaschinen vor allem nach Schlagworten und nach Popularitätskriterien, wie zum Beispiel dem Page-Rank, der beschreibt wie gut eine Webseite verlinkt ist und wie viele Links auf diese Webseite verweisen. Wikipedia beispielweise hat sehr viele Inlinks, da viele externe Quellen auf sie verweisen. Dies sorgt allerdings dafür, dass populäre Webseiten eine höhere Chance auf eine bessere Platzierung in den Trefferlisten haben – ein sich selbst verstärkendes System.

Suchmaschinen-Top-Ten ist einseitig
Das führt dazu, dass fast immer die gleichen Informationsanbieter unter den Top-Five der Trefferlisten sind – egal, welche Suchmaschine man benutzt. "Das Problem an diesem System ist, dass Außenseiter und alternative Meinungen verdrängt werden. Sie haben es extrem schwer, auf den obersten Plätzen der Trefferliste zu landen", sagt Schaer. Das sei zwar keine Zensur, aber eine einseitige Bereitstellung von Informationen.

Dabei steckt im Longtail durchaus Potenzial. Um sich ein Alleinstellungsmerkmal zu sichern, könnten Suchmaschinenanbieter gezielt mit dem Unerwartbaren spielen. "Man könnte in die Top-Ten auch ein Ergebnis aus dem Longtail aufnehmen; schließlich hat die Studie gezeigt, dass die Qualität im Schnitt nicht schlechter wird. So könnte man sich positiv von der Konkurrenz absetzen." Die mit 33 Probandinnen und Probanden recht klein angelegte Studie möchte Philipp Schaer im größeren Maßstab wiederholen und zu einzelnen  Fragestellungen vertiefen.

Text: Monika Probst

Juli 2017

M
M