Relevanzbestimmung / Ranking bei Suchmaschinen
(in Anlehnung an  Babiak 1999,  S. 103 ff.)

Sortierung der Treffer nach Relevanz


Die auf eine Anfrage gefundenen Dokumente werden von den meisten Suchmaschinen so sortiert, daß die „wichtigsten“, d.h. die relevantesten Dokumente zu Beginn der Suchergebnisauflistung stehen. („Ranking“).
 
Wie läßt sich Relevanz bestimmen?
  • Anzahl der gefundenen Wörter 

  • je mehr Suchbegriffe im Dokument, desto relevanter
  • Position der Wörter

  • Suchbegriff im Titel oder einer Überschrift ist z.B. von höherer Relevanz als Begriff im laufenden Text
     
  • Abstand der Suchbegriffe im Dokument

  • nah beieinander stehende Suchbegriffe haben höhere Relevanz
     
  • Häufigkeit von Suchbegriffen innerhalb von Dokumenten

  • je häufiger der Suchbegriff im Dokument vorkommt, desto höher seine Relevanz
     
  • Gesamthäufigkeit einzelner Wörter

  • Wörter, die weniger häufig in der Datenbank sind, werden als spezifischer, d.h. relevanter angesehen
     
  • Popularität (Häufigkeit von Verweisen auf eine Seite)

  • Dokumente, auf die von vielen Stellen anderswo im Internet durch Hyperlinks verwiesen wird, werden als wichtiger angesehen.
    Nach diesem Prinzip arbeitet z.B. die Suchmaschine google

Diese Kriterien fließen mit unterschiedlicher Gewichtung in das Ranking ein, wobei die Trefferreihenfolge entweder in Prozent- oder in absoluten Zahlenwerten angegeben wird. Die genaue Berechnung des Rankings (Algorithmus) bleibt hierbei das Betriebsgeheimnis der Suchmaschinenbetreiber.

Relevanz-Feedback
Aufgrund solcher Zahlenwerte ist es für manche Suchmaschinen (z.B Altavista, google) auch möglich, zu einem vorgegebenen Dokument ähnliche Dokumente mit ähnlichen oder gleichen Zahlenwerten zu ermitteln: Man teilt der Maschine mit, daß ein Dokument aus der Suchanfrage besonders relevant war und erhält in einem zweiten Suchvorgang ähnlich relevante Dokumente.
 


 

Copyright: B. Meier