Sortierung der Treffer nach Relevanz
Die auf eine Anfrage gefundenen Dokumente werden von den meisten
Suchmaschinen so sortiert, daß die „wichtigsten“, d.h. die relevantesten
Dokumente zu Beginn der Suchergebnisauflistung stehen. („Ranking“).
Wie läßt sich Relevanz bestimmen? |
je mehr Suchbegriffe im Dokument, desto relevanter
Suchbegriff im Titel oder einer Überschrift ist z.B. von höherer Relevanz als Begriff im laufenden Text nah beieinander stehende Suchbegriffe haben höhere Relevanz je häufiger der Suchbegriff im Dokument vorkommt, desto höher seine Relevanz Wörter, die weniger häufig in der Datenbank sind, werden als spezifischer, d.h. relevanter angesehen Dokumente, auf die von vielen Stellen anderswo im Internet durch Hyperlinks verwiesen wird, werden als wichtiger angesehen. Nach diesem Prinzip arbeitet z.B. die Suchmaschine google |
Diese Kriterien fließen mit unterschiedlicher Gewichtung in das Ranking ein, wobei die Trefferreihenfolge entweder in Prozent- oder in absoluten Zahlenwerten angegeben wird. Die genaue Berechnung des Rankings (Algorithmus) bleibt hierbei das Betriebsgeheimnis der Suchmaschinenbetreiber. |
Relevanz-Feedback
Aufgrund solcher Zahlenwerte ist es für manche Suchmaschinen
(z.B Altavista, google) auch möglich, zu einem vorgegebenen Dokument
ähnliche Dokumente mit ähnlichen oder gleichen Zahlenwerten zu ermitteln:
Man teilt der Maschine mit, daß ein Dokument aus der Suchanfrage besonders
relevant war und erhält in einem zweiten Suchvorgang ähnlich relevante
Dokumente.
Copyright: B. Meier