Wort
und Begriff bei Suchmaschinen Wort:
eine Suchmaschine behandelt jede Web-Seite als eine Sequenz von
Wörtern
- ein Wort ist für
die Suchmaschine eine Kette von Buchstaben und Ziffern, die durch
Satzzeichen oder nicht-alphanumerische Zeichen (z.B. ,.§%) oder
durch speziellen Freiraum (Leertaste, Zeilenende, Anfang oder Ende eines
Dokuments) begrenzt werden
- Beispiele
- 602e21
- EasierSaidThanDone
- die folgenden
Zeichenketten entsprechen zwei Wörtern, weil sie durch
eingebundene Satzzeichen getrennt werden
- don´t
- digital.com
- 3.14159
- x-y
- Suchmaschinen
nehmen in der Regel keine Satzzeichen oder Freiräume in ihr
Inhaltsverzeichnis auf
- deshalb kann
man Suchmaschinen nur für die Suche nach „Wörtern“ und Begriffen
benutzen und nicht, um Satzzeichen oder Wörter, die Satzzeichen
enthalten, zu suchen
Begriff: Ein Begriff
ist eine Reihe von Wörtern, die in einem Dokument aneinandergrenzen.
Die Wörter können aber durch Freizeichen oder Satzzeichen getrennt
sein; außerdem brauchen Begriffe keiner grammatikalischen Sprachregel
entsprechen - sie müssen nur in einem Dokument als Sequenz von Wörtern
vorkommen
- Beispiele
- President
of the U.S.A (= 6-Wörter-Begriff)
- http://www.election.digital.com
(= 5-Wörter-Begriff)
- weil die Satzzeichen
und die Freizeichen für Suchmaschinen bedeutungslos sind (ausgenommen
sie begrenzen Wörter), sind die obigen Begriffe identisch mit den
Varianten
- President
of the U S A
- http www
election digital com
|
Groß-
und Kleinschreibung
- klein
geschriebene Suchbegriffe finden bei den meisten Suchmaschinen sowohl
klein als auch groß geschriebene Wörter --> "essen"
findet "essen", "Essen" aber auch "eSSen"
- ansonsten gilt:
Ausprobieren!!
|
Wortteile
suchen (Trunkierung, Maskierung)
- Maskierung
mit sog. Jokerzeichen (* oder $): Biblio* findet Bibliothek,
Bibliothekar etc.
|
Phrasensuche
- nur eine
genaue Wortfolge wird gesucht
- gut bei feststehenden
Begriffen
- Kennzeichnung
durch doppelte Anführungszeichen, z.B. "Harald Schmidt
Show" (Bindestriche nicht nötig)
|
Umlaute,
Sonderzeichen, Kurzwörter, neue Rechtschreibung
/ Tippfehler
- Umlaute
werden von fast allen Suchmaschinen unterstützt; im Zweifelsfall
"köln OR koeln"
- Sonderzeichen
wie Bindestriche, Punkte oder Pluszeichen sind nur als Phrase suchbar
- Kurzwörter
mit weniger als drei Buchstaben werden häufig ignoriert und sollten
nur in Kombination mit einem weiteren Begriff als Phrase gesucht werden
--> "Windows NT"
- von den meisten
Suchmaschinen wird die neue Rechtschreibung bei einem Suchlauf mitberücksichtigt;
dennoch empfiehlt sich bei den meisten Suchmaschinen zusätzlich
eine Suche nach beiden Wortvarianten
- Tippfehler werden
z.B. bei google automatisch angezeigt
- auch hier
gilt: Ausprobieren!!
|
Boolesche
Operatoren
- AND:
beide Begriffe müssen vorkommen --> Obst AND Gemüse
- OR: mindestens
einer der Begriffe muß vorkommen --> Obst OR Gemüse
- NOT: schließt
den nachfolgenden Begriff aus --> Apfel AND Birne NOT Banane
- Verarbeitungsreihenfolge:
AND vor OR vor NOT
- Birne AND
Orange OR Mandarine NOT Apfel
- Suche Dokumente,
in denen auf jeden Fall die Wörter "Birne u. Orange"
vorkommen; "Mandarine" darf zusätzlich vorkommen, "Apfel"
jedoch nicht!
- Klammerung
faßt Begriffe zusammen, d.h. die Begriffe in der Klammer werden
als Einheit und zuerst abgearbeitet
- Birne AND
(Orange OR Mandarine)
- Suche Dokumente,
in denen entweder "Orange" bzw. "Mandarine", aber auf jeden Fall
"Birne" vorkommt
- Bsp. für
die grafische Darstellung Boolescher Operatoren in der Suchmaschine
Boolistic.com
|
Erwünschte
und nicht erwünschte Begriffe in Kurzform
(statt AND bzw. NOT) +noir
+film -"pinot noir"
- die obige Abfrage
findet alle Dokumente, in denen film und noir vorkommen,
nicht aber pinot noir
- stellt man ein
Pluszeichen einem Wort oder Ausdruck voran, muß er in jedem Fall
in der gefundenen Webseite vorhanden sein
- unerwünschte
Wörter in einem Text kennzeichnet man mit einem Minuszeichen
Achtung: zwischen + bzw. - darf kein Leerzeichen stehen!!
|