Eines der zur Zeit mächtigsten Suchwerkzeuge im World Wide Web ist
neben WAIS das Programm Lycos. Es wurde an der Carnegie Mellon Universität entwickelt.
Kernstück von Lycos ist eine riesige Datenbank (catalog) mit Nachweisen von fast
19 Millionen webpages. Diese pages werden von einem Suchroboter zusammengesucht, der jeden Tag zwischen 5.000 und 10.000 Dokumente nach Hause bringen kann. Von diesen webpages werden in der Lycos-Datenbank folgende Informationen recherchierbar gemacht:
- URL und title
- headings und subheadings
- links
- die ersten zwanzig Zeilen
- die hundert häufigsten Worte
Wie suchen Sie in der Datenbank?
Lycos stellt Ihnen zwei Suchmasken zur Verfügung, eine ohne und eine mit erweiterten Suchoptionen. Sie sollten die Maske mit den Optionen benutzen.
Geben Sie Ihre Suchbegriffe, z.B. "Auto" und "Straße" in das entsprechende Feld der Suchmaske. Die Reihenfolge der Begriffe und die Groß-/Kleinschreibung sind dabei unerheblich.
Angenommen, Lycos findet nun 100 Dokumente mit den eben genannten Suchbegriffen. Die angezeigten Dokumente sind nach Relevanz geordnet, wobei das erste Dokument die höchste Relevanz besitzt.
Der Relevanzfaktor wird durch folgende Variablen gebildet:
- der logische Operator "and" kommt vor dem Operator "or". Das bedeutet, daß Dokumente, die beide Begriffe aufweisen, vor Dokumenten mit nur einem Begriff gesetzt werden.
- Genauigkeit: Der Begriff "Auto" hat einen höheren Relevanzfaktor als der Begriff "Autoreifen", der Begriff "Straße" ist höherwertiger als der Begriff "Straßenbahn".
- Häufigkeit: Je häufiger der Begriff im Text auftaucht, desto relevanter ist das Dokument.
- Stellung im Text: Ein Suchbegriff gewinnt immer mehr an Relevanz, je näher er am Textanfang steht. Ein Suchbegriff im Titel hat also die höchste Relevanz.
- Stellung zueinander: Je entfernter die Begriffe voneinander stehen, desto weniger Relevanz weisen sie auf.
Wie Sie suchen sollten!
Denken Sie an das Suchbeispiel mit "Auto" und "Straße" . Um nun zu erreichen, daß die Suchmaschine "Pursuit" nur Dokumente mit exakt diesen Worten sucht, setzen Sie einen Punkt hinter jedes Wort.
Um den logischen Operator "or" auszuschalten, d.h., um nur Dokumente zu bekommen, die beide Begriffe aufweisen, setzen Sie im Feld "min.terms" den Wert auf 2. Bei drei Suchbegriffen entsprechend auf 3 usw.
Setzen Sie den Relevanz-Schwellenwert auf 0.5 bis 0.6. Je allgemeiner die Suche formuliert wird, desto höher sollte der Wert sein, um dadurch die Zahl unwichtiger Treffer zu minimieren.
Setzen Sie die Zahl der anzuzeigenden Treffer auf 50, mehr können Sie sowieso nicht abarbeiten.
Lassen Sie das Feld "terse" (Kurzanzeige) unberührt. Die Voreinstellung bei Lycos ist die Vollanzeige.