Next: 3.2.6 Suchergebnis
Up: 3.2 Beschreibung der Kriterien
Previous: 3.2.4 User-Interface
Jede Suchmaschine hat ihre eigene Syntax und ihre eigene Regeln. Es
ist daher unabdingbar, daß die Benutzer genau informiert werden,
wie sie ihre Suchanfrage stellen müssen, um die Dokumente zu
finden, die auch die gewünschte Information enthält.
Die vielen Möglichkeiten, die der Benutzer bei der Formulierung
hat, sollen dazu dienen, eine möglichst präzise
Anfrage zu stellen.
- Unscharfe Suche
Bei einer unscharfen Suche werden auch Wörter, die sich z.B. um
ein Zeichen von dem Suchbegriff unterscheiden, gefunden.
So können auch Dokumente gefunden werden, bei denen sich der Autor
bei einem Wort verschrieben hat. Man kann nicht davon ausgehen, daß
die Informationen alle fehlerfrei veröffentlicht werden.
Ein häufiger Fehler ist das Vertauschen von zwei
Buchstaben, so daß eigentlich zwei Buchstaben falsch sind.
Wird hier nur eine Toleranz von einem Fehler zugelassen,
so wird der Begriff in Dokument nicht gefunden.
Je mehr Unterschiede aber zugelassen werden, um so größer wird
die Anzahl der Treffer, da dann immer mehr Begriffe gefunden
werden, die mit dem Suchbegriff keine semantische Übereinstimmung
haben. Der Benutzer sollte die Anzahl der Fehler pro
Wort selbst einstellen können.
- Groß- und Kleinschreibung
Um einen besseren Erfolg zu haben,
erscheint es sinnvoll, bei der Suche nach Groß- und Kleinschreibung
zu unterscheiden. So hat der Benutzer die Möglichkeit
seine Suche etwas einzuschränken.
Die verschieden Suchmaschinen haben unterschiedliche
Syntaxkonventionen für die Groß- und Kleinschreibung.
Daher ist es wichtig dem Anwender mitzuteilen, ob die
Groß- und Kleinschreibung berücksichtigt wird, oder nicht.
Am Besten ist es, wenn der Anwender die Wahl hat, wie
sein Suchbrgriff interpretiert wird.
- Umlaute
Da im deutschen Alphabet Umlaute enthalten sind, und viele
Dokumente diese auch enthalten, ist es notwendig, daß auch die
Suche nach Wörtern mit Umlauten möglich ist.
Hier ergibt sich die Schwierigkeit, daß aber nicht
alle Benutzer eine Tastatur mit Umlauten zur
Verfügung haben. Daher muß bei der Eingabe von ,,ae`` auch
ein Wort gefunden werden, das ,,ä`` enthält. Nur so
kann sichergestellt werden, daß alle Benutzer auch
Suchbegriffe mit Umlauten verwenden können.
Ferner ist es in HTML üblich z.B. den Umlaut ,,ä`` auch
,,ä`` zu schreiben. Auch diese Form muß von der Suchmaschine richtig
interpretiert werden.
- Sonderzeichen
Die Suchmaschine sollte auch die Suche nach Sonderzeichen
unterstützen. Es sollte möglich sein, alle an einer gängigen
Tastatur verfügbaren Zeichen in eine Suchabfrage einzubeziehen.
- Unterstützte Sprachen
Die Suchmaschine sollte keine Einschränkung auf irgend
eine bestimmte Sprache haben. Diese Forderung ist so
aber sehr schwierig zu erfüllen besonders, wenn Sprachen mit
anderen Zeichen verwendet werden, wie z.B. in der
Japanischen Sprache. Daher soll es genügen, wenn folgende
Sprachen unterstützt werden: Englisch, Deutsch, Französisch.
Es sollte desshalb keine
Rolle spielen, in welcher Sprache die Information verfaßt ist.
Wenn bei der Indexierung die Füllwörter entfernt werden,
ist zu beachten, daß jede Sprache eigene Füllwörter hat.
- Gewichtete Suchbegriffe
Unterstützt die Suchmaschine eine Gewichtung der Suchbegriffe,
so können den einzelnen Suchbegriffen unterschiedliche
Prioritäten zugeordnet werden. Der Benutzer kann damit erreichen,
daß der eine Begriff auf jeden Fall in dem Dokument enthalten sein muß,
ein anderer aber nicht zwingend in dem Dokument verkommt.
- Wildcards
Oft ist es zweckmäßig nicht den exakten Suchbegriff anzugeben,
sondern nur den Anfang des Wortes, um dann auch
die Dokumente zu finden, in denen der Suchbegriff z.B. im Plural, oder
in einem anderen Fall verwendet wurde.
Entweder ergänzt die Suchmaschine den Suchbegriff automatisch
oder der Benutzer muß ein Sonderzeichen dafür eingeben (z.B. ,,*``).
Da jedoch das uneingeschränke Benutzen von Wildcards leicht zu
einer unüberschaubaren Menge von Treffern führt, wird
bei manchen Suchmaschinen der Einsatz eingeschränkt.
So darf ein ,,*`` erst nach ein paar anderen Zeichen
im Suchbegriff auftauchen oder ein ,,*`` ersetzt nur
eine bestimmte Anzahl von Buchstaben.
Statt dem ,,*`` kann auch ,,¿` verwendet
werden. Der Unterschied liegt darin, daß nur ein Zeichen
in einen Wort beliebig sein darf.
- Phrasensuche
Unter Phrasensuche versteht man die Suche
nach einem kurzen zusammenhängenden
Text. Diese ist nur möglich, wenn die Suchmascchine eine
Volltextindizierung durchführt, und keine Füllwörter
ignoriert.
Es werden nur die Dokumente gefunden, in denen die Suchbegriffe
in genau der selben Reihenfolge auftreten, wie in der Suchphrase.
Damit die Suchmascchine erkennt, daß der Benutzer nach einer Phrase
sucht, werden die Suchbegriffe meißt mit `` eingeschlossen.
- Verschiedene Suchmodi
In einem großen Unternehmen ist das Wissen der verschiedenen Benutzer
sehr unterschiedlich. Ein Teil arbeitet sehr selten mit dem Computer
und andere fast ausschließlich. Daher ist es sinnvoll, für verschiedene
Benutzergruppen verschiedene Suchmodi zu haben.
So können die Benutzer, die nur einfache Anfragen stellen einen
einfache Suchmaske verwenden und werden nicht durch zu viele Details
verwirrt. Die Experten sollen die Möglichkeiten haben,
komplexere Suchanfragen zu stellen.
Die verschiedenen Suchmodi werden
vom Administrator eingerichtet und sollen
frei gestaltet sein dürfen.
- Zeitspanne
Bei einem großen Datenbestand ist es nötig, den
Erstellungszeitraum der Dokumente einzugrenzen. So werden nur Dokumente
gefunden, die in dem angegebenen Zeitraum veröffentlicht wurden.
Weiß der Benutzer das ungefähre Datum, an dem das Dokument
veröffentlicht wurde, so kann die Anzahl der gefundenen
Dokumente oft erheblich eingeschränkt werden.
So hat der Benutzer z.B. die Möglichkeit, sich Informationen
zu einem bestimmten Thema suchen zu lassen, die
nicht älter als ein Jahr sein dürfen.
- Kennwörter
Um zu einem besseren Suchergebnis zu kommen, kann es sinnvoll sein,
die Suche eines Begriffs auf Kennwörter zu begrenzen. Weiß der
Benutzer, daß der Suchbegriff im Titel des Dokumentes vorkommt,
so kann er z.B. die Suche auf den Titel begrenzen. Dokumente, in denen
der Begriff an einer anderen Stelle auftritt, werden nicht gefunden.
Sucht der Benutzer nach einem bestimmten Bild, dessen Namen
er weiß, so kann er die Suche auf Bilder einschränken.
Genauso können alle Seiten gesucht werden, die Links zu einer
bestimmten HTML-Seite enthalten.
Es gibt verschiedene Kennwörter:
url:..., author:..., title:..., link:..., image:...
- Boolesche Operationen
Zur Erstellung komplexer Suchanfragen ist es nötig, mehrere Suchbegriffe
mit Booleschen Operatoren zu verknüpfen. Auf jeden Fall
müssen die Operatoren ,,OR``, ,,AND`` und ,,NOT`` vorhanden sein. Weitere
Operatoren wie ,,NEAR`` sind zwar nicht unbedingt notwendig, aber oft ganz
nützlich.
Um komplexe Anfragen formulieren zu können ist
die Verwendung von Klammern unverzichtbar. Nur so kann
eine größere Anzahl von unterschiedlichen Operatoren
verknüpft werden. Da oft nicht eindeutig ersichtlich ist,
welcher Operator stärker bindet als ein anderer, ist
im Zweifelsfall immer zu der Verwendung von Klammern zu
raten.
Die Anzahl der
Klammerebenen sollte nicht zu gering sein.
Bei manchen Suchmaschinen wird ,,+`` als logisches UND verwendet. Damit
ist z.B. eine Suche nach C++ nicht möglich, ohne daß alle Informationen über
C auch angezeigt werden.
- Suche nach Schlüsselwörtern
Schlüssenwörter sind Wörter, die eine bestimmte Bedeutung
bei den Anfragen an die Suchmaschine haben. Ein Beispiel
sind die Booleschen Operatoren.
Um auch eine Suche nach diesen Schlüsselwörtern zuzulassen, muß
der Begriff dann anders eingegeben werden, als wenn ,,OR`` als
Boolescher Operator verwendet wird. Die Suchmaschine muß daher
unterscheiden können, welches ,,OR`` gemeint ist.
- Kommentar
In HTML gibt es die Möglichkeit, Kommentare einzugeben.
Diese werden vom WWW-Browser ignoriert und nicht angezeigt.
Daher soll auch die Suchmaschine den Kommentar ignorieren,
und nicht in ihren Index mit aufnehmen. Sonst kann
es leicht zu einer Verwirrung der Benutzer kommen,
wenn ein Dokument in der Trefferliste erscheint,
der WWW-Browser den gesuchten Begriff aber nicht
am Bildschirm dastellt.
- Kontextsuche
Mit Hilfe der Kontextsuche gelingt es, nicht nur den
exakten Suchbegriff zu finden, sondern
Wörter mit derselben oder ähnlichen Bedeutung.
Dies kann durch ein
Synonymwörterbuch, das evtl. noch von Hand
ergänzt werden kann, realisiert sein.
Wenn nach einem Begriff gesucht wird, wird auch ein Wort, das
aus dem gleichen Umfeld ist, gefunden.
Bei der Suche nach z.B. Raumfahrt werden auch alle Artikel,
die das Wort Ariane enthalten, gefunden.
Da sich der Zusammenhang bestimmter Wörter zuenander immer
wieder ändert, sollten diese
Abhängigkeiten von Hand verändert und
mit einer Gewichtung versehen werden können.
Da jeder Benutzer andere Assoziationen hat, müssen diese
Einstellungen benutzerspezifisch sein.
Dies bedeutet aber einen sehr großen Aufwand, der
sich nur dann rechtfertigt, wenn das Suchen
von Informationen eine große Rolle bei der täglichen
Arbeit spielt.
Next: 3.2.6 Suchergebnis
Up: 3.2 Beschreibung der Kriterien
Previous: 3.2.4 User-Interface
Copyright Munich Network Management Team