Next: 4.4.3 Sicherheit
Up: 4.4 Search '97 von
Previous: Unterstützte Informationsquellen
- Vollständigkeit
Der Hersteller sicher zu, daß alle angegebenen Informationsquellen
vollständig durchsucht werden. Bei einem großen Komunikations-Netz
wie bei der BMW AG kann aber nicht überprüft werden, ob wirklich
alle Daten in den Index aufgenommen wurden.
- Behandlung von HTML-Seiten
Alle gefundenen Dateien werden in ein internes Format
konvertiert. Dabei werden unnötigerweise auch HTML-Seiten
von diesem Konverter verarbeitet. Dies führt zu
Problemen, wenn der Konverter HTML-Code anders
interpretiert als der WWW-Browser.
- Verhindern der Indizierung bestimmter Seiten
Der Benutzer hat keine Möglichkeit, bei der Erstellung einer HTML-Seite
anzugeben, daß diese nicht von dem Roboter durchsucht wird.
- Volltextrecherche
Es wird eine Volltextindizierung durchgeführt. Alle in den Dokumenten
vorkommenden Wörter werden in den Index aufgenommen.
- Zeitpunkt der Indizierung
Die Abstände, in denen die Indizierung durchgeführt wird, ist frei wählbar.
So kann der Administrator die Indizierung von Hand aktivieren,
oder regelmäßig
zu einem bestimmten Zeitpunkt ausführen lassen.
- Reindizierung
Der Indexierer unterstützt inkrementelles Indexieren.
Es ist aber auch möglich, den vorhandenen Index zu löschen, und
den Index komplet neu aufzubauen. So kann sichergestellt werden,
daß keine veralterten Links mehr in der Datenbank existieren.
- Behandlung von nicht statischen Seiten
Dokumente, die nur über sensitive Grafiken erreicht werden können,
werden nicht indiziert. Daraus folgt, daß auch alle Seiten,
die von diesen referenziert werden nicht erfaßt sind.
- Netzlast während der Indizierung
Die Netzlast während der Indizierung ist so hoch, daß ein
Arbeiten in diesem Zeitraum mit diesem Rechner nicht möglich ist.
- Verteilte Datenbanken
Es ist möglich, das Netz nicht nur als Ganzes zu durchsuchen, sondern auch
abschnittsweise. Die dann entstehenden Indizes werden auch
Kollektionen genannt.
Die verschieden Kollektionen können sich auf
verschiedenen Datenträgern befinden.
Die Indizes müssen aber dennoch von einem Rechner und von einem
Administrator verwaltet werden. Ein abteilungsbezogenes,
verteiltes Management es daher nicht möglich.
Next: 4.4.3 Sicherheit
Up: 4.4 Search '97 von
Previous: Unterstützte Informationsquellen
Copyright Munich Network Management Team