Die intensive und weiterhin zunehmende Nutzung des World Wide Web führt bei den Anbietern von WWW-Dokumenten zu einem hohen Bedarf an Unterstützungswerkzeugen für die Administration ihrer WWW-Server. Mit der zunehmenden Kommerzialisierung des Internet ist es ferner erforderlich, den Betreibern von WWW-Servern Informationen zur Verfügung zu stellen, die es ihnen erlauben, präzise Aussagen über die Nutzung dieser Server zu erhalten. Die daraus gewonnenen Erkenntnisse bilden eine wichtige Grundlage zur Kapazitätsplanung sowie zur Optimierung der angebotenen HTML-Dokumente. Ein für Unternehmen sehr wichtiger Aspekt ist die Möglichkeit, auf der Basis der erhobenen Daten Wirtschaftlichkeitsbetrachtungen bezüglich der angebotenen Dienste durchzuführen.
Im Rahmen dieses Fortgeschrittenenpraktikums soll untersucht werden, nach welchen Kriterien Logdateien, die von WWW-Servern angelegt werden, maschinell auszuwerten sind. Hieraus können unter anderem automatische Zugriffs- bzw. Fehlerstatistiken generiert werden, die Aussagen über die Nutzungshäufigkeit bzw. Verfügbarkeit der HTML-Dokumente zulassen. Ein typisches Szenario ist, festzustellen, welche HTML-Dokumente besonders häufig betrachtet werden, um diese anschließend auf Server zu verlagern, die über Kommunikationsschnittstellen mit hoher Bandbreite verfügen.
Aufgrund der großen Menge anfallender Daten (mehrere Megabytes pro Monat) ist es unmittelbar einleuchtend, daß manuelle Auswertungen aus Komplexitätsgrunden ausscheiden und daher dringender Bedarf an einem Werkzeug besteht, das die oben beschriebene Funktionalität bietet.