Jeder WWW-Server bietet die Möglichkeit, die Anfragen in einer Datei
mitzuprotokollieren , um genaue Daten für Analysen über die Zugriffe
und eventuell auftretende Probleme zur Verfügung stellen zu können.
Da sich unterschiedliche Formate für ein solches Logfile entwickelt haben,
wurde es notwendig, sich auf einen einheitlichen Standard zu einigen. Dieses
sogenannte Common Log Format [#!CommonLog!#] wird von allen Servern
unterstützt, wenngleich auch einige Server zusätzlich eigene Formate mit
erweiterten Informationen anbieten.
Dieses standardisierte Common Log Format hält folgende Informationen
über jeden erfolgten Zugriff fest:
remotehost
Daraus lassen sich die notwendigen Informationen zur Adresse des Clients aus
Abschnitt gewinnen.
rfc931
authuser
date
"request"
GET, GETHEAD, POST, ...
),
FTP, HTTP, WAIS, ...
),
Die ersten drei Angaben lassen sich direkt für weitere der im Abschnitt
über die Verbindungen des Servers geforderten
Informationen verwenden. Gleichzeitig erlaubt es erst dieser Eintrag, die
gesamten Daten eindeutig einem Dokument zuzuordnen.
status
bytes
Der Zeitpunkt des letzten Zugriffs auf ein bestimmtes Dokument kann
durch einen Vergleich aller Zugriffszeitpunkte ermittelt werden.
Aus eben diesen Zeitangaben und den Werten für die übertragene Datenmenge
zu den Antworten läßt sich auch die durchschnittliche Übertragungsrate
berechnen, indem einfach die Datenmengen innerhalb einer Zeitspanne aufaddiert
und durch die gewählte Zeitspanne dividiert werden:
15#15
Um die Daten eines solchen Logfiles verwenden zu können, ist ein
Werkzeug zur Auswertung erforderlich. In einem vorausgehenden
Fortgeschrittenenpraktikum [#!FoPraWim!#] wurde ein solches Analysewerkzeug
bereits entwickelt und steht für die Weiterverwendung zur Verfügung. Da die
Implementierungssprache Perl verwendet wurde ist es denkbar, daß sich durch
eine solche Anbindung Einschränkungen vor allem hinsichtlich der
Portabilität ergeben, die ja in dieser Arbeit entscheidenden Stellenwert
einnimmt. Da aber Perl zur Erstellung von CGI-Skripten auf Webservern weit
verbreitet ist und so zumindest auf dem Rechner, der das Logfile erzeugt,
vorhanden sein müßte, steht dieser Grund einer Verwendung nicht weiter im
Wege.
Da für gut frequentierte Server das Logfile sehr schnell an Größe gewinnt
muß es von Zeit zu Zeit zurückgesetzt werden. Wie dies genau zu geschehen
hat entnimmt man am besten der zugehörigen Dokumentation. Es ist klar, daß
die bisherigen Informationen über Verbindungen und Clients dem
Managementsystem danach nicht mehr zur Verfügung stehen, sofern sie nicht
anderweitig gesichert wurden.