Eine reibungslos funktionierende Kommunikationsinfrastruktur, wie sie
im LRZ vorhanden ist, ist eine grundlegende Voraussetzung im
Informationszeitalter. Es gehört zu den Leistungen eines
Kommunikationsdienstleisters, eines sogenannten Dienstproviders, seinen
Kunden (Dienstnutzer) ein gewisses Maß an Kommunikationsqualität zu
garantieren. Diese Qualität wird in sogenannten Dienstgüteparametern
festgelegt und mit den Kunden des Providers, zumindest im
kommerziellen Bereich, in Dienstgütevereinbarungen (Service Level
Agreements) vertraglich geregelt.
Der Funktionsbereich des Netzmanagements eines Providers
wird in mehrere Ebenen aufgeteilt. Im Leistungsmanagement eines
Dienstanbieters werden Quality of Service (QoS)-Parameter
definiert. Ein Beispiel für einen derartigen Parameter stellt die
Zeit von der Fehlermeldung eines Dienstnutzers bis zur ersten Reaktion
des Dienstanbieters dar. Zu einer der Aufgaben des Fehlermanagements
zählt es, die Verfügbarkeit einer Kommunikationsinfrastruktur
möglichst hoch zu halten. Dies kann durch ständige Überwachung und
entsprechende Reaktion auf Fehler bzw. Fehlermeldungen erreicht werden.
Der Help Desk eines Kommunikationsdienstanbieters setzt sich
überwiegend aus den Experten zusammen, die für die Fehlerlokalisierung
und Fehlerbehebung zuständig sind. Die Experten erkennen Probleme und
sind fähig, diese zu lösen. Dazu wird die Expertenriege am LRZ zur
(telefonischen) Hilfestellung in einer sogenannten Hotline
organisiert. Sie dient dem Benutzer als zentrale Anlaufstelle.
Die Experten benutzen zur Unterstützung der Überwachung des Netzes
und der Lokalisierung der auftretenden Fehler Werkzeuge als
Hilfsmittel.
Ein sogenanntes Trouble-Ticket-System (TTS) zählt dabei zu den passiven
Werkzeugen in diesem Managementumfeld. Es bietet dem Help Desk die
Fehlermeldungen in einem Dokumentationssystem an. Von der ersten
Erfassung eines Fehlers über die gestellte Diagnose bis hin zu den
Einzelschritten der Fehlerbehebung kann der Experte sich während
seiner Hilfestellungsphase informieren sowie seine eigenen Schritte
dokumentieren.
Am LRZ wird ein dem Trouble-Ticket-System vorgeschaltetes Werkzeug
eingesetzt. Die Aufgabe des Intelligent Assistant (IA) ist es, den Vorgang der Erstellung eines Trouble-Tickets (TT) von der
Fehlermeldung bis zur Fehlerlokalisierung weitgehend zu
automatisieren. Dieser Assistent kann in den sogenannten
First Level Support eingeordnet werden. Das ist die Hilfe, die der Benutzer
zuerst erfährt und in Anspruch nehmen kann.
Benutzergeführt mit Fragen, die dem Benutzer gestellt werden,
oder mittels Diagnosefunktionen, die durchgeführt werden können,
wird ein Fehler in einem Rechnernetz lokalisiert. Die Bedienung erfolgt
dabei auf zwei Arten. Einerseits nutzt der Experte am LRZ den
Assistenten und nimmt die Fehlermeldungen der Kunden telefonisch
entgegen, trägt sie ein und kann zugleich Rückfragen
stellen. Andererseits in der direkten Bedienung per WWW-Browser kann
der Dienstnutzer benutzergeführt den Fehler eingrenzen und ein
Trouble-Ticket erstellen. Derzeit ist der Intelligent Assistant für
die Problembereiche Verbindung, Durchsatz und Mail realisiert.
Die Automatisierung dieser ,,Ersthilfe`` bedeutet für die am LRZ
zuständigen Experten eine Entlastung hinsichtlich zeitaufwendiger
Routineanfragen. Des weiteren können in der telefonischen Beratung
des LRZ auch weniger routinierte Experten eingesetzt werden. In jedem
Fehlerfall werden durch den Intelligent Assistant Trouble-Tickets erstellt,
qualifizierte Fehlermeldungen, auf die der Experte um so schneller und
präziser reagieren und damit den Fehler entsprechend beheben kann.
Eingebettet in ein Expertensystem benutzt der Intelligent Assistant
derzeit eine regelbasierte Technik zur Wissensrepräsentation. Auf diese Weise
wird das Vorgehen in der Fehlerlokalisierung und Diagnose bestimmt.
Dazu wurden die Fragestellungen der Experten an die
Benutzer im Zusammenhang mit durchzuführenden Testroutinen
dokumentiert und in Entscheidungsbäumen implementiert. Die
schrittweise Abarbeitungsreihenfolge der Fragen und Tests wird je nach
Testverlauf und Testergebnis durch diesen Baum vorgegeben. Die
Experten haben die Kosten im Sinne von Nutzen und den
Informationsgehalt einer Frage oder eines Tests in der Diagnose durch
ihre Wissensvorgaben in die Entscheidungsbäume eingebaut und
berücksichtigt. Durch diese Vorgaben ist die Effizienz der Diagnose,
vor allem die Abarbeitungsreihenfolge betreffend, weitgehend
eingeschränkt.
Daher wird in diesem Expertensystem nach weiteren Möglichkeiten der
Wissensrepräsentation gesucht, um den statischen und wenig
,,intelligenten`` Ablauf in der Entscheidungsphase zu verbessern.
Die Bayesschen Netze bieten hier eine Möglichkeit, Wissen in anderer
Form zu repräsentieren.
Mit dem Einsatz von Wahrscheinlichkeiten kann der Grad der
Überzeugung, wie es Entscheidungen unter Unsicherheit erfordern,
dargestellt werden. Der Umgang mit unsicherer Information wird durch den
Einsatz der Wahrscheinlichkeitstheorie ausgedrückt.
Die Abhängigkeiten einzelner Entscheidungen lassen sich, direkt oder
indirekt, von Ursache und auftretenden Fehlern (Wirkung), graphisch
darstellen. Der Leitgedanke ist, Schlußfolgerungen herzuleiten,
ähnlich dem probabilistischen Schließen. Dieses Vorgehensmodell ist
der menschlichen Entscheidungsfindung zur Lösung eines Problems sehr
ähnlich.