In einer Vorgängerarbeit [Klin 98] wurde dieser, von Siemens in der
Abteilung ZT IK 4 in Anlehnung an [HeBr 95] und mit einer
Benutzerschnittstelle über das Internet ausgestattete und
implementierte, Algorithmus vorgestellt. Anwendung findet er in einem
Modell für die Reparatur und Wartung der Siemens Telefonanlagen. Dabei
wurde die Vorausplanung verallgemeinert und erfolgt in mehr als einem
Schritt. Zusätzlich besitzt die Siemens-Variante noch eine
Benutzerschnittstelle über das Internet.
Der Algorithmus wird in Bereichen eingesetzt, in welchen die
Fehlerursachen auch direkt abgeprüft werden können. In einem
Rechnernetz kann z.B. der Ausfall einer Komponente durch ping
oder traceroute überprüft werden. Die Konfiguration einer
Komponente, die sich in einem Rechnernetz befindet, kann durch
weiteren Managementeinsatz ermittelt werden. Es können auch mehrere
Variable für eine Komponente definiert werden, die einzelne
Konfigurationsparameter beschreiben.
Wenn der Anlaß für die Diagnose ein Verbindungsproblem zwischen zwei
Komponenten ist, gibt es die Möglichkeit, die Variablen noch
aufzuspalten, in: z.B. Konfiguration des Startpunktes und
Konfiguration des Zielpunktes. Andernfalls kann die Einbindung der
Konfiguration der Rechnernetzekomponenten das Bayessche Netz ausufern
lassen.
Zu jeder fragbaren Variable werden Kosten definiert, die anfallen, wenn der Benutzer diese Frage beantworten
muß. Sie sollen den Aufwand für den Rest der Diagnose beschreiben,
den es erfordert, diese Frage zu beantworten.
Der Fragealgorithmus stellt von allen möglichen Fragen diejenige, mit
dem kleinsten Erwartungswert der Kosten bis zum Abschluß der Diagnose.
Um diese zu ermitteln, wird für jeden Zustand jeder fragbaren Variable
berechnet, welche Rest-Kosten (im Schnitt) später noch anfallen werden,
wenn diese Variable erfragt wurde, und die dem Zustand entsprechende
Antwort gegeben wurde. Die erwarteten Restkosten werden über die
möglichen Antworten zu einer Frage gemittelt, gewichtet nach der
Wahrscheinlichkeit, daß die entsprechende Antwort gegeben wird
(durch Inferenz aus den bisher gegebenen Antworten).
Die Frage, bei der die Summe aus den eigenen Kosten und den zu erwartenden
Restkosten minimal ist, wird gestellt.
Um die Restkosten zu ermitteln, kann man neu propagieren und
dann wieder alle möglichen Fragen durchspielen, diese immer
wiederholen, solange bis man die Ursache des Fehlers in der durchgespielten
Variante gefunden hat, oder alles gefragt hat.
Da dies aufgrund der großen Anzahl von Schritten zu langsam ist,
bricht man das Durchspielen nach wenigen Schritten ab (geringe
Suchtiefe) und schätzt die Restkosten dadurch ab, daß man nur noch
die Fehlerursachen in der Reihenfolge ihrer Wahrscheinlichkeit, unter
Berücksichtigung der bisherigen Evidenz, also sicheren Annahmen,
durchspielt.
Können die Ursachen, wie etwa Krankheiten in der Medizin, nicht
erfragt werden, dann wird zu jeder Frage und jeder möglichen
Antwort die verbleibende Entropie (Restkosten) auf den Ursachen
abgeschätzt. Die Frage, die in Erwartung die Entropie am stärksten
reduziert, wird gestellt.
Bei Ursachenknoten, die nicht abgefragt werden können, ändert sich
am Aufbau des Bayesschen Netzes nichts. Über einen modifizierten
Fragealgorithmus werden sehr hohe Kosten für die entsprechenden
Ursachen-Knoten angesetzt. Damit wird diese Ursache erst dann
gefragt, wenn sie eindeutig identifiziert ist, und die Kosten sich
lohnen oder keine weitere Frage die Eindeutigkeit eines Ergebnisses
verbessern kann.
Der Algorithmus sieht insgesamt sechs Schritte vor, um für eine Anzahl
von Variablen die Wahrscheinlichkeiten zu berechnen, wenn bei
gegebenem Zustand Aktionen und Tests durchgeführt bzw. Fragen
beantwortet werden:
Die so entwickelten Bayesschen Netze werden als Antwortnetze, in HUGIN
z.B. als Inferenzdiagramme, bezeichnet. Dabei ist zu beachten, daß die
Bayesschen Netze nicht nur Abhängigkeiten hinsichtlich einer
Wahrscheinlichkeit aufzeigen, sondern auch kausale
Wechselbeziehungen.
Das Problem in der Konstruktion derartiger Antwortnetze liegt in der Anzahl der Zustände eines jeden einzelnen Abbildungsknotens. Diese kann sehr groß werden und damit die Einschätzung der Wahrscheinlichkeiten unhandlich machen.