next up previous contents index
Next: Dienste für das Leistungsmanagement Up: Benötigte Managementfunktionalität Previous: Dienste für das Konfigurationsmanagement

Dienste für das Fehlermanagement

  Für Partnersysteme muß es möglich sein festzustellen, ob das gesamte Managementsystem bzw. wichtige Komponenten (Topologieverwaltung, Monitoring-Komponente) ausgefallen sind. Die Ermittlung eines Ausfalls erfolgt durch Diagnosemechanismen zur Durchführung von Tests und Traces auf dem betroffenen System und muß von diesem angeboten werden. Ist ein Ausfall aufgetreten, sollte ein Partnersystem in der Lage sein, das Management der durch das ausgefallene Managementsystem administrierten Ressourcen zu übernehmen (vgl. hierzu die Manager Overtake Funktion   aus Szenario [*]); die im vorigen Abschnitt besprochenen Dienste zur Ermittlung dieser Ressourcenmenge bilden hierfür die Grundlage. Ferner sollte aus den obengenannten Gründen ein Partnersystem in der Lage sein, ein gesamtes Managementsystem bzw. dessen einzelne Teilkomponenten zu initialisieren oder zu stoppen oder einen Restart zu veranlassen.

Im praktischen Betrieb von Managementsystemen zeigt sich, daß ein häufiger Grund für den Ausfall eines Managementsystems im Vorliegen von Inkonsistenzen in seiner Datenbank liegt. Solche Inkonsistenzen breiten sich über verhältnismäßig lange Zeiträume (oft mehrere Tage) aus und führen schließlich zum Kollaps des Gesamtsystems. Das regelmäßige Prüfen der Datenbank auf Konsistenz ist hierbei ein Schlüsselfaktor zur Erreichung einer hohen Systemstabilität, kann jedoch bei gegenwärtigen Managementsystemen lediglich offline, d.h. dann durchgeführt werden, wenn das System selbst inaktiv ist. Auch aus diesem Grund ist der oben angesprochene Dienst zum Stoppen bzw. Starten eines Managementsystems notwendig.

Dienste zur Ereignisfilterung, -verarbeitung und -weiterleitung sind ebenfalls wesentlich, um lokalen Netzfehlern mit globalen Auswirkungen wirksam vorbeugen zu können. Ein Enterprise Management System kann sich so gezielt über an einem verteilten kooperativen Managementsystem auftretende Ereignisse informieren und gegebenenfalls Test- und Fehlerbehebungsmaßnahmen anstoßen. Hierzu zählt auch das Verwalten, Auswerten und Bereinigen der Ereignis- und Fehlerlogs eines Managementsystems, das ebenfalls durch Partnersysteme möglich sein sollte.


next up previous contents index
Next: Dienste für das Leistungsmanagement Up: Benötigte Managementfunktionalität Previous: Dienste für das Konfigurationsmanagement
Copyright Munich Network Management Team