Zur Überwachung der in der Dienstvereinbarung festgelegten Schwellwerte ist es erforderlich, daß entsprechende dienst- bzw. nutzerorientierte Parameter gemessen werden können. Hierbei handelt es sich typischerweise um Parameter, die sich auf vom Benutzer angestoßene und wahrnehmbare Transaktionen des Dienstes beziehen. Nach [#!my-ietf-rmonmib-apm-mib-03!#] sind für einen Nutzer bei der Nutzung eines Anwendungsdienst es zwei Größen von herausragender Bedeutung, die Verfügbarkeit (availability) und das Antwortzeit verhalten (responsiveness). Sowohl die Anzahl erfolgreicher bzw. nicht erfolgreicher Transaktionen als auch die Zeitdauer für die Erbringung einer Transaktion müssen somit gemessen werden können. Die zu überwachenden Transaktionen ergeben sich aus der Dienstvereinbarung. Ebenso wird häufig ein Wert für die Mindestverfügbarkeit eines Dienstes festgelegt und muß somit überwacht werden können. Eine ausführliche Untersuchung über die Erstellung von Dienstvereinbarungen und die Festlegung der zu überwachenden Parameter findet sich in [#!schm00!#]
Die Entscheidung, ob ein Dienst ordnungsgemäß funktioniert oder nicht, läßt sich nur durch Messung der tatsächlichen Dienstnutzung treffen. Dies bedeutet, daß die jeweils vom Benutzer tatsächlich wahrgenommene Dienstqualität gemessen und als Basis für weitere Entscheidungen herangezogen werden muß. Beschränkt man sich stattdessen z.B. auf stichprobenartige Überprüfungen der Dienstqualität, so kann man keine sichere Aussage darüber treffen, ob die vereinbarten Parameter bei einer konkreten Nutzung eingehalten wurden oder nicht.
Für den Dienstnehmer ist die oben beschriebene Identifikation von Leistungsabnahmen oder Ausfällen des abonnierten Dienstes bereits ausreichend. Aufgabe des Diensterbringers ist es aber nicht nur, derartige Probleme festzustellen, sondern für die Einhaltung der vereinbarten Parameter Sorge zu tragen. Dies bedeutet, daß er detailliertere Informationen über den Zustand der Anwendung sowie der darunterliegenden Systeme benötigt, die es ihm bei Auftreten eines Fehlers gestatten, die Ursache des Problems zu ermitteln und zu beheben.
Sowohl um die Fehlersuche zu erleichtern als auch, um bei Auftreten eines Problems die betroffenen Dienste und Nutzer ermitteln zu können, ist es für den Diensterbringer erforderlich, eine Korrelation der Teilinformationen vornehmen zu können. Beispielsweise sollte es bei einer fehlerhaften Transaktion möglich sein, die Teiltransaktion zu ermitteln, die für die Fehlfunktion verantwortlich war, um somit die mögliche Ursache des Problems schnell eingrenzen zu können. Daraus ergibt sich die Anforderung, daß die Informationen über die einzelnen Komponenten aus verläßlicher Quelle stammen und in einer vergleichbaren Form vorliegen müssen, um eine automatische Bewertung und Korrelation zu ermöglichen. Außerdem sollte der Diensterbringer bei Identifikation eines Problems in der Lage sein, die davon betroffenen Dienste und Benutzer ermitteln zu können, um somit die wirtschaftlichen Auswirkungen des aufgetretenen Problems abschätzen und geeignet reagieren zu können.
Sowohl aus Gründen der Abrechnung als auch aus Gründen der
Kapazitätsplanung und Fehlersuche ist es wünschenswert, den
Ressourcenverbrauch einer Anwendung bestimmen zu können. Es ist
also erforderlich, Systemparameter wie z.B. Verbrauch von
Prozessorzeit oder Speicherbelegung (vgl.
Abschnitt ) zu ermitteln und dem jeweiligen
Anwendungsdienst zuordnen zu können. Ideal wäre hierbei eine
detaillierte Aufschlüsselung des Ressourcenverbrauchs nach Dienst,
Transaktion und Nutzer.
Eine Managementlösung wird nur dann verbreitet eingesetzt werden, wenn der Aufwand für alle beteiligten Rollen so gering wie möglich ist. Dies bedeutet, daß zum einen der Diensterbringer durch weitestgehende Automatisierung des Managements entlastet werden muß. Darüber hinaus ist es aber ebenfalls von großer Bedeutung, dem Anwendungsentwickler bei der Bereitstellung der gewünschten Managementfunktionalität der Anwendung zu unterstützen. Insbesondere durch die Verwendung einfacher Konzepte und Verfahren, die möglichst dieselben Methoden verwenden, die bei der Erstellung der eigentlichen Anwendung ohnehin zum Einsatz kommen, ist damit zu rechnen, daß Anwendungsentwickler die Anwendungen mit entsprechender Managementfunktionalität versehen werden.
Jede Messung hat selber wieder Auswirkungen auf das gemessene System. Ziel jeder Managementlösung muß es sein, diese Auswirkungen so gering wie möglich zu halten.
Leistungsabnahmen oder Ausfälle eines Dienstes müssen umgehend erkannt werden, so daß eine Behebung des zugrundeliegenden Problems möglichst noch stattfinden kann, bevor eine Verletzung der Dienstvereinbarung vorliegt (proaktives Management). Daher unterliegt die Messung und Auswertung der Information zwar keinen harten Echtzeitbedingungen, muß aber dennoch zeitnah erfolgen, um schnelle Reaktionen zu gestatten.
Die Lösung sollte für beliebige (oder zumindest für eine große Klasse von) Anwendungen einsetzbar sein und nicht auf eine bestimmte Infrastruktur (z.B. Betriebssystem) oder eine bestimmte Programmiersprache beschränkt sein.