Begriffe wie „Ereignis“ spielen eine wichtige Rolle beim Verständnis von IT- und OT-Operationen. In der Regel gibt es eine Fülle von Interpretationen und Definitionen. Außerdem gibt es bei den einzelnen Anbietern von Tools für die Überwachung und das Servicemanagement unterschiedliche Namenskonventionen. Also, lass uns eintauchen.
Wie definiert ITIL (Information Technology Infrastructure Library) ein Ereignis?
ITIL stellt eine direkte Verbindung zwischen Ereignissen und Benachrichtigungen her:
„Ein Ereignis kann als jeder erkennbare oder wahrnehmbare Vorfall definiert werden, der für das Management der IT-Infrastruktur oder die Bereitstellung von IT-Services und die Bewertung der Auswirkungen einer Abweichung auf die Services von Bedeutung ist. Ereignisse sind typischerweise Benachrichtigungen, die von einem IT-Dienst, einem Configuration Item (CI) oder einem Überwachungstool erzeugt werden.“ Quelle: Wikipedia, z.B. aus dem ITIL Service Operation Book
Man kann hier anderer Meinung sein, weil ein Ereignis (nicht unbedingt) eine Benachrichtigung ist.
ITIL definiert auch Kategorien für Ereignisse
Hierbei werden jedoch Ereignisse und Warnungen vermischt.
„Standard-Kategorisierung basierend auf der Bedeutung eines Ereignisses:
- Information (INFO): Das Ereignis erfordert keine sofortige Aktion und stellt keine Ausnahme dar. Sie werden in den Protokolldateien aufgezeichnet und für einen bestimmten Zeitraum aufbewahrt. Diese Art von Ereignissen wird verwendet, um den Status eines Geräts oder Dienstes zu überprüfen, um den Zustand einer Aktivität zu bestätigen, um Statistiken zu erstellen (Benutzeranmeldung, abgeschlossener Batch-Job, Einschalten des Geräts, Anzahl der bei einer Anwendung angemeldeten Benutzer)
- Warnung (WARN / ALERT): Das Ereignis wird erzeugt, wenn sich ein Gerät oder Dienst (Anwendung / Dienstprogramm) einem vereinbarten Schwellenwert (KPI) nähert. Warnungen dienen dazu, die Gruppe/den Prozess/das Werkzeug zu benachrichtigen, damit die notwendigen Maßnahmen ergriffen werden können, um das Auftreten einer Ausnahme zu verhindern.
- Ausnahme (ERROR): bedeutet, dass ein Dienst oder Gerät derzeit unterhalb der normalen Parameter/Indikatoren (vordefiniert) arbeitet. Dies bedeutet, dass der Geschäftsdienst beeinträchtigt ist und das Gerät oder der Dienst eine Störung, eine Leistungsverschlechterung oder einen Funktionsverlust aufweist (Ausfall des Webservers, Verlust der CS-Abdeckung für mehrere Standorte). Ein Geräteausfall ist ein Fehler.“ – Quelle
Hier ist eine andere Definition, die vielleicht besser passt:
„Ein Ereignis ist eine beobachtete Veränderung des normalen Verhaltens eines Systems, einer Umgebung, eines Prozesses, eines Arbeitsablaufs oder einer Person.“ Quelle: danielmiessner.com
Vereinfacht könnte man also sagen, dass jede (auch unbeobachtete) Veränderung des aktuellen Verhaltens oder des gewünschten Zustands bereits ein Ereignis ist.
Wie SIGNL4 auf ein Ereignis reagiert
SIGNL4 ist in der Lage, Ereignisse aus einer Vielzahl von Quellen zu verarbeiten. Es protokolliert Ereignisse und kann entscheiden, ob es ein Ereignis in einen Alarm umwandelt und anschließend eine Benachrichtigung auslöst. Eingehende Ereignisse können bereits durch das verursachende System, z.B. ein IT-Überwachungstool, als Alarme qualifiziert werden. In jedem Fall stellt SIGNL4 sicher, dass alle Alarme zur richtigen Zeit und an jedem Ort an die richtige Person gesendet werden.