Monitoring

Warum sich IT-Monitoring "lohnt"

Ein Monitoring-System erwirtschaftet primär betrachtet natürlich kein Geld, sondern soll das Risiko von IT-Ausfällen minimieren. Dinge, die schief gehen können, gehen irgendwann schief - und so müssen die Aufwände für so ein IT-Monitoring immer mit den Kosten aufgewogen werden, mit denen Sie als Verantwortlicher im Ernstfall konfrontiert werden:

  • Wieviel Geld geht Ihrem Unternehmen verloren, wenn unerwartet wichtige Systeme stehen und Hunderte/Tausende von Angestellten plötzlich nicht arbeiten können? 
  • Wenn Sie keine Waren verkaufen, keine Transaktionen verarbeiten können?
  • Und erst recht: Was bedeutet das für das Image Ihres Unternehmens?

Instrumente ins Cockpit!

Wer steuern will, braucht Daten
IT-Umgebungen müssen ständig und immer schneller an neue Anforderungen angepasst werden. Entscheidungsgrundlage dafür sind die Messdaten, die Ihnen das IT-Monitoring liefert. Einige Beispiele dafür sind:

  • Datenzuwachs in GB pro Tag und Server
  • Ausreizung der verbauten Ressourcen (RAM/CPU-Cores) / Minimierung von Idle-Time
  • User-Aufkommen auf Datenbanken, Loadbalancern etc.
  • Bandbreiten-Nutzung auf WAN-Strecken, zu Servern, ins Internet etc.
  • uvm.

Nur wer die Historie solcher und anderer Metriken in seiner Umgebung kennt, ist imstande,

  • die eingesetzten IT-Ressourcen sinnvoll auszunutzen
  • neue IT-Ressourcen bedarfsgerecht einzukaufen
  • dank Forecasting proaktiv bestehende Ressourcen zu erweitern.

Meine Leistung für Sie

In folgenden Bereichen habe ich über 15 Jahre Erfahrung, die letzten sieben Jahre davon im Consulting:

  • CheckMK / Prometheus / Nagios / Naemon / Thruk
  • Linux / HA
  • Plugin-Entwicklung für diese Systeme (Bash/Perl/Python)
  • PNP4Nagios / Grafana
  • NagVis / Thruk Panorama: Erstellung von Leitstand-Dashboards
  • SLA-Reporting
  • E2E-Monitoring mit Sakuli (Mitbegründer des Projektes 2014), CasperJS/PhantomJS

Ich liefere Ihnen Konzepte und Lösungen in folgenden Bereichen:

Ablösung, Konzeption und Aufbau

Ob Sie vor der berühmten "grünen Wiese" stehen oder ein teures kommerzielles Monitoring ablösen möchten - ich finde für Sie die passende Lösung für ein Open-Source-basiertes IT-Monitoring, welches auf der Höhe der Zeit ist.

Eines meiner Steckenpferde ist die vollautomatische Ablösung samt Migration: ich kümmere mich darum, dass zum Umstellungszeitpunkt alle Daten vom Altsystem abgezogen und in das neue System importiert werden.

Wartung und Optimierung

Nichts ist so beständig wie die Veränderung: auch IT-Landschaften verändern sich in immer kürzeren Zyklen. Ebenso schnell wie Netzwerk-Switches, Speichersysteme, Server, Applikationen ein-/abgebaut werden, muss auch das Monitoring Schritt halten. Ich unterstütze Sie dabei, diese Prozesse zu optimieren, Ihre bestehenden Check-Plugins zu erweitern oder ggf. auch neue zu programmieren (Bash/Perl/Python).

Auswertung

Dashboards und Reports sind wichtige Werkzeuge im IT-Management, um die Dienstgüte interner und externer Applikationen und Services transparent und nachvollziehbar darzulegen. PNP4Nagios, aber insbesondere der neue De-facto-Standard Grafana (auch in Kombination mit Prometheus) sind die Werkzeuge, in denen ich aus den gesammelten Metriken anschauliche Dashboards erstelle.

E2E-Monitoring

Monitoring-Checks mit Test-"Robotern", die wie ein User Tastatur und Maus automatisiert bedienen, Bildschirmausgaben erkennen und Ausführungszeiten messen, ergänzen das bestehende Monitoring auf perfekte Art und Weise.

Hierfür habe 2014 mit meinem damaligen Kollegen bei ConSol das Framework Sakuli gegründet (inzwischen in Version 2 fortgeführt), um webbasierte Testmethoden mit Bildpattern-basierten zu kombinieren.

Für performante headless-Tests bin ich ein großer Fan des Testframeworks "CasperJS" geworden, welches Headless-Browser (wie z.B. PhantomJS) steuert, um auch komplexeste Auswertungen/Monitorings von Webseiten umzusetzen und in CheckMK/Nagios zu integrieren.

End2End-Tests geben Aufschluss über

  • funktionelle Störungen (z.B. “Bestellen”-Button im Webshop funktioniert nicht),
  • schleichende Performance-Veränderungen (z.B. Login dauert von Monat zu Monat länger)  
  • Verfügbarkeit

Schulung / Training / Workshops

Wer überwacht Ihre "Kronjuwelen"? Eine Blackbox?
Mit zielgerichteten und praxisorientieren Trainings (ich bin IHK-zertifizierter Ausbilder) bringe ich Sie und Ihr Team auf das nötige Level, mit dem Sie Ihrem Monitoring-System zu 100% vertrauen können.