Aufgaben
- Entwicklung eines ganzheitlichen Monitoring- und Alerting-Konzepts für eine RZ-Infrastruktur
- Implementierung und Konfiguration der Monitoring-Lösung auf Basis von Zabbix
- Definition von Schwellenwerten, Alarmierungslogiken und Eskalationsprozessen
- Aufbau eines 7x24-Monitorings für den First-Level-Support
- Umsetzung von Event-, Availability- und Capacity-Management
- Evaluation ergänzender Tools und Erweiterungen
- Erstellung von Architektur-, Prozess- und Betriebsdokumentationen sowie Übergabe an den Betrieb
Profil
- Fundierte Erfahrung im Aufbau/Betrieb von Monitoring- und Alerting-Lösungen
- Fundierte Kenntnisse in Zabbix (Templates, Trigger, Dashboards, Alerting)
- Erfahrung im Monitoring von Netzwerk-, Firewall-, Server- und Storage-Umgebungen
- Gute Kenntnisse in ITSM-Prozessen (Event-, Availability-, Capacity-Management)
- Erfahrung im Aufbau von 7x24-Betriebs- und Eskalationsmodellen
- Analytische, strukturierte und lösungsorientierte Arbeitsweise
- Sehr gute Deutschkenntnisse; Englisch von Vorteil
Benefits
- Möglichkeit, ein gesamtheitliches Monitoring-Konzept massgeblich zu gestalten
- Enger Austausch mit erfahrenen Betriebsteams und hoher fachlicher Impact