Seite
Worum geht‘s?
• Wie und wann entstand OMD?
• Erste Projekte nach der Gründung.
• OMD 2015 – Labs Edition.
• OMD 2016 – Was ist neu?
• Stand heute – Installationen und Technologien.
• OMD 2016+ - Was steht bevor?
05.12.2016 www.consol.de2
Seite
2010 Open Monitoring Distribution
05.12.2016 www.consol.de3
v.l.n.r
Lars Michelsen
Wolfgang Barth
Gerhard Laußer
Mathias Kettner
Jörg Linge
Sven Nierlein
Stefan Hösl
Seite
2010 installierte man ein Monitoring mit…
• Download nagios-x.y.z
• ./configure; make; make install
• Download nagios-plugins-x.y.z
• ./configure; make; make install
• Download pnp4nagios-x.y.z
• ./configure; make; make install
• Frickel
• Frickel
• Frickel
• Frickel
05.12.2016 www.consol.de4
Seite
Seit OMD installiert man ein Monitoring mit
• yum install omd-1.30
• omd create site
• omd start site
• Gaaaaanz wenig Frickel
• Gaaaaanz wenig Frickel
• Gaaaaanz wenig Frickel
05.12.2016 www.consol.de5
Seite
Erste nennenswerte Projekte mit OMD
• Landeshauptstadt München
– Monitoring sämtlicher IT-Komponenten
• Automobilhersteller
– Betriebssystemmonitoring aller Unix/Linux-Server
– Applikationsmonitoring mit Selbstbedienungsportal
– Datenbankmonitoring SaaS
• Deutsche Pfandbriefbank
– End-to-End-Monitoring mit Sakuli, SAP-Businessprozesse
• Lidl
– 200 Lagerhäuser, Geschäftsprozesse, Logistik
05.12.2016 www.consol.de6
Seite
Neue Technologien – mehr Tempo
Mehrere OMD-Addon-Pakete für diverse Kunden entstanden
Immer öfter tauchten auf der OSMC Tools wie Grafana oder
Graphite auf. Allerdings ohne einfache Integration.
Häufig verwendete bzw. sich schnell entwickelnde Plugins.
Die OMD-Labs-Edition entstand, damit über Nacht neue
Funktionen reingebracht werden konnten.
05.12.2016 www.consol.de7
Seite
OMD Labs-Edition
Nagios Icinga
Monitoring-PluginsJmx4Perl
Dokuwiki Thruk
Nagvis
PNP4Nagios
Shinken
MongoDB
MySQL
Apachecheck_logfiles
check_mysql_health
check_oracle_health
check_multi
Mod-Gearman
check_webinject InfluxDB
Elastic Search
Icinga2
FreeTDS
check_mssql_health
Grafana
Naemon
check_nwc_health
coshsh
HTTPS
Seite
OMD Labs-Edition
Standard-OMD OMD-*-Add-on
OMD-*-Add-on
OMD-*-Add-on
Standard-OMD
Standard-OMD
OMD Labs-Edition OMD-*-Add-on
OMD-*-Add-on
OMD-*-Add-on
OMD Labs-Edition
OMD Labs-Edition
Best Practice
und
Gemeinsamkeiten
in den Add-ons
wandern in die
Labs-Edition.
Dadurch werden
die Add-ons
wartungsfreundlicher
und die Labs-Edition
praxiserprobter.
Seite
OMD Labs 2015 – Modernere Graphen
Als Alternative zu PNP4Nagios/RRD können Perfdaten
– in einer InfluxDB gespeichert
– und mit Grafana angezeigt werden
Einfach mit
omd config set influxdb on
omd config set grafana on
omd config set nagflux on
und Templates srv-perf und host-perf
05.12.2016 www.consol.de10
Seite
OMD Labs 2015 – Modernere Graphen
Und weil in OMD nichts reinkommen soll, nur weil es cool ist,
sondern weil es einen Mehrwert bietet….
werden z.b.
• Downtimes ausgegraut
• tauchen ACK-Texte als
Popup auf
• werden Schwellwerte so
angezeigt, wie sie waren
05.12.2016 www.consol.de12
Seite
OMD 2016
• Die größte Installation umfasst 200 weltweite Standorte mit
jeweils eigenem OMD, zusammengefasst in 3 Thruk-Ebenen.
• Aufbau von Know How in Ansible, daher wurde Ansible 2.x in
OMD Labs aufgenommen.
Neuinstallation und Updates per Ansible.
Plugin-Verteilung per Ansible.
Inter-Site-Connections (ssh-Tunnel) per Ansible
05.12.2016 www.consol.de13
Seite
OMD 2016 – Installationen auf reiner Labs-Basis
Mittlerweile gehören zum Portfolio:
• Coshsh – Konfigurationsgenerator
• dataScryer – Prediction auf Basis von InfluxDB
• check_*_health
• check_nsc_web – Client für NSClient++ (https/Rest)
• Icinga2
Security-Audits sind kein Problem mehr, sämtliche
Kommunikation läuft über ssh und https.
05.12.2016 www.consol.de14
Seite
OMD 2016 – Sogar 2 Icinga2
Die Kunden wollten es halt….
Da aber jeder auf Thruk als GUI besteht, wurde gebastelt,
denn von Haus aus
braucht Thruk nagios.log
oder seine eigene DB
05.12.2016 www.consol.de15
Seite
OMD 2016 – LMD
Hunderte Backends hinter einem Thruk können sich zäh
anfühlen.
Tausende Backends sollen aber möglich sein.
Livestatus-Implementierungen sind unterschiedlich/buggy
Livestatus Multi Daemon ist ein
• Cache
• Aggregierer
• Sortierer
• Formatierer
05.12.2016 www.consol.de16
Seite
OMD 2016 – Prometheus
Immer öfter trifft man auf Docker, Openstack, OpenShift,
Kubernetes, Mesos, etc., auch wenn man sich bisher in ganz
klassischen IT-Umgebungen aufgehalten hat.
Diese hochdynamischen Landschaften passen nicht zu
statischen Konfigurationsdateien und auch nicht zu Monitoring-
Systemen, die bei jedem Update durchgestartet werden
müssen bzw. deren GUI nicht aktuell gehalten werden kann.
Updates per API oder Hinterherhecheln mit coshsh passen
nicht.
05.12.2016 www.consol.de18
Seite
OMD 2016 – Prometheus
Die genannten Plattformen bringen bereits Prometheus-
Schnittstellen mit.
Software wird bewusst mit Prometheus-Instrumentierung
entwickelt.
Das Naheliegendste war, OMD um ein adäquates Tool zu
erweitern, um beide Welten aus einer Hand abdecken zu
können.
Prometheus breitet sich rasend schnell aus, dürfte der
Platzhirsch sein/werden und „fühlt“ sich richtig an.
05.12.2016 www.consol.de19
Seite
OMD 2016 – Prometheus
Bestandteil von OMD sind
• Prometheus
• Alertmanager
• node_exporter
• blackbox_exporter
• Pushgateway
Alles wie gehabt in eigenen Sites, mit gewohnten Kommandos
omd config set *** on
Hinter einem Thruk-Loginscreen mit https und Passwort.
05.12.2016 www.consol.de20
Seite
OMD 2016+ – SNMP-Traps
Ganz aktuell entsteht eine neue Art der Verarbeitung von SNMP-Traps.
Die coshsh-Klasse weiß, welche Mibs dazugehören
class VNXStorageprocessor(coshsh.application.Application):template_rules = [
coshsh.templaterule.TemplateRule(needsattr=None,
template="os_vnx_default"),
coshsh.templaterule.TemplateRule(needsattr='trap_events',
template="os_vnx_traps"),
]
implements_mibs = ['CLARIION-MIB']
05.12.2016 www.consol.de22
Seite
OMD 2016+ – SNMP-Traps
Die Mib wird mit snmptt konvertiert, Ausnahmen werden eingetragen
# Unisphere can no longer manage (SP B). This does not impact server I/O to the storage systemEVENT EventMonitorTrapError .1.3.6.1.4.1.1981.0.5 "Status Events" OKFORMAT An Error EventMonitorTrap is generated in. Host is $1. $2, $4, $5 (identifier=$3) (severity=INFO)MATCH $3: 743a
EVENT EventMonitorTrapError .1.3.6.1.4.1.1981.0.5 "Status Events" CRITICALFORMAT An Error EventMonitorTrap is generated in. Host is $1. $2, $4, $5 (identifier=$3) Event ID = $3SDESCAn Error EventMonitorTrap is generated inresponse to a user-specified event.Details can be found in Variables data.Variables:1: hostName2: deviceID3: eventID4: eventText5: storageSystem
EDESC
05.12.2016 www.consol.de23
Seite
OMD 2016+ – SNMP-Traps
05.12.2016 www.consol.de24
Und coshsh generiert passive Services für jeden Trap, der in
dieser Mib vorkommt.
Ein snmptrapd schreibt in ein Logfile. Coshsh generiert einen
Service, der dieses Logfile liest und der Traps als passive
Checkresults richtig zustellt. (Neu: UDP-Paket-Multiplizierer)
Seite
OMD 2016+ Netzwerkgeräte
Derzeit wird evaluiert, wie man Portstatistiken von
Netzwerkgeräten mit dem SNMP-Exporter und Prometheus
sammelt.
Nur noch der Hardwarezustand und komplexere Abfragen
(BGP, OSPF mit mehreren Kontexten, Loadbalancer…) mit
check_nwc_health.
05.12.2016 www.consol.de25
Seite
OMD 2016+ Cloud-Infrastrukturen
Noch in der Schublade:
Coshsh-Klasse und –Template für OpenStack
generiert Nagios-Services für die Infrastrukturdienste
Nova/Cinder/….
05.12.2016 www.consol.de26
Seite
OMD 2016+ Mesos
Derzeit läuft auch eine Evaluierung von DC/OS (Mesos), um
analog zu OpenShift/Kubernetes eine Musterlösung auf Basis
von OMD zu erarbeiten.
05.12.2016 www.consol.de27
Seite
OMD 2016+ Notifications
Nagios kann auf tausend Arten Alarme verschicken.
Prometheus bringt einen mächtigen Alertmanager mit.
Wir haben noch keinen Plan, wie wir das unter einen Hut
bringen, aber es wird eine einheitliche Musterlösung geben.
05.12.2016 www.consol.de28
31Seite www.consol.de
ConSol Software GmbH
Franziskanerstraße 38
D-81669 München
Tel: +49-89-45841-100
Fax: +49-89-45841-111
www.consol.de
labs.consol.de
05.12.2016
Top Related