PowerPoint-Präsentation · •OMD 2016 –Was ist neu? ... •Aufbau von Know How in Ansible,...

31
OMD 2016+ Nürnberg, 30.11.16

Transcript of PowerPoint-Präsentation · •OMD 2016 –Was ist neu? ... •Aufbau von Know How in Ansible,...

OMD 2016+

Nürnberg, 30.11.16

Seite

Worum geht‘s?

• Wie und wann entstand OMD?

• Erste Projekte nach der Gründung.

• OMD 2015 – Labs Edition.

• OMD 2016 – Was ist neu?

• Stand heute – Installationen und Technologien.

• OMD 2016+ - Was steht bevor?

05.12.2016 www.consol.de2

Seite

2010 Open Monitoring Distribution

05.12.2016 www.consol.de3

v.l.n.r

Lars Michelsen

Wolfgang Barth

Gerhard Laußer

Mathias Kettner

Jörg Linge

Sven Nierlein

Stefan Hösl

Seite

2010 installierte man ein Monitoring mit…

• Download nagios-x.y.z

• ./configure; make; make install

• Download nagios-plugins-x.y.z

• ./configure; make; make install

• Download pnp4nagios-x.y.z

• ./configure; make; make install

• Frickel

• Frickel

• Frickel

• Frickel

05.12.2016 www.consol.de4

Seite

Seit OMD installiert man ein Monitoring mit

• yum install omd-1.30

• omd create site

• omd start site

• Gaaaaanz wenig Frickel

• Gaaaaanz wenig Frickel

• Gaaaaanz wenig Frickel

05.12.2016 www.consol.de5

Seite

Erste nennenswerte Projekte mit OMD

• Landeshauptstadt München

– Monitoring sämtlicher IT-Komponenten

• Automobilhersteller

– Betriebssystemmonitoring aller Unix/Linux-Server

– Applikationsmonitoring mit Selbstbedienungsportal

– Datenbankmonitoring SaaS

• Deutsche Pfandbriefbank

– End-to-End-Monitoring mit Sakuli, SAP-Businessprozesse

• Lidl

– 200 Lagerhäuser, Geschäftsprozesse, Logistik

05.12.2016 www.consol.de6

Seite

Neue Technologien – mehr Tempo

Mehrere OMD-Addon-Pakete für diverse Kunden entstanden

Immer öfter tauchten auf der OSMC Tools wie Grafana oder

Graphite auf. Allerdings ohne einfache Integration.

Häufig verwendete bzw. sich schnell entwickelnde Plugins.

Die OMD-Labs-Edition entstand, damit über Nacht neue

Funktionen reingebracht werden konnten.

05.12.2016 www.consol.de7

Seite

OMD Labs-Edition

Nagios Icinga

Monitoring-PluginsJmx4Perl

Dokuwiki Thruk

Nagvis

PNP4Nagios

Shinken

MongoDB

MySQL

Apachecheck_logfiles

check_mysql_health

check_oracle_health

check_multi

Mod-Gearman

check_webinject InfluxDB

Elastic Search

Icinga2

FreeTDS

check_mssql_health

Grafana

Naemon

check_nwc_health

coshsh

HTTPS

Seite

OMD Labs-Edition

Standard-OMD OMD-*-Add-on

OMD-*-Add-on

OMD-*-Add-on

Standard-OMD

Standard-OMD

OMD Labs-Edition OMD-*-Add-on

OMD-*-Add-on

OMD-*-Add-on

OMD Labs-Edition

OMD Labs-Edition

Best Practice

und

Gemeinsamkeiten

in den Add-ons

wandern in die

Labs-Edition.

Dadurch werden

die Add-ons

wartungsfreundlicher

und die Labs-Edition

praxiserprobter.

Seite

OMD Labs 2015 – Modernere Graphen

Als Alternative zu PNP4Nagios/RRD können Perfdaten

– in einer InfluxDB gespeichert

– und mit Grafana angezeigt werden

Einfach mit

omd config set influxdb on

omd config set grafana on

omd config set nagflux on

und Templates srv-perf und host-perf

05.12.2016 www.consol.de10

Seite

OMD Labs 2015 – Modernere Graphen

Als Popup

oder Dashboard

05.12.2016 www.consol.de11

Seite

OMD Labs 2015 – Modernere Graphen

Und weil in OMD nichts reinkommen soll, nur weil es cool ist,

sondern weil es einen Mehrwert bietet….

werden z.b.

• Downtimes ausgegraut

• tauchen ACK-Texte als

Popup auf

• werden Schwellwerte so

angezeigt, wie sie waren

05.12.2016 www.consol.de12

Seite

OMD 2016

• Die größte Installation umfasst 200 weltweite Standorte mit

jeweils eigenem OMD, zusammengefasst in 3 Thruk-Ebenen.

• Aufbau von Know How in Ansible, daher wurde Ansible 2.x in

OMD Labs aufgenommen.

Neuinstallation und Updates per Ansible.

Plugin-Verteilung per Ansible.

Inter-Site-Connections (ssh-Tunnel) per Ansible

05.12.2016 www.consol.de13

Seite

OMD 2016 – Installationen auf reiner Labs-Basis

Mittlerweile gehören zum Portfolio:

• Coshsh – Konfigurationsgenerator

• dataScryer – Prediction auf Basis von InfluxDB

• check_*_health

• check_nsc_web – Client für NSClient++ (https/Rest)

• Icinga2

Security-Audits sind kein Problem mehr, sämtliche

Kommunikation läuft über ssh und https.

05.12.2016 www.consol.de14

Seite

OMD 2016 – Sogar 2 Icinga2

Die Kunden wollten es halt….

Da aber jeder auf Thruk als GUI besteht, wurde gebastelt,

denn von Haus aus

braucht Thruk nagios.log

oder seine eigene DB

05.12.2016 www.consol.de15

Seite

OMD 2016 – LMD

Hunderte Backends hinter einem Thruk können sich zäh

anfühlen.

Tausende Backends sollen aber möglich sein.

Livestatus-Implementierungen sind unterschiedlich/buggy

Livestatus Multi Daemon ist ein

• Cache

• Aggregierer

• Sortierer

• Formatierer

05.12.2016 www.consol.de16

Seite

OMD 2016 – omd config set prometheus on

05.12.2016 www.consol.de17

Seite

OMD 2016 – Prometheus

Immer öfter trifft man auf Docker, Openstack, OpenShift,

Kubernetes, Mesos, etc., auch wenn man sich bisher in ganz

klassischen IT-Umgebungen aufgehalten hat.

Diese hochdynamischen Landschaften passen nicht zu

statischen Konfigurationsdateien und auch nicht zu Monitoring-

Systemen, die bei jedem Update durchgestartet werden

müssen bzw. deren GUI nicht aktuell gehalten werden kann.

Updates per API oder Hinterherhecheln mit coshsh passen

nicht.

05.12.2016 www.consol.de18

Seite

OMD 2016 – Prometheus

Die genannten Plattformen bringen bereits Prometheus-

Schnittstellen mit.

Software wird bewusst mit Prometheus-Instrumentierung

entwickelt.

Das Naheliegendste war, OMD um ein adäquates Tool zu

erweitern, um beide Welten aus einer Hand abdecken zu

können.

Prometheus breitet sich rasend schnell aus, dürfte der

Platzhirsch sein/werden und „fühlt“ sich richtig an.

05.12.2016 www.consol.de19

Seite

OMD 2016 – Prometheus

Bestandteil von OMD sind

• Prometheus

• Alertmanager

• node_exporter

• blackbox_exporter

• Pushgateway

Alles wie gehabt in eigenen Sites, mit gewohnten Kommandos

omd config set *** on

Hinter einem Thruk-Loginscreen mit https und Passwort.

05.12.2016 www.consol.de20

Seite

OMD 2016 – Erste POC-Installationen Prometheus

05.12.2016 www.consol.de21

Seite

OMD 2016+ – SNMP-Traps

Ganz aktuell entsteht eine neue Art der Verarbeitung von SNMP-Traps.

Die coshsh-Klasse weiß, welche Mibs dazugehören

class VNXStorageprocessor(coshsh.application.Application):template_rules = [

coshsh.templaterule.TemplateRule(needsattr=None,

template="os_vnx_default"),

coshsh.templaterule.TemplateRule(needsattr='trap_events',

template="os_vnx_traps"),

]

implements_mibs = ['CLARIION-MIB']

05.12.2016 www.consol.de22

Seite

OMD 2016+ – SNMP-Traps

Die Mib wird mit snmptt konvertiert, Ausnahmen werden eingetragen

# Unisphere can no longer manage (SP B). This does not impact server I/O to the storage systemEVENT EventMonitorTrapError .1.3.6.1.4.1.1981.0.5 "Status Events" OKFORMAT An Error EventMonitorTrap is generated in. Host is $1. $2, $4, $5 (identifier=$3) (severity=INFO)MATCH $3: 743a

EVENT EventMonitorTrapError .1.3.6.1.4.1.1981.0.5 "Status Events" CRITICALFORMAT An Error EventMonitorTrap is generated in. Host is $1. $2, $4, $5 (identifier=$3) Event ID = $3SDESCAn Error EventMonitorTrap is generated inresponse to a user-specified event.Details can be found in Variables data.Variables:1: hostName2: deviceID3: eventID4: eventText5: storageSystem

EDESC

05.12.2016 www.consol.de23

Seite

OMD 2016+ – SNMP-Traps

05.12.2016 www.consol.de24

Und coshsh generiert passive Services für jeden Trap, der in

dieser Mib vorkommt.

Ein snmptrapd schreibt in ein Logfile. Coshsh generiert einen

Service, der dieses Logfile liest und der Traps als passive

Checkresults richtig zustellt. (Neu: UDP-Paket-Multiplizierer)

Seite

OMD 2016+ Netzwerkgeräte

Derzeit wird evaluiert, wie man Portstatistiken von

Netzwerkgeräten mit dem SNMP-Exporter und Prometheus

sammelt.

Nur noch der Hardwarezustand und komplexere Abfragen

(BGP, OSPF mit mehreren Kontexten, Loadbalancer…) mit

check_nwc_health.

05.12.2016 www.consol.de25

Seite

OMD 2016+ Cloud-Infrastrukturen

Noch in der Schublade:

Coshsh-Klasse und –Template für OpenStack

generiert Nagios-Services für die Infrastrukturdienste

Nova/Cinder/….

05.12.2016 www.consol.de26

Seite

OMD 2016+ Mesos

Derzeit läuft auch eine Evaluierung von DC/OS (Mesos), um

analog zu OpenShift/Kubernetes eine Musterlösung auf Basis

von OMD zu erarbeiten.

05.12.2016 www.consol.de27

Seite

OMD 2016+ Notifications

Nagios kann auf tausend Arten Alarme verschicken.

Prometheus bringt einen mächtigen Alertmanager mit.

Wir haben noch keinen Plan, wie wir das unter einen Hut

bringen, aber es wird eine einheitliche Musterlösung geben.

05.12.2016 www.consol.de28

29Seite

Bewerben!

05.12.2016 www.consol.de

30Seite

Fragen?

05.12.2016 www.consol.de

31Seite www.consol.de

ConSol Software GmbH

Franziskanerstraße 38

D-81669 München

Tel: +49-89-45841-100

Fax: +49-89-45841-111

[email protected]

www.consol.de

labs.consol.de

05.12.2016