TechTalkThursday 27.10.2016: Redundante Linux Failover Cluster

TECHTALKTHURSDAY MULTISITE FAILOVER CLUSTER / ÖFFENTLICH ROMAN PLESSL Version 1.0

Version 1.0

#TechTalkThursday

Version 1.0

#TechTalkThursday

REDUNDANTER LINUX FAILOVER CLUSTER

… WIE KANN ICH MEINE VERFÜGBARKEIT UND MEINE UPTIME ERHÖHEN?

https://xkcd.com/705/

Version 1.0

#TechTalkThursday

THEMEN1. MOTIVATION / AUSGANGSLAGE

2. SPIELRAUM UND ANFORDERUNGEN

AN MMFC VER. 2

3. NETZWERK

4. LINUX IMPLEMENTATION MMFC

5. DEMO

Version 1.0

#TechTalkThursday

MOTIVATION / AUSGANGSLAGEVORHANDENE SITUATION

• Bisherige bestehende Failover Systeme sind in einem Datacenter

• Vorteile:

• KISS: Keep it simple [and] stupid

• Ausfallsicherheit mit Redundanz gegenüber Hardware Fehler (Server, Netzwerk,

Power)

• Redundanz im Netzwerk-Design (alles ist redundante aufgebaut und

eingestöpselt)

• Failover ist schnell

• Schwächen:

• Connectivity - Bei einem «fettem» Netzwerk-Verkehr wie DDoS auf einen

beliebigen Host im gleichen Rack oder auch Datacenter sind auch andere

Serversysteme und so auch die Failover Systeme betroffen

• Gesamter Ausfall eines Datacenters (Stromunterbruch,

Netzwerk-Fehl-Konfiguration, Naturgewalten) ist nicht abgedeckt

Version 1.0

#TechTalkThursday

SPIELRAUM FÜR MMFC 2.0 MANAGED MULTISITE FAILOVER CLUSTER

Wünsche an ein neuen Multisite Failover Cluster System:

• Betrieb ist standortunabhängig (räumlich und entfernt örtlich) georedundant ✔

• Betrieb hat mehr als einen Stromlieferanten und USVs Strom 2x ✔

• Gespiegeltes Server und Cluster System HW 2x ✔

• Redundanz im Netzwerk (Core, Distribution, Upstream) Netzwerk ✔

• Dedizierter Quorum Server für Königsmacher an einem dritten Standort Quorum ✔

• Gleichbleibende IPs unabhängig vom aktiven Standort (Multisite Virtual IPs) IPv4 ✔

Version 1.0

#TechTalkThursday

SPIELRAUM FÜR MMFC 2.0 MANAGED MULTISITE FAILOVER CLUSTER

Linux Server – Netzwerk Wünsche zur Konnektivität:

• Netzwerk zum Server wird per LACP gebündelt Switchausfall ✔

• Announcing der Route per BGP an beide Distribution RouterDistribution Router Ausfall ✔

• Unabhängige Core Router Router Ausfall ✔

• Multi Upstream ProviderUpstream Ausfall ✔

Datacenterausfall:

• Switching muss dann sehr schnell gehen, aber im Normal- BGP mit BFD ✔

Fall wollen wir vom Routing her träge sein

• Inhalte sollen dann schnell ausgeliefert werden Caching ✔ ggf. mit Vorglühen

Bestehende Resourcen nutzend

• Lastspitzen werden optimal mit der bestehenden Infra- Load Balancer ✔

struktur abgedeckt

Version 1.0

#TechTalkThursday

NETZWERKVORHANDENE SITUATION NINE.CH BACKBONE

• Layer3 only Backbone

• Segmentierte IP Bereiche

• OSPF zwischen Core Routern und Core zu Distribution Layer

• BGP nur auf Core Layer

• Brocade VCS Fabrics pro Segment Distribution/Access

• Redundanz

Schwächen:

• Keine aktive Kommunikation mit einem Server wie sein „Status“ ist

• IP Adresse „kann“ nur an „einem“ Ort im Netz vorhanden sein

Version 1.0

#TechTalkThursday

NETZWERKPROBLEM ZUR LÖSUNG?

• Protokolle

OSPF, IS-IS, Static, RIP(v2), BGP

• Failover

Ausfall Server

Ausfall Router

Auf Befehl

• Speed

Protokoll träge und langsam

• Sicherheit

Wer darf was senden?

Version 1.0

#TechTalkThursday

NETZWERKLÖSUNG NETZWERK SICHT

• Distribution Layer spricht BGP mit Server

• Communities

• Aktive Sessions mit oder ohne Prefix

• Prefix Filter

• Redistributing in OSPF

• Segmente sprechen iBGP untereinander

• BFD in Richtung Server aktiv

• Kein iBGP zwischen Distribution und Core

• Failover nach ca. 500ms

• BGP Sessions zu beiden Routern pro Segment

• Aktive BGP Sessions an beiden Standorten mit aktiven Prefixes

Version 1.0

#TechTalkThursday

LINUX IMPLEMENTATIONBGP HANDLING AUF DEM SERVER

BIRD Internet Routing Daemon (http://bird.network.cz)

für die eBGP Kommunikation zwischen den Servern und Netzwerk Endpunkten

• Always – on: 2 x 2 BGP Sessions hin zu 2 Routern

• IPs können zwischen den beiden Hosts und DCs innerhalb von 2 Sekunden effektiv

migriert werden

• BFD Fail Action ist schneller

• Die Linux Routing Table gibt dynamisch bekannt, welche IP auf dem Host aktiv ist …

• … und so auch per BGP exportiert wird.

Version 1.0

#TechTalkThursday

LINUX IMPLEMENTATIONSAVE STATE HANDLING

3 Node Clusters mit Quorum

• Was passiert, wenn ein Multisite Failover Cluster Node und der Quorum Node ausfallen?

• Multisite DRP

Version 1.0

#TechTalkThursday

DEMOSERVICE MIGRATION

Version 1.0

#TechTalkThursday Nine Internet Solutions AG

Albisriederstr. 243a

CH-8047 Zürich

Tel +41 44 637 40 00

Fax +41 44 637 40 01

info@nine.ch

FRAGEN?

Version 1.0

#TechTalkThursday Nine Internet Solutions AG

Albisriederstr. 243a

CH-8047 Zürich

Tel +41 44 637 40 00

Fax +41 44 637 40 01

info@nine.ch

DANKE FÜR DIE AUFMERKSAMKEIT!

TechTalkThursday 27.10.2016: Redundante Linux Failover Cluster

Internet

Transcript of TechTalkThursday 27.10.2016: Redundante Linux Failover Cluster

Einrichten für das Failover-Clustering und Microsoft ... · PDF filedie mithilfe von virtuellen Maschinen mit Microsoft Cluster Service für Windows Server 2003 und Failover-Clustering

TechTalkThursday 14.07.2016: Netzwerk-Infrastruktur bei nine.ch

Einrichten für das Failover-Clustering und Microsoft ... · die mithilfe von virtuellen Maschinen mit Microsoft Cluster Service für Windows Server 2003 und Failover-Clustering für

Cloud Failover in the flick of a switch - StorageCraft · 2020. 1. 7. · flick of a switch When you need to restore from the Cloud following a site-wide outage, are you confident

TechTalkThursday 27.10.2016: Ceph im NVME Cluster

VfW-Tätigkeitsbericht 2016 - Energiecontracting · VfW-Tätigkeitsbericht 2016 10 Der VfW 21.01.2016 BHKW-Grundlagen, Dortmund 27.10.2016 Wärmenetzförderung, Krefeld 15.11.2016

n vSphere 6 - VMware Docs Home · Fehler beim Mounten von NFS-Datenspeichern 67 Fehlerbehebung bei Speicheradaptern 67 Überprüfen der Metadatenkonsistenz mit VOMA 68 Kein Failover

50 Jahre Katholische Kirche Maria vom Frieden …...50 Jahre Katholische Kirche Maria vom Frieden Hertlingshausen Nr. 11/2016 vom 27.10.2016 bis 27.11.2016 KATHOLISCHER PFARRBRIEF

Next GEOSS – der neue europäische GEOSS Hub€¦ · Next GEOSS – der neue europäische GEOSS Hub DLR.de • Folie 1 J. Meyer-Arnek, A. Müller, G. Schreier . 27.10.2016, Oberpfaffenhofen

TechTalkThursday 26.11.2015: Zentrales Metriken-System - ist der Flügelschlag des Schmetterlings sichtbar?

TechTalkThursday 27.10.2016: upd89.org - Orchestrierung von Security-Updates für Linux-Serversysteme

AC 1961 DIN 27.10.2016 - storage.primariaclujnapoca.ro 1961 DIN 27_… · lucrariin de 28085,4 Ici In urmitoarele conditii: Lucrårile se vor executa in baza de sparg..re, cu din

374r das Failover-Clustering und Microsoft Cluster Service ... … · von Microsoft Cluster Service oder Failover-Clustering. Hinweis In diesem Dokument gelten Verweise auf Microsoft

Herausforderung Digitalisierung - bezreg- · PDF fileHerausforderung Digitalisierung Mark Kleemann-Göhring - Supportstelle Weiterbildung - 17. Weiterbildungstag Ruhr am 27.10.2016

Der transparente Failover war - Fujitsu...* verfügbar und kostenfrei aus allen Netzen in D/A/CH die guten Erfahrungen mit dem Fujitsu-Partner Computer Stamm haben bei der Entscheidung

VERANSTALTUNGEN ZUM REFORMATIONSJUBILÄUM · Was Frauen über Jahrhunderte beweg(t)en - Ein ökumenischer Abend von Frauen. TTIP/CETA 27.10.2016 um 19.00 Uhr, Refektorium Die wirtschaftspolitischen

BielefeldTranslate this page mit neuem Markenauftritt (27.10.2016) Bielefeld hat einen neuen Markenauftritt mit einem neuen Stadtlogo. Die drei Anfangsbuchstaben „BIE“

Stand: 27.10.2016 (abgestimmt mit Herrn RA Meise, GF Semco) · schaften von ESG nachteilig verändern und ist normativ nicht geregelt. • Der minimale Abstand zwischen Isolierglasscheibe

1.9 Wahlstudien - Bibliografie - bundestag.de · DHB Kapitel 1.9 Wahlstudien - Bibliografie 27.10.2016 Seite 3 von 18 Wahljahr Titel der Wahlstudien Feld, Lars P. und Gebhard Kirchgässner:

27.10.2016 Chamer Zeitung, Amt durchlöchert Boden um ... · ke tten unter we gs. Ler ch sagt, es heiße ko mbiniertes Dreh- und Rammkernbohrgerät. Damit schla-gen die Arbeiter Metallrohre