ClusterLion. Unternehmenskritische Applikationen müssen heute jeder Zeit verfügbar sein!...

ClusterLion

Unternehmenskritische Applikationen müssen heute jeder Zeit verfügbar sein!

Hochverfügbarkeit der IT „Heute eine Grundlage und keine Option“

Die meisten Branchen sind heute von einer funktionierenden IT abhängig.

Daher ist permanente IT Verfügbarkeit „Always-ON“ für viele Unternehmen eine Grundvoraussetzung und keine Option mehr.

Jeder Ausfall kostet Geld und Image!

Die Werte der Branchen und Studien variieren, doch fest steht, IT Downtime verursacht beträchtlichen Schaden!

Wie viel kostet IT Downtime?

Redundante Hardware Kein single Point of Failure innerhalb der Systeme Zumindest zwei räumlich getrennte Rechenzentren Synchrone Datenspiegelung Cluster Technologie für transparenten Site Failover

Doch auch in der Cluster Technologie gibt es Szenarien, wo das zentrale System ausfallen kann.

In diesem Fall entsteht beträchtlicher Schaden für das Unternehmen!

Hochverfügbarkeit erreichen

Was ist ein Split Brain Zustand? Wikipedia: Split Brain ist in der Informatik

ein unerwünschter Zustand eines Computerclusters, bei dem alle Zwischenverbindungen zwischen den Clusterteilen gleichzeitig unterbrochen sind.

Zur Koordination der Transaktionen im Cluster wird in der Regel ein Cluster Interconnect verwendet. Wird die Verbindung zwischen einem oder mehreren Teilen des Clusters über diesen Weg unterbrochen, kann keines noch unterscheiden ob es sich um einen partiellen Ausfall oder eine Trennung handelt. Alle diese (nun isolierten) Clusterfragmente arbeiten für sich weiter, um die Bereitstellung des Dienstes aufrechtzuerhalten.

Srvc(a)

Heartbeat

Hardware Fehleraktiv/aktiv

Cluster

o Beispiel: Hardware Ausfallo Cluster Service (a) wird automatisch auf den zweiten Cluster Node

gestartet (Takeover)

Srvc(b)Srvc(a)

Leitungsausfall

o Beispiel: Leitungsausfallo Cluster Services werden nicht automatisch übernommen, jede Site

läuft autark weiter. o Sobald die Leitungen wieder verfügbar sind, werden die Daten

synchronisiert und der Cluster befindet sich wieder im Normalzustand.

Heartbeat

aktiv/aktiv

ClusterSrvc(a) Srvc(b)Srvc(a)

o Beispiel: Stromausfall im Rechenzentrumo Der Cluster weiß nun nicht ob es sich nur um einen Leitungsausfall

oder um einen Stromausfall handelt! Service (a) wird nicht automatisch übernommen!

o Service (a) geht nun offline!o Nur durch einen manuellen Takeover oder einen dritten Standort

(Quorum) kann das Service übernommen werden.

Desasterfall, Stromausfall, etc.

aktiv/aktiv

Cluster

Heartbeat

Srvc(b)?Srvc(a) Manual Cluster Takeover

Srvc(a)

7-Mode MetroCluster

BSrvc (b)

cf giveback

A3A3A2A1

B4B3B2B1

Srvc (a)

system01 failed !takeover!

stretched HA

A/A Controller Failure Scenario1. 1st Controller fails2. Identity „moves“ to 2nd controller3. I/O passes through 2nd controller4. After repairing1st controller,

issue „cf giveback“5. Identity „moves“ back to 1st controller6. Normal operations continues

7-Mode MetroCluster

Srvc (a) Srvc (b)

MC Site Failure Scenario1. Entire Site A fails2. 2nd controller checks heartbeat, disk-

connections and IP connection while still serving it‘s data

3. Human or process on 3rd Site identifies site-failure

4. Issue „cf takeover –d“5. Identity „moves“ to second controller

SiteA down orsite-connection broken?cf takeover -dcf giveback

MC FabricSrvc(b)Srvc(a)

cDOT MetroCluster, local HA

no automatic Takeover between Datacenter

stretched HAlocal HA local HA

Data ONTAP 8.3MetroCluster Management und Desaster Recovery Guide

ClusterLion, die Lösung!

UPSGrid100m

EthernetRS232

QRemote Quorum

EthernetRS232

Monitoring:• Power• Storage Controller • Partner Status • Heart-Beat

1. Reporting:• A1: Lost Cluster Partner• B1: Lost Cluster Partner• A2: not responding any more• B2: not responding any more

2. Action:• A2: Power off• B2: Power off• A1: force Takeover • B1: force Takeover• Q: Open Helpdesk Ticket

Takeover

ClusterLion-AP (Advanced Protection)

open TicketPartner Helpdesk

Support Customer during Giveback

Telco BTelco A

Use Case: Site Desaster

UPSGrid

MC Fabric

“Giveback”

A1B1 A2B2

Srvc(b)Srvc(a) Srvc(b)

ClusterLion-AP erhöht die Verfügbarkeit eines zwei-Standorte Storage Clusters!

Deutlich geringere Kosten im Vergleich zu einem traditionellen Quorum Standort (Leitungskosten, Betriebskosten, Aministration)!

Selbst bei einem Site Desaster (K-Fall) an einem Standort werden die Cluster Services ordnungsgemäß übergeben und alle Applikationen bleiben verfügbar!

Durch lokales Abschalten wird eine Dateninkonsistenz aufgrund eines Split Brain Syndroms durch ClusterLion ausgeschlossen!

An jedem bestehenden NetApp MetroCluster kann ClusterLion unterbrechungsfrei nachgerüstet werden und so die Verfügbarkeit der unternehmenskritischen Applikationen weiter steigern!

Vorteile durch ClusterLion-AP

Alleinstellungsmerkmal (USP) speziell in NetApp MetroCluster Projekten!

Höhere Marge durch den Verkauf von zusätzlichen Services (Premium Contract)!

„Door opener“ bei Bestandskunden der Mitbewerber! Vorteil bei Ausschreibungen durch geringere TCO im

Vergleich zu einem 3 Standorte Konzept! Technisch valide Antwort auf Witness-Konzepte der

Mitbewerber (z.B. EMC vplex, etc.) Höhere Sicherheit und Verfügbarkeit für den Kunden!

Mehrwert für ClusterLion Reseller

Basiert auf HighEnd Industrie Komponenten Überwacht Stromversorgungen, Netzwerk,

Interconnects und die Dienste des Clusters. Kommuniziert über zwei getrennte und vom Cluster

unabhängige Kommunikationskanäle. Bei Beeinträchtigung der Storage Services wird ein

automatischer Takeover im Storage Cluster ausgelöst und die Gefahr von Split-Brain mit Garantie ausgeschlossen.

Die Storage Services laufen weiter – keine Downtime!

ClusterLion im Detail

7x24 Telefon Support Proaktive Benachrichtigung des Kunden Automatisches Support Ticket am Partner Helpdesk Unterstützung beim Cluster Giveback

Premium Support f. Partner

ClusterLion ohne Frontblende „hot swap“ Battery

ClusterLion (front view)

4x Power Input 4x Power Output (UPS max. 1.100W) 2x Cooling Fans 2x 24V Output for UMTS Gateways Reset Button 2x Serial Consol Port 6x Ethernet Connectivity

ClusterLion (rear view)

...ob man sich einen Betrieb ohne

ClusterLion leisten kann?

Vielen DANK!Die Frage ist nicht ob man sich ClusterLion

leisten kann? Sondern...

ClusterLion. Unternehmenskritische Applikationen müssen heute jeder Zeit verfügbar sein!...

Documents

Transcript of ClusterLion. Unternehmenskritische Applikationen müssen heute jeder Zeit verfügbar sein!...

dem Applikationsserver WebLogic ...alt.java-forum-stuttgart.de/jfs/2009/folien/E2.pdf · Hochverfügbarkeit mit dem Applikationsserver

Fact Sheet Continuity Service - hornetsecurity.com€¦ · Continuity Service in Sekundenschnelle für die kontinuierliche Verfügbarkeit des E-Mail-Verkehrs. CONTINUITY SERVICE Hochverfügbarkeit

„Mein Leben mit Oracle Exadata“ · • Experten mit über 30 Jahren Oracle Erfahrung • Spezialisten für – Backup & Recovery – Hochverfügbarkeit – Healthchecks – Performance

Icinga 2 - Integrierte Hochverfügbarkeit (Webinar vom 07. Oktober 2014)

Einführung in die Oracle Datenbankarchitekturblogs.gm.fh-koeln.de/faeskorn/files/2015/05/Einführung-in-die... · das Thema Oracle Datenbanken •Schwerpunktthemen: Hochverfügbarkeit,

Leseprobe - Carl Hanser Verlagfiles.hanser.de/Files/Article/ARTK_LPR_9783446442627... · 2015-02-11 · Leseprobe Ulrich B. Boddenberg SQL Server 2014 für Professionals Hochverfügbarkeit,

Hochverfügbarkeit / Konsolidierung mit der SE1 / 2 …Alternative: HA mit Oracle GI (2) •Vorteile –Datenbank(en) als Cluster-Ressource(n) –Weiterhin Verwendung der bestehenden

PRIMECLUSTER™ - Fujitsumanuals.ts.fujitsu.com/file/4257/primecluster-rms-wiz...PRIMECLUSTER Reliant® Monitor Services (RMS) ist ein Softwaremonitor zur Gewährleistung von Hochverfügbarkeit

mueller@b1-systems · IaaSCloud(NativeOpenStack&SUSECloud&RedHat OpenStackPlatform) Hochverfügbarkeit(Pacemaker) SharedStorage(GPFS,OCFS2,DRBD&CEPH) Dateiaustausch(ownCloud) Paketierung

Intelligentes Backup & Recovery für FileNet P8 Content … · Intelligentes Backup & Recovery für FileNet P8 Content Manager IBM FileNet P8 Content Manager ist eine unternehmenskritische

Daran habe ich heute gearbeitet! - Zaubereinmaleins · Heute habe ich etwas herausgefunden! Heute möchte ich euch etwas zeigen! Heute möchte ich euch etwas zeigen! Heute habe ich

Johannes Ahrends CarajanDB GmbHblogs.gm.fh-koeln.de/faeskorn/files/2014/01/Ahrend... · •Hochverfügbarkeit (RAC, Data Guard, Failsafe, etc) •Einsatz der Oracle Standard Edition

Hadoop im Unternehmenseinsatz - inovex.de · Seit 2005 in der Software-Entwicklung im Internet-Portalbereich tätig Java, Hadoop, verteilte Systeme, Hochverfügbarkeit, SOA, Architektur,

Hochverfügbarkeit Fehlertoleranz, Clustering ...gwise.itwelzel.biz/CDROMs/AWI/LL/LL02.pdfhaben keine definierte Verbindung zu-einander, die De-Registrierung des Mit-arbeiters wird

Hochverfügbarkeit mit Windows Server vNextdownload.microsoft.com/download/2/1/B/21B9EC98-3F97-47F8...Windows Server 2012 R2 und Windows Server vNext gemeinsam betreiben Roling Cluster

LET`S TALK GEMACHT FÜR KOMMUNIKATION …€¦ · CRM / ERP Integration Hohe Skalierbarkeit Hochverfügbarkeit Herstellerunabhängig Modulare Bauweise Webbasierter Client Frei konﬁ

X10sure TM Einfache & günstige Hochverfügbarkeit R+M Techno Summit 2007 René Hübel IP Solution Marketing, Juli 2007.

Load Balancing & SSL Acceleration Hochverfügbarkeit für MS Exchange & Lync InfoNet Day 2012 smart outcome GmbH, Effretikon.

Www.decon-its.de 1 Hochverfügbarkeit von Rechnersystemen Michael Gammelin DECON Informations Technologie Lösungen GmbH.

Vereinfachtes Scannen. Document Capture Automatische ... · Wandeln Sie Papier schnell in hochwertige Bilder um. Erfassen und indizieren Sie unternehmenskritische Daten und geben