Warum eigentlich Cloud?

Post on 13-Apr-2017

1.766 views 0 download

Transcript of Warum eigentlich Cloud?

Warum eigentlich Cloud?Kristian Köhntopp

Cloud Architect Alter Sack

26. November 2015

Devops und Cloud Computing

gehen Hand in Hand

2

Was ist uns in den letzten 15 Jahren eigentlich passiert?

– Rajat Bhargava, http://devops.com/features/devops_and-enterprises/

„DevOps and Enterprises:It's a culture thing.“

4

Einflüsse

Wirtschaftliche Einflüsse: Marktreife und Prozeßreife

5

Wirtschaftliche Einflüsse: Marktreife6

Pre-Dotcom: Kein Business-

Modell

Keine Best Practices

Qualitative Best Practices

Metriken, KVP

Public Domain via Public Domain via https://en.wikipedia.org/wiki/File:Characteristics_of_Capability_Maturity_Model.svg

Wirtschaftliche Einflüsse: Prozeßreife7

OutsourcingmöglichUnklar,

was gekauft/

verkauft worden ist

WiederholungVeränderung

Public Domain via https://en.wikipedia.org/wiki/File:Characteristics_of_Capability_Maturity_Model.svg

Technische Einflüsse: Scale-Up vs. Scale-Out

8

Erkenntnis um 2002:“Scale Up” funktioniert nicht.

©2002 Kristian Köhntopp

“Scale Out” tut super.Resultat: Moar Boxes!!1!eins!!elf!!!

http://www.google.com/about/datacenters/gallery/#/tech/12

Hilfe, mein Computer hat zu viel Bumms!http://hpserver.by/images/detailed/1/hp_dl380p_gen8_inside_in_t7e8-xt.jpg © 2014 HP Press Material

http://hpserver.by/images/detailed/1/hp_dl380p_gen8_inside_in_t7e8-xt.jpg © 2014 HP Press Material

CPU

used 8

unused 40

RAM

used 16

unused 240

CPU

used 4

unused 44

RAM

used 8

unused 248

Java Appserver

PHP Appserver

Wir virtualisieren!13

Hardware Node

vSwitchvRouter

VM VM VM VM VM

DevOps als Reaktion auf Einflüsse aus dem Umfeld

BOFH: “Bastard Operator From Hell”Cat-5-O-Nine-Tails und Kekse von Antje Bendrich, Dezember 2008

Pre-DevOps (First Edition: 2001)via http://geek-whisperers.com/wp-content/uploads/2014/11/thomas-limoncelli.jpg

DevOps: Patrick Debois (2008, Belgien)Währenddessen in Amsterdam…

Booking.com Office, 2008

ITIL vs. DevOps?

Noch so einScale-Up vs. Scale-Out Ding…

18

Kennzeichen einer modernen Entwicklungsumgebung19

• Automated Infrastructure

• Shared Version Control

• One Step Build and Deploy

• Feature Flags, Graceful Degradation

• Test and Measure all the things

• Instant Communication

nach John Allspaw (2009), http://www.slideshare.net/jallspaw/10-deploys-per-day-dev-and-ops-cooperation-at-flickr

SystemsCode

DeployActivation

Failure detectionFixing

Technische und kulturelle Konvergenz20

• "Script all the things", "Centralize all monitoring", etc. pp.

• "System administration built in at development stage."

• Entwickler und Admins verwenden dieselben Tools

• "Dann kann man die beiden auch zusammenlegen."

➡ DevOps

21 DevOps

https://twitter.com/jezhumble/status/259368948859023362

Grundidee: Die Mauer muß weg.Brandenburger Tor, 1989 - Foto: Thomas 'tlr' Roessler

Und Operations?

23

Infrastructure as Code: Scriptbare Technik durch Virtualisierung mit einer API

Hardware als Skript: Infrastructure as Code25

Automated Infrastructure

Was braucht eine Instanz zum Booten?

• Boot Image zur Ephemeral Disk aufblasen

• Volume attachen

• Netz attachen

• VM starten

• DHCP

• Config: Hostname, Startscript

26

8 Cores32 GB RAM50 GB Ephemeral Disk

2 TB Persistent Volume

Was ist, wenn ein Host umfällt?

• Wichtig sind die persistenten Daten (das Volume)

• Der Rest kann schneller neu generiert werden als er restauriert werden kann.

• Vorbedingung: Das Setup ist vollständig automatisch generiert.

27

8 Cores32 GB RAM50 GB Ephemeral Disk

2 TB Persistent Volume

Puppet, Ansible, Salt, Chef

Automatisierte Systemadministration28

Branch Release

Fix

Merge

„Reproduzierbar. Parallelisierbar. Orchestrierbar.“

29

https://uksysadmin.files.wordpress.com/2011/03/openstackwallpaper1.png

Was braucht eine Instanz zum Booten?

• Boot Image zur Ephemeral Disk aufblasen

• Volume attachen

• Netz attachen

• VM starten

• DHCP

• Config: Hostname, Startscript

31

8 Cores32 GB RAM50 GB Ephemeral Disk

2 TB Persistent Volume

Glance

Cinder

Neutron

Nova

Harte Drei Buchstaben: SDS, SDN, SLA

Hardware als Skript: Infrastructure as Code33

Wie erreichen wir das?

Mehr als ein Computer…34

CPU, RAM

StorageNetwork

OverlayUnderlay

Es ist also komplizierter…

• Underlay:

• Mehrere Hosts (wieviele?), shared Storage, ausreichend Netzwerk-Kapazität

• Overlay:

• frei definierbare Netze, frei definierbarer Storage, definierbare Guests, definierbare Firewall- und Loadbalancer-Regeln

35

36

„Wo der Feenstaub herkommt…“

37

Harte Drei Buchstaben: SDS, SDN, SLA

Problem 1: Storage

• Filer?

• Pro: erprobte Technologie, angemessene Bandbreiten, separates Storage-Netz.

• Contra: wie skaliert das in der Größe und finanziell? separates Storage-Netz.

• Alternativen?

39

Distributed Filesystems

• 2 HE Box: CPU, RAM, Netz und Disk

• Aufgabe:

• Mache die lokalen Platten redundant im Cluster verfügbar.

• “Jeder Disk Write ist 2-3 Netzwork Writes.”

• Folgeproblem:

• Netz

40

Harte Drei Buchstaben: SDS, SDN, SLA

Problem 2: Netzwerk-Kapazität

• Platten und CPU in Hosts für Storage mitnutzen.

• HDFS, Ceph, Quobyte, …

• 3 Kopien, mindestens eine Off-Rack

• Latenz? IOPS? Bandbreite?

• Wieviel Netz ist genug?

42

Mercury Redstone Connector MR-1 (1960) https://www.flickr.com/photos/jurvetson/5691350527 Steve Jurvetson (CC-BY)

2005: 50 DL360 = 50 Cores, 50 GBit/s Netz, ~ 2 Racks

2015: 2 HE, 48 Cores, 2x 10 GBit/s Netz = ~40% Netz

Ohai, can I haz 2x 25 Gbit/s, plz?

„Be careful what you wish for!“

46

16 DL380 mit 2x 25 GBit/s pro Rack, Ceph (Symbolbild)

Top of Rack Switch

Kapazitätsproblem? Welches Kapazitätsproblem?48

18U Rack (resize vertically) 18U Rack (resize vertically) 18U Rack (resize vertically)

2x 10GBit/s Netz (2400 MB/sec) oder2x 25 GBit/s Netz(6000 MB/sec)

16x 2x 10GBit/s(320 GBit/s)

oder

16x2x 25 GBit/s(800 GBit/s)

Storage Traffic (Ost-West Traffic)(320 GBit/s, 800 GBit/s)

zum Internet (Nord-Süd Traffic)

Virtuelle Maschine

Volume

Terasort to watch the world burn49

http://www.slideshare.net/pramodbiligiri/shuffle-phase-as-the-bottleneck-in-hadoop-terasort by http://www.slideshare.net/pramodbiligiri/presentations

Meanwhile, at the Chocolate Factory…50

Google “Jupiter” Superblock, “1 Petabit/sec of total bisection bandwidth”© 2015 Google Presserelease

Konstruktionsprinzip: Leaf and Spine51

http://bradhedlund.com/2012/01/25/construct-a-leaf-spine-design-with-40g-or-10g-an-observation-in-scaling-the-fabric/

Netz >> Storage

• Sinnvoller Storage braucht also sinnvolles Netz

• “Leaf and Spine” braucht eine zentrale Flow-Steuerung

• Verschiedene Hersteller haben das begriffen.

• Aber es gibt keine großen, funktionierenden Deployments.

52

Contrail53

Midonet54

Harte Drei Buchstaben: SDS, SDN, SLA

Welche Ressource ist am knappsten?56

Ressourcen

• 48 Cores: • 256 GB RAM, 2x 10 GBit/s

• 12x 3TB Disk (200 IOPS ea) oder 7x 2TB SSD (20k IOPS ea)

• pro Core (“Compute Unit”)

• 5 GB RAM, 400 MBit/s, 50 IOPS Disk, 1500 IOPS SSD

57

Flavors

• “Compute Unit”: “1/48stel Rechner”

• 5 GB RAM, 400 MBit/s, 50 IOPS Disk, 1500 IOPS SSD

• Flavor:

• x Compute Units

• Flavor i = 2* Flavor (i-1)

• Kein Verschnitt

58

Isolation

• CPU Cores

• RAM

• Disk I/O (IOPS, MB/s)

• Netz I/O (Bit/s)

59

VMHost

Quota mit Token Bucket

Arrival Rate

Volumen = Elastizität

Verbrauch

Ein Image, viele Instanzen61

H

HardwareNode

Ubuntu14.04 LTS

Appserver 1

Appserver 2

DatabaseMaster

copyon

write

download

Glance

Mehr SSD

für alle!

• Virtualisierung ist High Density Computing.

• Das ist nicht billiger, nur anders.

• Insbesondere muß man sein Netz neu bauen.

• Das Thema SDN ist noch weitgehend unbearbeitet und eine weitaus härtere Nuß als alle anderen Themen.

63

• “Infrastructure as Code” ist cool.

• “Automatisierte Provisionierung”.

• Netzinsuffizienz scheint durch, wird als fsync/Commit Insuffizienz sichtbar.

64

65

?