Entwicklung der Supercomputer Funktionsweisen von ... · NVIDIA GeForce GT200 1063 GFLOPS Core i7...

Ein kleiner Einblick in die Welt der Supercomputer

Christian Krohn – 07.12.2010 1

Vorschub: FLOPS

Entwicklung der Supercomputer

Funktionsweisen von Supercomputern

Zukunftsvisionen

• Ein Top10 Supercomputer kostet fast 100Mio € lohnt sich das? Welchen Nutzen haben wir davon

Simulationen von komplexen Vorgängen z.B. Klimamodelle, Medizinische Forschung, Physik, Raumfahrt, Militär u.v.m.

Floating Point Operation per Second

Addition und Multiplikation von Fließkommazahlen

Benchmark LINPACK (Linear Algebra Package) ◦ Routinen zur Lösung linearer Gleichungssysteme

und anderer numerische Verfahren

Leistungsfähigkeit von Prozessoren

(Systemen)

Umstritten wegen unterschiedlicher Implementierungen (Schaltnetze)

Vektorprozessoren (u.a. GPU‘s) erreichen sehr hohe Werte: ◦ NVIDIA GeForce GT200 1063 GFLOPS ◦ Core i7 3,33Ghz 6 Kerne bis zu 80 GFLOPS

Moore-Kurve

Verdopplung der Rechengeschwin-digkeit alle 18 – 24 Monate

1941 Zuse Z3 2 FLOPS ◦ Erster frei programmierbarer digitaler Rechner, konnte zwei Additionen pro Sekunde

ausführen

1976 Cray-1 250.000.000 FLOPS ◦ Legendärer SC über 80 Stück verkauft in vielen Anwendungsbereichen

2002 NEC Earth Simulator 35.860.000.000.000 FLOPS ◦ Über 2 Jahre der schnellste Rechner der Welt (Globale Klimamodelle, Geophysik)

2008 IBM Roadrunner 1.105.000.000.000.000 FLOPS ◦ Erforschung der Alterung Radioaktiver Stoffe / Sicherheit alternder Kernwaffen und

Simulationen in vielen anderen Bereichen

2010 Tianhe-1A 2.507.000.000.000.000 FLOPS ◦ Derzeit leistungsstärkster Supercomputer der Welt in China

(2012+) Fujitsu baut SC in Japan an einem 10 PetaFLOPS System

(2012) IBM baut für die US-Energiebehörde ein 20 PetaFLOPS System

8 Quelle: http://de.academic.ru/pictures/dewiki/122/acabb8b6231978d3433982d511a35044.JPG

http://upload.wikimedia.org/wikipedia/commons/f/f7/Cray-1-deutsches-museum.jpg

http://upload.wikimedia.org/wikipedia/commons/1/18/EarthSimulator.jpg

http://upload.wikimedia.org/wikipedia/commons/c/c7/Roadrunner_supercomputer_HiRes.jpg

http://scr3.golem.de/screenshots/1010/Tianhe-Supercomputer/thumb480/Tianhe-1A.jpg

Alle modernen SC sind Parallelrechner ◦ Physikalische Grenzen machen zu hohe Taktraten

unmöglich

Operationen werden auf mehrere CPU‘s verteilt ◦ Programmierung sollte auf einzelne Parallel

arbeitende Prozessoren abgestimmt sein

◦ Je mehr Prozessoren vorhanden sind, desto schneller steigt der Kommunikationsaufwand überproportional an

Ressourcen wie Festplattenspeicher und Arbeitsspeicher werden gemeinsam genutzt

Die meisten modernen SC bestehen aus Skalaren Prozessorarchitekturen und Vektorprozessoren

Ein Befehl pro Prozessortakt

Jeder Befehl beinhaltet mehrere Teilaufgaben z.B.: ◦ A Befehlscode laden

◦ B Instruktionen dekodieren und Daten laden

◦ C Befehl ausführen

◦ D Ergebnisse zurückgeben

Pro Takt wird nur eine Teilaufgabe ausgeführt

Es werden mehrere Teilaufgaben Parallel erledigt

http://upload.wikimedia.org/wikipedia/de/6/6f/Befehlspipeline.PNG

Führen eine Operation gleichzeitig an vielen Daten (Array/Vektor) aus

Vektorprozessoren sind überlegen wenn viele Vektor – und Matrizenoperationen durchgeführt werden

X und Y sind Vektoren gleicher Länge und a ein Skalar

L.D F0, a ; Skalar a laden

LV V1, Rx ; Vector X laden

MULVS.D V2, V1, F0 ; Vector-skalarMultiplikation

LV V3, Ry ; Vector Y laden

ADDV.D V4, V2, V3 ; Vektor Addition

SV Ry, V4 ; Resultat speichern

Nur 6 Befehle für Vektorprozessoren

𝑌 = 𝑎 ∗ 𝑋 + Y

GPU‘s sind Vektorprozessoren

GPGPU – General Purpose Computation on Graphics Processing Unit ◦ Einbindung von GPU‘s in Computersysteme um

CPU‘s zu entlasten, da diese für Vektoroperationen ein vielfaches an Befehlen ausführen müssen.

Beowulf Cluster ◦ Parallel Computing mit normaler PC Hardware

◦ Organisation mithilfe:

Einer Server Node

Einer oder mehrere Client Nodes

Vernetzung in einem TCP/IP LAN

◦ Zerlegung des „Jobs“ in kleinere Teile und Verteilung auf die Nodes

◦ Kommunikation zwischen den Job-Teilen durch das Message Passing Interface (MPI)

http://upload.wikimedia.org/wikipedia/commons/4/40/Beowulf.png

Simulationen werden komplexer und benötigen mehr Rechenleistung

Optimistische Einschätzung der Bedarfsentwicklung für Rechenzeit vom Vorstandvorsitzenden des Jülicher Forschungszentrums: ◦ „Die Nachfrage nach Rechenzeit wird in den

nächsten fürn Jahren um Faktor 1000 steigen.“

Entwicklung der Supercomputer Funktionsweisen von ... · NVIDIA GeForce GT200 1063 GFLOPS Core i7...

Documents

Transcript of Entwicklung der Supercomputer Funktionsweisen von ... · NVIDIA GeForce GT200 1063 GFLOPS Core i7...

GeForce 8800 GT Testberichte Deutschland. NVIDIA Confidential D ie Karte liegt in puncto Rechenleistung.

Design, Implementation, and Production Experiences of a ......SAN DIEGO SUPERCOMPUTER CENTER at the UNIVERSITY OF CALIFORNIA, SAN DIEGO Abstract (1 of 2) In 2005, the San Diego Supercomputer

Projektgruppe: DIY upb.de Supercomputer Wilke Hagelweide.

eparo – Die unbewusste Wahrnehmung - Der vergessene Supercomputer (UX-Rondtable HH - Rolf Schulte Strathaus)

FUNKTIONSWEISEN VON FINANZDISTRIKTEN AM BEISPIEL …€¦ · Luxemburg als Finanzplatz 3. (Globale) Produktionsnetze von Investmentfonds 4. Soziale und räumliche Arbeitsteilung am

1 Friedrich-Alexander-Universität Erlangen-Nürnberg Frank Hannig GPU Architectures: GeForce 8, GeForce 9 and Future Leander Sturm Daniel Gran Hardware-Software-Co-Design.

Masterarbeit - Freie Universität · Masterarbeit Large Scale Supercomputer Assisted and Live Video Encoding with Image Statistics 18. August 2016 Bearbeitet von: Gutachter : Prof.

Configurable Computing Skript V1 01 - TU Clausthal...bausteine – ASICs (Application Specific Integrated Circuits) und (F)PLDs (Field-Programmable Logic Devices – als auch die Funktionsweisen

NVIDIA GeForce Experienceinternational.download.nvidia.com/GFE/User-Guides/GeForce... · • Ob Beta-Treiber bei den Updates berücksichtigt werden sollen. ... Um nach installieren

H. Rosch, B. Brüderlin FG Graphische Datenverarbeitung...Beispiel Nutzfahrzeug (Actros) Über 100´000 Polygone Previev: ca. 20 Bilder / Sekunde Athlon 1400 MHz, GeForce 3 Volle Auflösung

tec.nicum Dienstleistungen rund um … · Methoden der Beurteilung von Risiken und Gefährdungen Aktuelle Technologien und Funktionsweisen von Sicherheitssystemen Rechtliche Fragestellungen,

NEUER SUPERCOMPUTER AM HLRS EINGEWEIHT · der Welt auf Rang 12, im Ranking der Supercomputer, die auch der Industrie zur Verfügung stehen, liegt er gar welt-weit auf Platz eins,

Tagesaktuelle Nachrichten sind auf ... · GeForce NOW: The Cloud Gaming Service for PC Gamers Two hundred million PC gamers can’t be wrong. They already know GeForce powers the

Zeitalter der...6 Creating Chemistry Zeitalter der Superhirne Fokus Supercomputer machen als blitzschnelle virtuelle Analysierer von sich reden. Doch schon hat mit Quantenrechnern

PiXtend Anwendungsbeispiel „Supercomputer“€¦ · „Supercomputer“ Beim Anwendungsbeispiel „Supercomputer“ haben wir einen kompletten Serverraum in Miniatur nachgebildet.

FUJITSU Supercomputer PRIMEHPC FX100

New Film History - montage-av.de · Konzepte und Funktionsweisen dieses Paradigmas untersucht.4 Das dabei verwendete Denkmodell orientiert sich an den theoretischen Auffassungen von

BACHELORARBEIT Herr Felix Reichel · Als Repräsentant moderner Virtual-Reality-Brillen wird die Oculus Rift gewählt. Deren technische Eigenschaften und Funktionsweisen werden ergründet,

Geforce PräSentation by Sebastian Berndt

Praktikum II: Elektrotechnische Experimente - Versuch zu elektrischen... · Das Wichtigste in Kürze Worum geht es? In den Versuchen sollen unterschiedliche Funktionsweisen und Einsatzmöglichkeiten