Wissenschaftliches Programmieren mit CUDA Christian Renneke Daniel Klimeck Betreuer: Dipl.-Ing....

Wissenschaftliches Programmierenmit CUDA

Christian RennekeDaniel Klimeck

Betreuer: Dipl.-Ing. Bastian Bandlow

2 Univ. Paderborn, FG Theoretische Elektrotechnik 2

Leitfaden

• Motivation

• Was ist CUDA ?

• NVIDIA Grafikkarte

• Programmierung

• FIT im Zeitbereich

• Ergebnisse

• Projektverlauf

• Zusammenfassung

Motivation

• Beschleunigung von Simulationen mit Hilfe von Grafikkartenprozessoren (GPU)– Ausnutzung der massiven Parallelität

• Zeitbereichsintegration in finiter Integration (FIT)– Ähnlich dem Updateschema aus Finite Differenzen im Zeitbereich

Was ist CUDA ?

• Compute Unified Device Architecture ( CUDA )• Entwickelt von NVIDIA• Ermöglicht die Benutzung des Grafikprozessors zur

Beschleunigung wissenschaftlicher und technischer Berechnungen

• Standard-C-Entwicklungsumgebung• Anwendungsbeispiele:

• Numerik• Grafik• Signalverarbeitung• Wissenschaft

Vergleich GPU v. CPU

• Hardware-Modell

Quelle: NVIDIA CUDA Programming Guide

Vergleich GPU v. CPU

• NVIDIA GeForce GTX 260• Stream-Prozessoren: 192

• 24 Multiprozessoren, mit je 8 Kernen• Core-Taktfrequenz : 576 MHz • Speicher-Taktfrequenz: 999 MHz • Speicher : 896MB • Unterstützt Datentyp DOUBLE• 1,4 Mrd. Transistoren• Vergleich: Intel Core i7 (11/2008)

• 731 Millionen Transistoren

Quelle: http://img2.abload.de/img/gtx260_01ytg.jpg

Programmierung

Host Application

CUDA Libraries

CUDA Runtime

CUDA Driver

Device

Aus C: CublasDdot()

.cu Datei, mit selbstgeschriebenen Kernel auf „Runtime“Abstraktion

.cu Datei, mit voller Kontrolle, aber alles „von Hand“

ProgrammierungC Program Sequential Execution

Serial code

Parallel kernel

Kernel0<<< x ,y >>>()

Serial code

Device

Grid 0

„Daten draufkopieren“

„Daten / Ergebnisse runterkopieren“

FIT im Zeitbereich

• Untersuchung der Leistungsfähigkeit von CUDA

• Ausführen einer Simulation mit Unterstützung der GPU– Hier: Berechnung der Ströme und Spannungen in einem Koaxialleiter.– Anregung:

• Konzentrierte Bauelemente an der Stirnseite. • Gausspuls als Anregung.

– Berechnung der E- und H-Felder zu nt Zeitschritten mittels Leapfrog-Algorithmus

Quelle: Übung zu Elektromagnetischen Feldsimulation, Projekt 7

Inhomogen gefüllter KoaxialleiterElektr. Randbedingung

Innenleiter

FIT im Zeitbereich

• Leapfrog-Algorithmus

– Umsetzung im Quellcode:• Schleife zum Durchlaufen der Zeitschritte.• Statt der seriellen Berechnung der Felder an jedem Gitterpunkt

Übergabe an die parallel arbeitende GPU

FIT im Zeitbereich

• Curlmatrix

Quelle: Vorlesungsskript zu Elekromagnetische Feldsimulation

Nu*Nv Nu

Programmierung

• Leapfrog Algorithmus• Beispiel: H-Update umgesetzt in C-Code

Programmierung• Leapfrog Algorithmus

• Beispiel: H-Update als Kernel-Funktion

„Implementierung der Curl-Matrix“

• Leapfrog Algorithmus– Aufruf der Kernel-Funktion

– Berechnung der aktuellen Hx-Komponente, aus der alten, zwei Ex- und zwei Ez-Komponenten.

Programmierung

Ergebnisse• Struktur 1: Inhomogener Koaxialleiter• Anregung: E- /H-Feld einer TEM-Welle

Anzahl Laufzeitergebnisse in sec

Gitterpunkte Zeitschritte Matlab Mex-C CUDA

2.416 1.200 1,8 0,7 1,1

E��

H��

Ergebnisse

• Struktur 2: Bragg Reflektor– 4 Schichten

Anzahl

Gitterpunkte Zeitschritte

76.874 10.000

Laufzeitergebnisse in sec

CUDA 9,4

Mex-C - seriell 95,7

Mex-C - openmp(4) 53,1

Ergebnisse

Anzahl

173.978 57.000

CUDA 93

Mex-C - seriell 1456

Mex-C - openmp(4) 696

Ergebnisse

Anzahl

693.825 99.004

CUDA 568

Mex-C - seriell 8991

Mex-C - openmp(4) 4853

7,69E+08 9,92E+09 6,87E+10Gitterpunkte * Zeitschritte

MEX - seriell

MEX - openmp

Ergebnisse• Vergleich der Methoden

Gitterpunkte * Zeitschritte CUDA MEX-C seriellMEX-C

openmp(4)

768.740.000 9,4 96 53

9.916.746.000 93 1456 696

68.691.450.300 568 8991 4853

Ergebnisse im Vergleich

• S-Parameter Bragg Reflektor (20 Schichten, Struktur 3)

Ergebnisse im Vergleich• Zeitsignale

Projektverlauf (1)

• Einarbeitung und Inbetriebnahme des Systems

• Implementierung des Leapfrog – Algorithmus:– in einzelnen Funktionen unter MEX-C– in einer Funktion unter MEX-C

• Testprogramms auf der GPU– Kleines Beispiel in CUDA

• Implementierung des Leapfrog – Algorithmus auf der GPU– Zeitupdate-Schema in CUDA

Projektverlauf (2)

• Simulation und Aufnahme der Laufzeitergebnisse von verschiedenen Leapfrog – Varianten

• Bewertung der Effizienz von CUDA

• Dokumentation

Zusammenfassung

• Programmieren mit CUDA lohnt sich ab einer gewissen Komplexität des Problems

• Debuggen ist umständlich

• CUDA reduziert wesentlich die Berechnungszeit

• Keine Genauigkeitsverluste

• Geringe Kosten der Grafikkarte

• SDK kostenfrei erhältlich

Vielen Dank für Ihre Aufmerksamkeit!

Wissenschaftliches Programmieren mit CUDA Christian Renneke Daniel Klimeck Betreuer: Dipl.-Ing....

Documents

Transcript of Wissenschaftliches Programmieren mit CUDA Christian Renneke Daniel Klimeck Betreuer: Dipl.-Ing....

América Latina 1492-1992 - Jean-Pierre Bastian

Introduction to CUDA - TU Dortmundgoeddeke/gpgpu/cuda-2009/... · 2009. 6. 9. · CUDA on one slide • Parallel computing architecture and programming model • Unified hardware

Expertenreferat Solar, von Bastian Burger

ES IST SOWEIT - weltklasse-band.deweltklasse-band.de/downloads/WELTKLASSE_Booklet_Album_LEBEN.… · Van Halen wird über dich wachen. Du ... EDDI Musik: Bastian Förstner Text: Bastian

Schulung: Einführung in das GPU-Computing mit NVIDIA CUDA

21.05.2014 Folie 1 E-Health und die Gesundheitskarte / Bastian Klemke Die elektronische Gesundheitskarte in Schleswig Holstein Bastian Klemke Projektkoordinator.

Schuleingangsuntersuchungen Referentinnen: Gabriele Scholz Catrin Bastian.

Portfolio Bastian Dobrowald

Wissenschaftliche Begleitung der Pilotphase ... · Prof. Dr. Johannes Bastian Prof. Dr. Dagmar Killus bastian@uni-hamburg.de dagmar.killus@uni-hamburg.de Institut für Bildungsmonitoring

Bachelor Thesis: CUDA Geometry Sensor Service · 2012-04-13 · Bachelor Thesis: CUDA Geometry Sensor Service Handed in: 22.10.2008 by Christopher Bolte Research Group Programming

Von Alexandra Goletz, Britta Kohlmann und Bastian Rutenkolk.

01.11.2013 Folie 1 E-Health und die Gesundheitskarte / Bastian Klemke Die elektronische Gesundheitskarte in Schleswig Holstein Bastian Klemke Projektkoordinator.

1 2D-Heat equation. 2 Überblick Definition Diskretisierung Iterationsverfahren Mapping auf Cuda Implementierung Optimierung Performance Vergleiche Probleme.

CUDA Ein Vortrag von Simon Bayer 1. Gliederung Gliederung (Teil 1) 1.Einleitung 2.CUDA C 3.Parallelität 3.1.GPU CPU 3.2.Parallelität bei CUDA 3.3.Umwandlung.

Existenzgründungsseminar mit Aimée Bastian

Pendekar Kapak Maut Naga Geni 212 Karya : Bastian Tito › download › bTitoWS › 100.DendamDalamTitisan.… · Wiro Sableng – Pendekar Kapak Maut Naga Geni 212 Karya Bastian

Bastian Schildbach - Ausarbeitung - Texturing · PDF file20.06.2006 mit Texturing mit Maya Universität Ulm - Proseminar: 3D-Modellierungsprogramme - Bastian Schildbach 1 Bastian Schildbach

Realtime Radiosity mit Nvidia CUDA - …users.informatik.haw-hamburg.de/~abo781/abschlussarbeiten/ba... · Lars Nielsen Thema der Arbeit RealtimeRadiositymitNvidiaCUDA Stichworte

Vortragender: Peter Herner Betreuer: Hermann Lenhart · PDF fileSoftwareentwickler - Persönlichkeitstypen Vortragender: Peter Herner Betreuer: Hermann Lenhart Modul: Softwareentwicklung

Kinetics of phase transformations Bastian F. Rheingans