67 Grundkonzepte paralleler Programmierung => MPD (Multi-threaded Parallel Distributed) Andrews...

Grundkonzepte paralleler Grundkonzepte paralleler ProgrammierungProgrammierung

=> MPD (Multi-threaded Parallel Distributed)Andrews (Arizona University)http://www.cs.arizona.edu/mpd

Synchronisation von Synchronisation von SpeicherzugriffenSpeicherzugriffen

Problem: • Speicherzugriffe auf gemeinsame Variablen müssen koordiniert werden• Nicht-atomare Operationen erfordern exklusiven Zugriff auf globale Daten

Beispiel: .... Prozess p count := 500 Prozess q .....

.... ....

local := count

inc100(count) for i:=1 to 100 ->... inc100(count)

count := local

.... ....

count := 500+?

Beispiel: MPD-Programm Beispiel: MPD-Programm counter.mpdcounter.mpd

resource counter() int count = 0 # increment count by 100 process inc1000 [id = 1 to 10] { int local; int top = 100 for [j=1 to id] { # increment global counter - critical section local = count; writes(id,": get counter = ", local); write() for [k = 1 to top] { local += 1 }; nap(int(random()*100)) count = local; writes(id,": put counter = ", local); write() # wait for some time - non-critical section nap(int(random()*100)) } } final { write(count) }end counter

SynchronisationsformenSynchronisationsformen

1. Wechselseitiger Ausschluss (mutual exclusion)Bsp: geschützter Zugriff auf gemeinsame Ressourcen (s.o.)

2. einseitige SynchronisationBedingungssynchronisation (condition synchr.)Ereignissynchronisation (event synchr.)Ein Prozess muss auf eine Bedingung oder ein Ereignis warten, das von einem anderen Prozess ausgelöst wird.Bsp: Erzeuger-Verbraucher mit (un-)beschränktem Puffer

((un-)bounded buffer)

3. Barrierensynchronisation (Verallgemeinerung von 2.)Eine Gruppe von Prozessen muss an einer sog. Barriere warten, bis alle Prozesse der Gruppe die Barriere erreicht haben.

Bsp: Synchronisation von Schleifendurchläufen paralleler Prozesse

Race ConditionsRace Conditions

• Situationen, in denen das „Wettrennen“ (race) der Prozesse beim Zugriff auf gemeinsame Ressourcen Auswirkungen auf das Ergebnis eines Programmlaufs hat.

• Durch Synchronisationen werden „race conditions“ vermieden. Das Wettrennen unter den Prozessen wird eingeschränkt.

• Gefahren durch unpassende Synchronisationen• Verklemmungen (deadlocks)• Aushungerungen (starvations)

Synchronisationskonstrukte: Synchronisationskonstrukte: Semaphore (Dijkstra 1965)Semaphore (Dijkstra 1965)

Ein Semaphor ist ein abstrakter Datentyp mit• nicht-negativer Integer-Variablen (Semaphorzähler)• zwei unteilbaren (atomaren) Operationen P und V

P => Passieren, V => VerlassenBei der Initialisierung wird dem Semaphor ein nicht-negativer Wert zugewiesen. Anschließend ist nur noch eine Manipulation mit den Operationen P und V möglich.

P(S): Wenn S>0,

dann S := S-1

sonst wird der Prozess, der P(S) ausführt,

suspendiert

V(S): Wenn Prozesse bei Ausführung

von P(S) suspendiert wurden

dann reaktiviere einen Prozess sonst S := S+1

binäres Semaphor: Initialisierung mit 1

Semaphore in MPDSemaphore in MPD

• Semaphor-Deklaration: sem sem_def, sem_def

• Semaphor-Definition: sem id [subscripts] = expr• einzelnes Semaphor• Feld von Semaphoren

• Operationen: P(sem_id [subscripts])V(sem_id [subscripts])

Wechselseitiger AusschlussWechselseitiger Ausschlussresource Critical_Section ()

const N := 20 # Anzahl Prozesse

var X := 0 # gemeinsame Variable

sem mutex := 1 # Semaphor zum Schutz von X

process p (i:= 1 to N)

# non-critical section

# critical section

P(mutex)

X:=X+1

V(mutex)

Warteschlange ist alsfirst-come-first-servedFIFO-Schlange organisiert.

Beispiel: MPD-Programm Beispiel: MPD-Programm counter.mpdcounter.mpd

mit Semaphormit Semaphorresource counter() int count = 0; sem mutex := 1; # increment count by 100 process inc1000 [id = 1 to 10] { int local; int top = 100 for [j=1 to id] { # increment global counter - critical section P(mutex) local = count; writes(id,": get counter = ", local); write() for [k = 1 to top] { local += 1 }; nap(int(random()*100)) count = local; writes(id,": put counter = ", local); write() V(mutex) # wait for some time - non-critical section nap(int(random()*100)) } } final { write(count) }

end counter

Einseitige Synchronisation:Einseitige Synchronisation:Erzeuger/Verbraucher-ProblemErzeuger/Verbraucher-Problem

Erzeuger produziert Verbraucher konsumiertAnnahme: unbeschränkter Puffer

resource Producer-Consumer ();...sem full = 0; sem mutex = 1;...process producer ()

var item : intwhile (true) {

produce (item)P(mutex)enter (item)V(mutex)V(full) }

...process consumer ()

var item : intwhile (true) {

P(full)P(mutex)remove (item)V(mutex)consume (item)}

Zyklische Synchronisation: P1 > Zyklische Synchronisation: P1 > P2 > P3 ...P2 > P3 ...

resource Critical_Section ()

const N := 20 # Anzahl Prozesse

var X := 0 # gemeinsame Variable

sem mutex[N] := (1, [N-1] 0) # Semaphorfeld

process p (i:= 1 to N)

# critical section

P(mutex[i])

X:=X+1

V(mutex[(i mod N)+1])

Zugriff auf kritische

Abschnitte in zyklischer

Reihenfolge

Fallstudie: Leser-/Schreiber-Fallstudie: Leser-/Schreiber-ProblemProblem

Mehrere Prozesse arbeiten auf gemeinsamem Speicherbereich. Gleichzeitige Lesezugriffe sind erlaubt.Schreibzugriffe müssen exklusiv erfolgen.

Lösungsansatz [Courtois, Heymans, Parnas 71, ACM]Idee: Verwalte Zähler readcount für Leseranzahl

2 Semaphore: sem rcount_mutex := 1 (Schutz für readcount)sem writing := 1 (Sperre für exklusiven Schreibzugriff)

Schreibprozesse:

CREW (concurrent read exclusive write)

process writer () while (true) {

<Daten erzeugen> P(writing) <Daten schreiben>V(writing) }

LeseprozesseLeseprozesse

process reader ()

while (true) {

P(rcount_mutex)

if readcount == 0 { P(writing) }

readcount += 1

V(rcount_mutex)

P(rcount_mutex)

readcount -= 1

if readcount == 0 { V(writing) }

V(rcount_mutex)

Leseranmeldung:Erster Leser besorgt Speicherfreigabe.

Leserabmeldung:Letzter Leser gibt Speicher frei.

KorrektheitKorrektheit

Das Semaphor writing schützt den Speicherbereich.

• Schreiber aktiv => writing ist gesetzt• Kein weiterer Schreiber kann passieren.• Erster Leser blockiert bei P(writing).• Weitere Leser blockieren bei P(rcount_mutex).

• Leser aktiv => writing ist durch ersten Leser gesetzt.• Schreiber wird bei P(writing) blockiert.• Weitere Leser passieren writing nicht, sondern erhöhen

nur den Lesezähler.

Problem: Problem: SchreiberaushungerungSchreiberaushungerung

• Wenn ständig neue Leser hinzukommen, wird readcount nie Null und die Schreiber erhalten keinen Zugang zum kritischen Bereich.

• Besser: Blockiere neue Leser, sobald ein Schreiber wartet.• Führe neuen Zähler writecount für Leser und (wartende)

Schreiber ein.• neue Semaphore:

• sem wcount_mutex = 1 (Schutz für Schreiberzähler)• sem reading = 1 (Sperre für Leser, falls Schreiber warten)

=>zusätzliche Anmeldung für Schreiberprozesse, um neue Leser zu stoppen

Schreiberan- und -abmeldungSchreiberan- und -abmeldung

process writer () while (true) {

<Daten erzeugen> P(writing) <Daten schreiben> V(writing) }

P(wcount_mutex)if writecount == 0

{ P(reading) }writecount += 1V(wcount_mutex)P(writing)

P(wcount_mutex)writecount -= 1if writecount == 0

{ V(reading) }V(wcount_mutex)V(writing)

Modifikation der Modifikation der LeseranmeldungLeseranmeldung

process reader ()

while (true) {

P(reading)

P(rcount_mutex)

if readcount == 0 { P(writing) }

readcount += 1

V(rcount_mutex)

V(reading)

P(rcount_mutex)

readcount -= 1

if readcount == 0 { V(writing) }

V(rcount_mutex)

blockiert neue Leser, falls

• Schreiber wartet oder

• Leser bei Anmeldung

damit erster Schreiber nicht blockiert wird

BarrierensynchronisationBarrierensynchronisation

BARRIERE

P1 P2 . . . . Pn

Prozesse können nur passieren,wenn alle Prozesse der Gruppe die Barriere erreicht haben.

Bsp: Iterationsverfahren zum Bsp: Iterationsverfahren zum Lösen partieller Lösen partieller DifferentialgleichungenDifferentialgleichungen

. . . . . . . . . .

100°C

100°C0°CEisbad

Wasser-dampf

zweidimensionales Temperaturverteilungsproblem:Ermittle die Temperaturverteilungan den Gitterpunkten im stabilenZustand

Im stabilen Zustand gilt:x,y = 1/4 (x-1,y + x+1,y + x,y-1 + x,y+1 )

dünneMetallplatte

Iterationsverfahren nach Jacobi (1845) – Gesamtschrittverfahren:

x,y0 = geschätzter Wert, Anfangswert

x,yi+1 = 1/4 (x-1,y

i + x+1,yi + x,y-1i + x,y+1i )

fn²/2 Iterationen garantieren Fehler unter 10-f bei Problemgröße n (=#Gitterpunkte)

Paralleles MPD-Programm mit co Paralleles MPD-Programm mit co ... oc... oc

resource Jacobi()

const int n = 5; const int f = 3; int numiter

real a [0:n+1,0:n+1], b [0:n+1,0:n+1]

# Iteration zur Bestimmung der Werte im stabilen Zustand

for [k=1 to numiter] {

# 1. Phase : Neuberechnung der Werte

co [i=1 to n] compute_row(i) oc

# 2. Phase : Update

co [i=1 to n] update_row(i) oc

endAnalyse:neue Prozesse für jede Iteration und jede der beiden Phasenbesser: Prozesse nur einmal erzeugen; Synchronisation mittels Barriere

Lineare Barriere mittels Lineare Barriere mittels ZählvariableZählvariable

• einfachste Form der Barriere• Verwaltung eines Zählers• Sperren aller aufrufenden

Prozesse, bis Zähler Maximalwert erreicht, danach Freigabe aller Prozesse

• mit Semaphoren:•sem arrival = 1

(Freigabe des Barrierenzugangs)

•sem departure = 0 (Sperren des Barrierenabgangs)

•var count : int = 0

global barriere sem arrival = 1, departure = 0; int count = 0 op barrier(val int n)

body barriereproc barrier (n) {

# AnkunftsphaseP (arrival); count += 1

if (count < n) { V(arrival) } else { V(departure) }

# Abgangsphase P(departure); count -= 1 if (count > 0) { V(departure) }

else { V(arrival) } } end barriere

Modifiziertes MPD-ProgrammModifiziertes MPD-Programm

resource Jacobi() const int n = 5; const int f = 3; int numiter real a [0:n+1,0:n+1], b [0:n+1,0:n+1] ...

process row [i=1 to n] {

# Iteration for [k=1 to numiter] {

# 1. Phase : Neuberechnung der Wertecompute_row(i)

call barriere.barrier(n) # SYNCHRONISATION# 2. Phase : Update

update_row(i)call barriere.barrier(n) # SYNCHRONISATION

} }...

Process Id´s 000 001 010 011 100 101 110 111

000 010 100 110

000 100

000 010 100 110

000 001 010 011 100 101 110 111

Turnierbarriere mit Aufwand Turnierbarriere mit Aufwand O(log n)O(log n)

Abgangsphase

“Broadcast”

Ankunftsphase

“Aggregation”

Turnierbarriere in MPDTurnierbarriere in MPDglobal barriere2 const int n = 8 # Anzahl Prozesse sem b[0:n-1] = ([n] 0) # Feld von Barrierensemaphoren op barrier(val int myid, val int n) body barriere2proc barrier (myid,n) {int pos = 1 # Bitwertigkeiten# Ankunftsphasewhile ((myid / pos) mod 2 == 0 & pos < n) {

P (b[myid]) # Warte auf Partnerpos *= 2

}if (myid != 0) {

V(b[myid-pos]) # Melde Ankunft an PartnerP(b[myid])

}# Abgangsphasewhile ( pos > 1 ) { pos = pos / 2; V(b[myid+pos]) }} end barriere2

Die Barriereist wieder-verwendbar!

Symmetrische Barriere Symmetrische Barriere

• hier nur für 2 Prozesse mit 2 Semaphoren

sem b1 = 0; sem b2 = 0

P1: ...... V(b2); P(b1) ......

P2: ...... V(b1); P(b2) ........

• allgemein: Butterfly-Schema, Aufwand O(log n)

Vor- und Nachteile von Vor- und Nachteile von SemaphorenSemaphoren

Vorteile:• einfach• effizient zu realisierenNachteile:• niedriges Abstraktionsniveau• fehleranfällige Programmierung

• fehlende P-Operation => kein wechselseitiger Ausschluß• fehlende V-Operation => mögliche Verklemmung

• unstrukturierte Programmierung• P- und V-Operationen über das ganze Programm verstreut,

z.B. bei bedingter Synchronisation

67 Grundkonzepte paralleler Programmierung => MPD (Multi-threaded Parallel Distributed) Andrews...

Documents

Transcript of 67 Grundkonzepte paralleler Programmierung => MPD (Multi-threaded Parallel Distributed) Andrews...

WEFATHERM GRÜN | Rohrleitungssystem PP-Raquaarab.com/images/pdf/wefatherm.pdfDZR-brass inserts: we are using for our threaded fittings only inserts made of high chemical and dezincification

BUSsysteme Mathias Schultz Benjamin Skirlo. Paralleler Bus D0 D4 Adress Bus (4 Bit) A0 A4.

Transporter Aebi TP48 - Maskinsalg As · 12 103.3697 Gewindestift Prisonnier Threaded pin DIN 913, M12×45, 45H 619.78275 13 103.4000 Sechskantmutter Ecrou 6-pans Hexagon nut DIN

MPD – Verkehrspsychologie...delikt muss die Fahrerlaubnisbehörde eine medizinisch- psychologische Begutachtung (MPU) anordnen, z. B. auch beim zweiten Verstoß gegen 24a StVG (0,5

Programmierung paralleler Algorithmen mit MPI Eine Einführung in das Betriebssystempraktikum Parallelverarbeitung.

B.Sc. Informatik und Multimedia, PO 2013 Modulhandbuch · 2017-01-11 · die gleich auf diese Einleitung folgt. ... BA_LI_103 Halbordnungssemantik paralleler Systeme unregelmäßig

Hydraulischer Schwenkspanner · 331 Doppelwirkender paralleler Schwenkspanner Modell LHS Index Hydraulischer Schwenkspanner Übersicht Funktionsbeschreibung Modell Nomenklatur Spezifikationen

1. BEZEICHNUNG DES ARZNEIMITTELS · einer Progression der Erkrankung fortgeführt. Der Effekt eines Behandlungsstopps nach Erreichen ... MDS/MPD und GIST (Startdosis 400 mg) HES/CEL

BRAUNSCHWEIG - Hilti...MPA BRAUNSCHWEIG Page 61 EpertOpinion No. (3394/595/13)—CM ofO2JOl/2014 1 TU ORAU NSCHWEIG The tensile stress of the steel components (anchor rods, threaded

Our Injectors stand for quality, Unsere Injektoren stehen ... · MIC Quick Lock Injektor mit Gewindehülse MIC Quick Lock Injector with tube threaded. MIC INJECTOR Innovative Filling

Vorlesungsverzeichnis - puls.uni-potsdam.de · Konzepte paralleler Programmierung 9 66195 V - Paralleles Rechnen 9 66196 U - Paralleles Rechnen 10 ... Statische Programmanalyse 17

Threaded Case Study, Acacia Elmar Schlenker A. Brickwedde Mittwoch, 28. Mai 20141 Threaded Case Study Alexander Brickwedde Elmar Schlenker Fachhochschule.

MPD 600 Broschüredonar.messe.de/exhibitor/hannovermesse/2017/D... · IEC Durchschnitt) Sensorauswahl Der obere Anzeigebereich bildet die angeschlossenen Erfassungsgeräte sowie deren

Systemhandbuch In-Home-Bus: Audio Ausgabe 2017 · 2 8 Zusatzfunktionen Schalten und Steuern 81 Türöffner-Ansteuerung 82 Paralleler Türruf 84 Parallelschaltung Etagenruf 88 Zusatzkontakt

Analyse verschiedener Architekturvarianten des CoreVA-VLIW ... · Prozessor beispielsweise eine variable Anzahl paralleler Verarbeitungseinheiten, in denen mit Hilfe der VLIW 2 -Technik

Momento À( -- !( % * & A » ( , È Ç ( , - / # . 8 (812) 380-59- Kataloque for · power tool and the threaded fastener. When it comes to power driving tools, black power sockets

Parallele Programmierung - mathematik.uni-marburg.detseeger/Parallele_Programmierung/Blank... · 1 Einführung 1.1 Programmieren von parallelen Rechnern Problem ®¶ Paralleler Algorithmus

New Pos. Teile-Nr. Benennung Denomination Pos. Teile-Nr. … · 2010. 6. 18. · 40 10051 0223 000646 Gewindestift Threaded stud 41 10052 249 000267k Hubexzenter kpl. Lift eccentric

14 Parallele Rechner 14.1 Parallele Rechner - Einführung 14.2 Leistung 14.3 Kommuniklationsarchitektur 14.4 Typen paralleler Architekturen.

Diplomarbeit - tuprints.ulb.tu-darmstadt.detuprints.ulb.tu-darmstadt.de/5266/1/Grammou-Implementierung paralleler... · 4.3.1 SOR‐ und Gauß‐Seidel ‐ ... Anwendung der Finiten-Element-Methode