Theorie und Einsatz von Verbindungseinrichtungen in ... · PDF fileEnhanced Hypercube Folded...

Center for Information Services and High Performance Computing (ZIH)

Theorie und Einsatz von Verbindungseinrichtungen inparallelen Rechnersystemen

Statische Verbindungsnetzwerke

04. Juni 2010

Andy Georgi

INF 1046Nothnitzer Straße 4601187 Dresden

0351 - 463 38783

m

Foliensatz

Verfugbarkeit der Folien

Vorlesungswebseite:http://tu-dresden.de/die_tu_dresden/zentrale_einrichtungen/

zih/lehre/ss2010/tevpr

2/47

Agenda

1 Einfuhrung

2 Vollstandige Vermaschung

3 Stern

4 Ring

5 Gitter

6 Baum

7 Cube

8 Literaturverzeichnis

3/47

Agenda

1 Einfuhrung

4/47

http://tu-dresden.de/die_tu_dresden/zentrale_einrichtungen/zih/lehre/ss2010/tevpr

http://tu-dresden.de/die_tu_dresden/zentrale_einrichtungen/zih/lehre/ss2010/tevpr

Einfuhrung I

Kommunikation zwischen Knoten uber feste Verbindungsleitungen wie inKapitel 2 beschrieben

Kosten beschranken sich auf Hardware-Unterstutzung in den Knoten undLeitungen

Beschreibung der topologischen Verbindungsstrukturen mittelsVerbindungsfunktionen

5/47

Einfuhrung II

Verbindungsfunktion

Verfugt ein Knoten A uber eine Verbindungsfunktion f (A), so werden beiAusfuhrung dieser Funktion Daten vom Knoten A zu Knoten f (A) = Btransferiert.

6/47

Einfuhrung III

Verbindungsfunktionen in SIMD-Systemen:

Alle aktiven PEs fuhren die gleiche Verbindungsfunktion ausPassive PEs senden keine Daten, konnen allerdings Daten empfangenDatenverlust moglich

Verbindungsfunktionen in MIMD-Systemen:

Befehlsverarbeitung erfolgt unabhangig voneinanderI.d.R. Zwischenpufferung der Daten

7/47

Agenda

2 Vollstandige Vermaschung

8/47

Vollstandige Vermaschung

Dedizierte Verbindungen von jedem Knoten zu jedem anderen Knoten

Interne Konflikte ausgeschlossen

Beschrankung der maximal erzielbaren Kommunikationsleistung erfolgtausschließlich durch die technische Realisierung

9/47

Agenda

3 Stern

10/47

Stern

Master-Slave-Architektur

Verbindungsaufbau erfolgt uber zentralen Knoten (Master)

Effizient bei Multicast-Operationen oder Prozesssynchronisation

11/47

Agenda

4 RingKlassische Ring-TopologieChordaler RingToken-RingRegister-Insertion-RingScalable Coherent Interface

12/47

Klassische Ring-Topologie

Verbindungsfunktionen in einem bidirektionalen Ring:

ring+ = (P + 1) mod Nring− = (P − 1) mod N

Ein unidirektionaler Ring implementiert nur eine der beidenVerbindungsfunktionen

Keine Zugriffsbeschrankungen

13/47

Chordaler Ring

Ziel: Reduzierung des Durchmessers und der mittleren Weglange

Umsetzung: Einfugen zusatzlicher Verbindungen, sog. Chords

Die Chord-Lange C bezeichnet den Abstand der verbundenen Knoten

Ein Chordaler Ring nach Arden und Lee [ArL81] enthalt stets einegerade Anzahl von Knoten und vier Verbindungsfunktionen:

ring+1 = (P + 1) mod Nring−1 = (P − 1) mod Nring+C = (P + C ) mod N, wenn P ungeradering−C = (P − C ) mod N, wenn P gerade

14/47

Token-Ring

Zugangsregelung mit Hilfe von Token

Ablauf im IEEE 802.5 Token-Ring-Protokoll standardisiert:

1 Sender wartet auf Free-Token2 Umwandlung in Busy-Token, welches zusammen mit den zu sendenden

Daten an den Ring ubergeben wird3 Weiterleitung der Nachricht entsprechend der Verbindungsfunktion4 Entfernung der Nachricht vom Netz durch den Quellknoten5 Freigabe des Tokens nach der vollstandigen Ubertragung der Nachricht

15/47

Register-Insertion-Ring

EP AP

Schieberegister

PE 0

EP AP

Schieberegister

PE 1

Abbildung: Register-Insertion-Ring mit zwei Knoten

16/47

Scalable Coherent Interface

Prozessor

Dekoder RingpufferVorgänger

Nachfolger

Empfangs-puffer

Sende-puffer

PE n

Abbildung: Blockschaltbild eines SCI-Knotens

17/47

Agenda

5 GitterMesh-NetzTorusIlliac-Netz

18/47

Zweidimensionale Gitter

Verteilung der Knoten auf MR Reihen und MS Spalten

Unterscheidung zwischen offenem und geschlossenem Gitter

Befindet sich der betrachtete Knoten in Reihe k auf Spalte j , so ergibtsich sein Index I aus

IH = j + MS ∗ k bei horizontaler, bzw.IV = k + MR ∗ j bei vertikaler Zahlrichtung

19/47

Mesh-Netz

Offenes Gitter mit horizontalen und vertikalen Verbindungen der direktenNachbarn

Implementiert vier Verbindungsfunktionen:

meshright (IH) = (j + 1) + MS ∗ kmeshleft (IH) = (j − 1) + MS ∗ kmeshdown (IH) = j + MS ∗ (k + 1)meshup (IH) = j + MS ∗ (k − 1)

20/47

Torus

Geschlossenes Gitter mit horizontalen und vertikalen Verbindungenzwischen Randknoten einer Reihe bzw. Spalte

Verbindungsfunktionen:

torusright (IH) = ((j + 1) mod MS) + MS ∗ ktorusleft (IH) = ((j − 1) mod MS) + MS ∗ ktorusdown (IH) = j + MS ∗ ((k + 1) mod MR)torusup (IH) = j + MS ∗ ((k − 1) mod MR)

21/47

Illiac-Netz I

Benannt nach dem Rechner Illiac-IV [BoD72], welcher diese Topologieimplementierte

Geschlossenes Gitter mit folgenden Eigenschaften:

Vertikale und horizontale Verbindungen zu den direkten NachbarnVerbindung der Randknoten einer SpalteVerbindung des Endknotens einer Reihe mit dem Anfangsknoten dernachfolgenden Reihe

22/47

Illiac-Netz II

Verbindungsfunktionen:

illiacright (IH) = ((j + 1) + MS ∗ k) mod Nilliacleft (IH) = ((j − 1) + MS ∗ k) mod Nilliacdown (IH) = (j + MS ∗ (k + 1)) mod Nilliacup (IH) = (j + MS ∗ (k − 1)) mod N

23/47

Agenda

6 BaumBinarbaumek-fache BaumeRing-erweiterte BaumeHypertreeFat-Tree

24/47

Baumstrukturen

DefinitionAus graphentheoretischer Sicht handelt es sich bei einem Baum um einenungerichteten zusammenhangenden azyklischen Graphen. Dabei ist dieserdurch eine Wurzel gekennzeichnet, von der keine, eine oder mehrere Kantenausgehen. Die Kanten verbinden die Wurzel mit ihren Kindsknoten, wobei essich entweder um Blatter - d.h. Knoten ohne weiterfuhrende Kanten - oderrekursiv um Wurzeln weiterer Baume handelt. Die Tiefe T eines Baumesentspricht der maximalen Anzahl von Kanten, welche durchlaufen werdenmussen, um von der Wurzel zu einem Blatt zu gelangen.

25/47

Binarbaume I

DefinitionDie Wurzel eines Binarbaumes besitzt stets einen rechten und einen linkenKindsknoten. Dabei handelt es sich entweder um ein Blatt oder die Wurzeleines weiteren Teilbaumes, welcher wiederum einem Binarbaum entspricht. Istzudem die Entfernung von der Wurzel zu allen Blattern identisch, so sprichtman von einem vollstandigen Binarbaum.

26/47

Binarbaume II

Ein Knoten mit dem Index I kann in einem vollstandigen Binarbaumfolgende Verbindungsfunktionen ausfuhren:

childright (I ) = 2I ; wenn I kein Blattchildleft (I ) = 2I + 1 ; wenn I kein Blattparent (I ) = bI/2c ; wenn I nicht der Wurzel entspricht

27/47

k-fache Baume

Ziel: Reduzierung des Durchmessers bei gleichbleibender Knotenzahl

Losung: Reduzierung der Tiefe

Umsetzung: Erhohung der erlaubten Anzahl von Kindern pro Knoten

28/47

Ring-erweiterte Baume

Erweiterung des Baumes um horizontale Verbindungsleitungen

Verbindung der Blattebene mit Hilfe einer Ring-Topologie ergibtvollstandig verknupften Binarbaum [HoZ81]

Durch Anwendung der Ring-Erweiterung auf alle Ebenen entsteht einBinarbaum mit vollstandigen Ringverbindungen [HoZ81]

29/47

Hypertree I

Hamming-Distanz

Als Hamming-Distanz H wird die minimale paarweise Stellendistanz einesCodes definiert [Ham86]. Die Stellendistanz d(x,y) bezeichnet dabei die Anzahlder Stellen, in denen sich zwei gleich lange Worter x und y unterscheiden. FurWorter unterschiedlicher Lange ist die Stellendistanz hingegen nicht definiert.

30/47

Hypertree II

Grundlage bildet ein vollstandiger Binarbaum

Verbindung der Knoten A und B einer Ebene, wenn H(A,B) = 1

Unterscheidung zwischen Hypertree I und Hypertree II [Goo81]

31/47

Beispiel

000001

000010

000100

001000

010000

100000 100001

010001

100010 100011

001001

010010

100100 100101

010011

100110 100111

000101

001010

010100

101000 101001

010101

101010 101011

001011

010110

101100 101101

010111

101110 101111

000011

000110

001100

011000

110000 110001

011001

110010 110011

001101

011010

110100 110101

011011

110110 110111

000111

001110

011100

111000 111001

011101

111010 111011

001111

011110

111100 111101

011111

111110 111111

Abbildung: Hypertree mit 63 Knoten veteilt auf sechs Ebenen

32/47

Fat-Tree

Erhohung der verfugbaren Datenrate in Richtung der Wurzel [Lei85]

Beibehaltung des Routingalgorithmus und wesentlicher Eigenschaftender ursprunglichen Baumstruktur

33/47

Agenda

7 CubeKlassisches Cube-NetzTwisted Cube-NetzCrossed Cube-NetzEnhanced HypercubeFolded HypercubeIncomplete Hypercubes

34/47

Klassisches Cube-Netz I

Hamming-Distanz

Das klassische Cube-Netz besteht aus N = 2n Knoten, wobei n auchals Dimension bezeichnet wird. Zwei Knoten A und B sind jeweils dannmiteinander verbunden, wenn H(A,B) = 1.

35/47

Klassisches Cube-Netz II

Per Definition verfugt in einem klassischen Cube-Netz jeder Knotenuber n Ein- und Ausgange

Entsprechend ist auch die Implementierung von n Verbindungsfunktionennotwendig:

cubek(bn−1bn−2...bk ...b1b0) = bn−1bn−2...bk ...b1b0, mit 0 ≤ k < n

36/47

Twisted Cube-Netz

Umstrukturierung vorhandener Verbindungsleitungen zur Reduzierungdes Durchmessers

Vorgehensweise [EsN91]:

1 Auswahl eines Zyklus uber vier Knoten a, b, c, d ∈ V in einem klassischenCube-Netz

2 Bestimmung zweier Kanten {a, b}, {c, d} ∈ E aus diesem Zyklus, welchenicht uber einen Knoten miteinander verbunden sind

3 Ersetzung der gewahlten Kanten: ϕ({a, b}, {c, d}) = {a, c}, {b, d}

37/47

Crossed Cube-Netz I

Definition

Als CQn wird ein n-dimensionales Crossed Cube-Netz [Efe92] bezeichnet. CQ1

besteht aus zwei miteinander verbundenen Knoten. Ist n > 1 so wird CQn

aus den beiden Subnetzen CQ0n−1 und CQ1

n−1 gebildet, indem die Knotenu = 0un−2...u0 und v = 1vn−2...v0 mit u ∈ CQ0

n−1 und v ∈ CQ1n−1 genau

dann miteinander verbunden werden wenn gilt:

1 un−2 = vn−2, falls n gerade ist, und

2 u2i+1u2i ∼ v2i+1v2i , fur alle i mit 0 ≤ i < b(n − 1)/2c

38/47

Crossed Cube-Netz II

Paarweise VerwandtschaftZwei binare Sequenzen x = x1x0 und y = y1y0 werden als paarweise verwandtbezeichnet, wenn (x , y) ∈ {(00, 00), (10, 10), (01, 11), (11, 01)}. Sind x und ypaarweise miteinander verwandt so schreibt man x ∼ y , andernfalls x � y .

39/47

Enhanced Hypercube

Definition

In einem Enhanced Hypercube [TzW91] der Ordnung ω, mit 0 ≤ ω < n − 1,werden gegenuber der klassischen Cube-Topologie Verbindungsleitungenzwischen allen Knotenpaaren

{(xn−1 ... xn−ω xn−ω−1 ... xi ... x0), (xn−1 ... xn−ω xn−ω−1 ... xi ... x0)}

hinzugefugt.

40/47

Folded Hypercube

Spezialfall des Enhanced Hypercubes der Ordnung ω = 0 [ElL91]

Erweiterung um N/2 Verbindungsleitungen zwischen Knoten mit dermaximalen Hamming-Distanz

Reduzierung des Durchmessers auf dn/2e

41/47

Incomplete Hypercubes

Erweiterung der bisher vorgestellten Cube-Topologien um eineDimension erfordert eine Verdopplung der Knotenzahl

Incomplete Hypercubes lassen eine beliebige Knotenanzahl zu

Eingrenzung auf Netze, welche aus zwei vollstandigen Cube-Netzenunterschiedlicher Große 2n und 2k bestehen [TzC92]

42/47

Agenda

8 Literaturverzeichnis

43/47

Literaturverzeichnis I

[IE1596] David B. Gustavson, Qiang LiThe Scalable Coherent Interface (SCI), Santa Clara University 1996.http://userweb.cs.utexas.edu/users/dburger/teaching/

cs395t-s08/papers/9_sci.pdf

[ArL81] B. W. Arden, H. LeeAnalysis of chordal ring networks, Apr 1981.IEEE Transactions on Computers, Band C-30, Nr. 4, S. 291-295

[Dot84] K. W. DotyNew designs for dense processor interconnection networks, May 1984.IEEE Transactions on Computers, Band C-33, Nr. 5, S. 447-450

[BoD72] W. J. Bouknight, S. A. Denenberg, D.E. McIntyre, J. M.Rundall, A. H. Sameh, D.L. SlotnickThe Illiac IV system, Apr 1972.Proceedings of the IEEE, Band 60, Nr. 4, S. 369-388

44/47

http://userweb.cs.utexas.edu/users/dburger/teaching/cs395t-s08/papers/9_sci.pdf

http://userweb.cs.utexas.edu/users/dburger/teaching/cs395t-s08/papers/9_sci.pdf

Literaturverzeichnis II

[HoZ81] E. Horowitz, A. ZoratThe binary tree as an interconnection network: Applications tomultiprocessor system and VLSI, Apr 1981IEEE Transactions on Computers, Band C-30, Nr. 4, S. 247-253

[Ham86] R. W. HammingCoding and Information Theory, Jan 1986Prentice Hall, ISBN-13: 978-0131390720

[Goo81] J. R. Goodman, C. H. SequinHypertree – A multiprocessor interconnection topology, Apr 1981Computer Sciences Technical Report #427

[Lei85] C. E. LeisersonFat-Trees: Universal networks for hardware-efficient supercomputing, Oct1985IEEE Transactions on Computers, Band C-34, Nr. 10, S. 892-901

45/47

Literaturverzeichnis III

[EsN91] A.-H. Esfahanian, L. M. Ni, B. E. SaganThe twisted N-cube with application to multiprocessing, Jan 1991IEEE Transactions on Computers, Band C-40, Nr. 1, S. 88-93

[Efe92] K. EfeThe crossed cube architecture for parallel computation, Sep 1992IEEE Transactions on Parallel and Distributed Systems, Band 3, Nr. 5,S. 513-524

[TzW91] N.-F. Tzeng, S. WeiEnhanced Hypercubes, Mar 1991IEEE Transactions on Computers, Band C-40, Nr. 3, S. 284-294

[ElL91] A. El-Amawy, S. LatifiProperties and performance of folded hypercubes, Jan 1991IEEE Transactions on Parallel and Distributed Systems, Band 2, Nr. 1,S. 31-42

46/47

Literaturverzeichnis IV

[Kat88] H. P. KatseffIncomplete hypercubes, May 1988IEEE Transactions on Computers, Band C-37, Nr. 5, S. 604-608

[TzC92] N.-F. Tzeng, H.-L. ChenAn effective approach to the enhancement of incomplete hypercubecomputers, Feb 1992Journal of Parallel and Distributed Computing, Band 14, Nr. 2, S.163-174

47/47

Theorie und Einsatz von Verbindungseinrichtungen in ... · PDF fileEnhanced Hypercube Folded...

Documents

Transcript of Theorie und Einsatz von Verbindungseinrichtungen in ... · PDF fileEnhanced Hypercube Folded...