Distributed Database Systems Parallele Datenbanksysteme von Stefan Schneider.

21
Distributed Database Systems Parallele Datenbanksysteme von Stefan Schneider

Transcript of Distributed Database Systems Parallele Datenbanksysteme von Stefan Schneider.

Page 1: Distributed Database Systems Parallele Datenbanksysteme von Stefan Schneider.

Distributed Database Systems

Parallele Datenbanksysteme

von Stefan Schneider

Page 2: Distributed Database Systems Parallele Datenbanksysteme von Stefan Schneider.

Definition

Mehrere Computer über ein WAN oder LAN verbunden

Funktionsverteilung Billiger als Mainframesysteme

Page 3: Distributed Database Systems Parallele Datenbanksysteme von Stefan Schneider.

Datenbankserver

Page 4: Distributed Database Systems Parallele Datenbanksysteme von Stefan Schneider.

Verteiltes Datenbanksystem

Page 5: Distributed Database Systems Parallele Datenbanksysteme von Stefan Schneider.

Parallele Architektur

Problem des Flaschenhalses Hohe Performance

Parallelisierung Ladebalancierung

Hohe Verfügbarkeit Erweiterbarkeit

Rechenleistung Speicherkapazität

Page 6: Distributed Database Systems Parallele Datenbanksysteme von Stefan Schneider.

Subsysteme des parallelen Datenbanksystems

Page 7: Distributed Database Systems Parallele Datenbanksysteme von Stefan Schneider.

Parallele Systemarchitektur

Effiziente Realisierung der Ziele Verbindung der einzelnen

Hardwarekomponenten Liegen zwischen zwei Extremen

Shared MemoryShared Nothing

Page 8: Distributed Database Systems Parallele Datenbanksysteme von Stefan Schneider.

Shared Memory

Vorteile Einfachheit Ladebalancierung

Nachteile begrenzte

Erweiterbarkeit hohe Kosten

Page 9: Distributed Database Systems Parallele Datenbanksysteme von Stefan Schneider.

NUMA Architektur

leicht erweiterbar ist standardisiert beste Wahl für

große Systeme

Page 10: Distributed Database Systems Parallele Datenbanksysteme von Stefan Schneider.

Data Placement

Page 11: Distributed Database Systems Parallele Datenbanksysteme von Stefan Schneider.

Query Parallelism

Intra-Operator Parallelisierung Inter-Operator Parallelisierung

Pipeline- Parallelisierung Independent- Parallelisierung

Page 12: Distributed Database Systems Parallele Datenbanksysteme von Stefan Schneider.

Kombination von Parallelisierungsarten

Page 13: Distributed Database Systems Parallele Datenbanksysteme von Stefan Schneider.
Page 14: Distributed Database Systems Parallele Datenbanksysteme von Stefan Schneider.

Parallel Query Optimization

Search Space Cost Model Search Strategy

Page 15: Distributed Database Systems Parallele Datenbanksysteme von Stefan Schneider.

Probleme bei der parallelen Ausführung

Initialisierung Interferenz und Konvoieffekt

HardwareinterferenzSoftwareinterferenz

Ladebalancierung Intra-Operator Ladebalancierung Inter-Operator Ladebalancierung

Page 16: Distributed Database Systems Parallele Datenbanksysteme von Stefan Schneider.

Verteilte Objekte und Datenbank Managementsysteme

unterstützt neue Applikationen Computer Aided Design, Künstliche Intelligenz unterstützen abstrakte Datentypen bewahrt die natürliche Struktur von

Objekten

Page 17: Distributed Database Systems Parallele Datenbanksysteme von Stefan Schneider.

Partitionierung

Class Engine as Object Attributes No_cylinder : Integer Cpacity : Real Horsepower: Integer

wegen komplexer Attribute wegen komplexer Methoden

Page 18: Distributed Database Systems Parallele Datenbanksysteme von Stefan Schneider.

Alternative Client/Server Architekturen

Page 19: Distributed Database Systems Parallele Datenbanksysteme von Stefan Schneider.

Objektmanagement

Object Identifier Management logische Object Identifiers physikalische Object Identifiers

Pointer Swizzeling Object Migration

Quellcode am Zielort neu kompilieren kompilierte Klasse wird übertragen nur Quellcode der Klasse übertragen

Page 20: Distributed Database Systems Parallele Datenbanksysteme von Stefan Schneider.

Distributed Object Storage

Object ClusteringDecomposition Storage Model (DSM)Normalized Storage Model (NSM)

Distributed Garbage CollectionReference CountingTracing Based

Page 21: Distributed Database Systems Parallele Datenbanksysteme von Stefan Schneider.

Zusammenfassung

Art der Datenbankrelationaleobjektorientierte

Anzahl der User (Systemarchitektur) Art der Daten (Data Placement,

Organisation von objektorientierten Datenbanken)