Principles of Distributed Database Systems

Click here to load reader

  • date post

    09-Mar-2016
  • Category

    Documents

  • view

    42
  • download

    1

Embed Size (px)

description

Principles of Distributed Database Systems. ausgearbeitet von Rainer Steinlesberger 0026446. Einleitung. DDBS = Netzwerk von Computern (Sites) + Datenbank DDBS = Verteilung + Integration. +. Netzwerk. Datenbank. =. DDBS. Übersicht. Einleitung Was ist ein DDBS? - PowerPoint PPT Presentation

Transcript of Principles of Distributed Database Systems

  • Principles of Distributed Database Systemsausgearbeitet vonRainer Steinlesberger 0026446

  • EinleitungDDBS = Netzwerk von Computern (Sites) + DatenbankDDBS = Verteilung + Integration+=NetzwerkDatenbankDDBS

  • bersichtEinleitungWas ist ein DDBS?berblick ber relationale DBMSComputer NetzwerkeArchitektur von DBMSDesign einer verteilten Datenbank

  • Geschichtlicher RckblickEnde der 60er Anfang der 70er ging man zunehmend dazu ber Datenbanksysteme zu benutzen, um

    die Datenunabhngigkeit der Anwendungsprogramme zu erhhen,transaktionsorientierte Verarbeitung zu ermglichen,Mehrbenutzerbetrieb zu realisieren,sowie die Recovery-Funktionen zu verbessern.

    Entstehen von Rechenzentren, wodurch die Betriebsorganisation zentralisiert wurde!

    Die Datenmenge wuchsen immer weiter an zusammengehrende Datenbestnde wurden auf verschiedene Datenbanken verteilt.

    Dadurch entstanden Probleme mit der Konsistenthaltung der Daten.

    In den 80iger und 90iger Jahren konnten durch Onlineanwendungen bislang getrennteAnwendungen und Datenbestnde zusammengefhrt werden.

  • Desshalbwurden integrierte verteilte Informationssysteme realisiert.

  • DefinitionA distributed database is a collection of multiple, logically interrelated databases distributed over a computer network. A distributed database management system is the software that permits the management of the DDBS and makes the distribution transparent to the users.

  • Zentrale Datenbankin einem NetzwerkCommunicationNetworkBostonParisSanFranciscoEdmonton

  • Verteilte DatenbankstrukturCommunicationNetworkBostonParisSanFranciscoEdmontonBoston AngestellteParis AngestellteBoston ProjekteParis AngestellteParis ProjekteBoston AngestellteBoston ProjekteEdmonton AngestellteParis ProjekteEdmont ProjekteSan Francisco AngestellteSan Francisco Projekte

  • Transparentes ManagementDatenunabhngigkeitNetzwerk TransparenzReplizierungs- bzw. KopiertransparenzFragmentierungstransparenz

  • Verbesserte LeistungEin DBMS teilt die Datenbank und erlaubt es den Daten somit sehr sehr nahe ihrem Ort, wo sie gebraucht werden, gespeichert zu werden.dies hat 2 Vorteile:Seit jeder Knoten einen Teil der Daten bewltigt, ist der Kampf um Ressourcen wie CPU nicht mehr so wichtig wie in zentralisierten DatenbankenLokalisierung vermindert die Verzgerung bei entfernten Aufrufen

  • ProblemeVerteiltes Datenbank-DesignVerteilte SuchprozesseVerteiltes Verzeichnis-ManagementVerteilte KonkurrenzkontrolleVerteiltes Deadlock ManagementBetriebssystem-UntersttzungHeterogene Datenbanken

  • 3. Relationale DBMS

  • RelationenDef.: in Beziehung stehend....Relationen sind 2dimensonale Tabellen von Werten

  • 1. NormalformO------------------------------------------------------------------------------------------------O| Vorlesungen | Verantwortliche | Hrer | Bewert. |O------------------------------------------------------------------------------------------------O| Vorl.Nr. | Vorl.Name | Hrs. | Vorn. | Nachn. | Nr. | Vorn. | Nachn. | Matr.Nr. |Note|O------------------------------------------------------------------------------------------------O| || 3721 | Informatik | HS1 | 130 | Alan | Kurow | 102 | Fritz | Maier | 8610826 | 2 || 3721 | Informatik | HS1 | 130 | Alan | Kurow | 102 | Fritz | Mller | 8510721 | 5 || 3721 | Informatik | HS1 | 130 | Franz | Girke | 108 | Fritz | Maier | 8610826 | 3 || 3721 | Informatik | HS1 | 130 | Franz | Girke | 108 | Fritz | Mller | 8510721 | 4 || 3721 | Informatik | HS1 | 130 | Franz | Girke | 108 | Hans | Schuh | 8610933 | 1 O----------------------------------------------------------------------------------------------------O| Vorlesungen | Verantwortliche | Hrer | Bewert.|O----------------------------------------------------------------------------------------------------O|Vorl.Nr. | Vorl.Name | HS | HS-Gr. | Vorn. | Nachn. | Nr. | Vorn. | Nachn. | Matr.-Nr. | Note|O----------------------------------------------------------------------------------------------------O|3721 | Informatik | HS1 | 130 | Alan | Kurow | 102 | Fritz | Maier | 8610826 | 2 3721 | Informatik | HS1 | 130 | Alan | Kurow | 102 | Fritz | Mller | 8510721 | 5 3721 | Informatik | HS1 | 130 | Franz | Girke | 108 | Fritz | Maier | 8610826 | 3 3721 | Informatik | HS1 | 130 | Franz | Girke | 108 | Fritz | Mller | 8510721 | 4 3721 | Informatik | HS1 | 130 | Franz | Girke | 108 | Hans | Schuh | 8610933 | 1

  • 2. NormalformDie 2. Normalform vermeidet partielle funktionale Abhngigkeiten (diese bewirken Redundanzen). Eine partielle funktionale Abhngigkeit besteht, wenn Attribute (die nicht Schlsselkandidaten sind) funktional schon von einem Teil des Schlssels abhngen. Die zweite Normalform kann durch Elimination der abhngigen Attribute und Auslagerung in eine eigene Relation erreicht werden.

    Der Primrschlssel besteht aus dem Attributetupel (Vorlesungsnummer, Verantwortlichennummer, Matrikelnummer)

    Wir zerlegen nun die Relation in vier Relationen, die dann in 2. Normalform sind.

  • 2. NormalformO-------------------------------------------O| V.-Nr. | Ver.-Nr. | Matr.-Nr. | Bewertung |O-------------------------------------------O||| 3721 | 102 | 8610826 | 2|| 3721 | 102 | 8610721 | 5 || 3721 | 108 | 8610826 | 3 || 3721 | 108 | 8610721 | 4 || 3721 | 108 | 8610933 | 1 O------------------------------------O| Hrsaal V.-Nr. | V.-Name | Bez. | Gre |O------------------------------------O| | Informatik | HS1 | 130 |3722 | Informatik | HS4 | 140 |O-------------------------------O| Ver.-Nr. | Vorname | Nachname|O------------------------------O102 | Alan | Kurow | 108 | Franz | Girke | O----------------------------------O|Matr.-Nr. | H.-Vorn. | H.-Nachn. |O----------------------------------O|8610826 | Fritz | Maier |8610721 | Fritz | Mller |8610933 | Hans | Schuh |

  • 3. NormalformO-------------------------------------------O|V.-Nr. | V.-Name | Hrsaal-Bezeichnung |O-------------------------------------------O|| Informatik | HS1| Informatik | HS4 || : | : | : |

    O-------------------------------------O|Hrsaal-Bezeichnung | Hrsaal-Gre |O-------------------------------------O|HS1 | 130 HS4 | 140 || : | : | Eine Relation ist in dritter Normalform, wenn sie in 2. Normalform ist und es kein Attribut, welches nicht Teil des Schlssels ist, gibt, welches transitiv vom Schlssel abhngt.O------------------------------------O| Hrsaal V.-Nr. | V.-Name | Bez. | Gre |O------------------------------------O| | Informatik | HS1 | 130 |3722 | Informatik | HS4 | 140 |

  • Relationale Daten SpracheRelationale AlgebraVerknpft konstruktiv die vorhandenen Relationen durch Operatoren wie ,,...Relationaler KalkulusBeschreibt Eigenschaften des gewnschten Ergebnisses mit Hilfe einer Formel der Prdikatenlogik 1. Stufe unter Verwendung von ,,,,,...

  • Relationale AlgebraSelectionProjectionUnionSet DifferenceCartesian ProductIntersection..........

  • Einige Beispiele...Selection Semester>10(Studenten)Name(Studenten) ...... ProjektionName (Studenten) Name(Professoren) (2 Relationen mit gleichem Schema) Name (Studenten) - Name(Geprft) (2 Relationen mit gleichem Schema)

  • Relationaler KalkulusTupelkalkl{t | F(t)} {p|p Professoren p.Alter = 35}

    Bereichskalkl{[v1, v2,..., vn] | P(v1, v2,..., vn)}

  • 4. Netzwerk

  • 4. Netzwerk

  • Topologien im berblick...

  • OSI-Referenzmodell

  • 5. Architektur von DBMS

  • 5. Architektur von DBMSDie Idee hinter dem ANSI/SPARC Modell ist die Datenunabhngigkeit der Daten gegenber Vernderungen der Speicherstrukturen.Das DBMS ist eine Schnittstelle zu den Daten.

  • Architekturmodell

  • Architektur von DBMSClient - Server ArchitekturVerteilte Datenbank ArchitekturMulti Datenbank Architektur

  • Client/Server Architektur

    Hier gibt es typischerweise einen zentralen Datenbank-Server und eine grere Anzahl vernetzter Arbeitsplatzrechner, die keine relevanten Daten speichern. Der Benutzer am Arbeitsplatzrechner sieht die volle Funktionalitt des DBMS. Das System verhlt sich wie ein zentrales Datenbanksystem, die Kommunikation ist fr den Benutzer transparent

  • Verteiltes DatenbanksystemHier gibt es mehrere Datenbankserver, wobei bestimmte Daten auf nur einem Rechner oder auch auf mehreren (replizit) gespeichert sein knnen. Eine virtuelle Datenbank, deren Komponenten physisch in einer Anzahl unterschiedlicher, real existierender DBMS abgebildet werden.Transaktionen knnen in diesem Fall ber mehrere DBMS laufen.Sammlung von Daten, dieAufgrund gemeinsamer, verknpfender Eigenschaften dem gleichen System angehrenAuf versch. Rechnern im Netzwerk verteilt sindWobei jeder Rechner seine eigene Datenbank besitztAutonom lokal Aufgaben abwickeln kann

  • Verteiltes Datenbanksystem- gleichzeitige Benutzung der Rechenleistung mehrerer Rechner - Engpa in zentralen Datenbanksystemen bei Zugriff auf die Daten wird vermieden, da die Daten verteilt sind (ggf. repliziert)- Daten werden von einem Datenbanksystem verwaltet- Verteilungstransparenz- Grundlage: 4-Ebenen-Schema-Architektur

  • Verteiltes Datenbanksystem4 - Ebenen - Schema - Architektu