Principles of Distributed Database Systems
date post
09-Mar-2016Category
Documents
view
42download
1
Embed Size (px)
description
Transcript of Principles of Distributed Database Systems
Principles of Distributed Database Systemsausgearbeitet vonRainer Steinlesberger 0026446
EinleitungDDBS = Netzwerk von Computern (Sites) + DatenbankDDBS = Verteilung + Integration+=NetzwerkDatenbankDDBS
bersichtEinleitungWas ist ein DDBS?berblick ber relationale DBMSComputer NetzwerkeArchitektur von DBMSDesign einer verteilten Datenbank
Geschichtlicher RckblickEnde der 60er Anfang der 70er ging man zunehmend dazu ber Datenbanksysteme zu benutzen, um
die Datenunabhngigkeit der Anwendungsprogramme zu erhhen,transaktionsorientierte Verarbeitung zu ermglichen,Mehrbenutzerbetrieb zu realisieren,sowie die Recovery-Funktionen zu verbessern.
Entstehen von Rechenzentren, wodurch die Betriebsorganisation zentralisiert wurde!
Die Datenmenge wuchsen immer weiter an zusammengehrende Datenbestnde wurden auf verschiedene Datenbanken verteilt.
Dadurch entstanden Probleme mit der Konsistenthaltung der Daten.
In den 80iger und 90iger Jahren konnten durch Onlineanwendungen bislang getrennteAnwendungen und Datenbestnde zusammengefhrt werden.
Desshalbwurden integrierte verteilte Informationssysteme realisiert.
DefinitionA distributed database is a collection of multiple, logically interrelated databases distributed over a computer network. A distributed database management system is the software that permits the management of the DDBS and makes the distribution transparent to the users.
Zentrale Datenbankin einem NetzwerkCommunicationNetworkBostonParisSanFranciscoEdmonton
Verteilte DatenbankstrukturCommunicationNetworkBostonParisSanFranciscoEdmontonBoston AngestellteParis AngestellteBoston ProjekteParis AngestellteParis ProjekteBoston AngestellteBoston ProjekteEdmonton AngestellteParis ProjekteEdmont ProjekteSan Francisco AngestellteSan Francisco Projekte
Transparentes ManagementDatenunabhngigkeitNetzwerk TransparenzReplizierungs- bzw. KopiertransparenzFragmentierungstransparenz
Verbesserte LeistungEin DBMS teilt die Datenbank und erlaubt es den Daten somit sehr sehr nahe ihrem Ort, wo sie gebraucht werden, gespeichert zu werden.dies hat 2 Vorteile:Seit jeder Knoten einen Teil der Daten bewltigt, ist der Kampf um Ressourcen wie CPU nicht mehr so wichtig wie in zentralisierten DatenbankenLokalisierung vermindert die Verzgerung bei entfernten Aufrufen
ProblemeVerteiltes Datenbank-DesignVerteilte SuchprozesseVerteiltes Verzeichnis-ManagementVerteilte KonkurrenzkontrolleVerteiltes Deadlock ManagementBetriebssystem-UntersttzungHeterogene Datenbanken
3. Relationale DBMS
RelationenDef.: in Beziehung stehend....Relationen sind 2dimensonale Tabellen von Werten
1. NormalformO------------------------------------------------------------------------------------------------O| Vorlesungen | Verantwortliche | Hrer | Bewert. |O------------------------------------------------------------------------------------------------O| Vorl.Nr. | Vorl.Name | Hrs. | Vorn. | Nachn. | Nr. | Vorn. | Nachn. | Matr.Nr. |Note|O------------------------------------------------------------------------------------------------O| || 3721 | Informatik | HS1 | 130 | Alan | Kurow | 102 | Fritz | Maier | 8610826 | 2 || 3721 | Informatik | HS1 | 130 | Alan | Kurow | 102 | Fritz | Mller | 8510721 | 5 || 3721 | Informatik | HS1 | 130 | Franz | Girke | 108 | Fritz | Maier | 8610826 | 3 || 3721 | Informatik | HS1 | 130 | Franz | Girke | 108 | Fritz | Mller | 8510721 | 4 || 3721 | Informatik | HS1 | 130 | Franz | Girke | 108 | Hans | Schuh | 8610933 | 1 O----------------------------------------------------------------------------------------------------O| Vorlesungen | Verantwortliche | Hrer | Bewert.|O----------------------------------------------------------------------------------------------------O|Vorl.Nr. | Vorl.Name | HS | HS-Gr. | Vorn. | Nachn. | Nr. | Vorn. | Nachn. | Matr.-Nr. | Note|O----------------------------------------------------------------------------------------------------O|3721 | Informatik | HS1 | 130 | Alan | Kurow | 102 | Fritz | Maier | 8610826 | 2 3721 | Informatik | HS1 | 130 | Alan | Kurow | 102 | Fritz | Mller | 8510721 | 5 3721 | Informatik | HS1 | 130 | Franz | Girke | 108 | Fritz | Maier | 8610826 | 3 3721 | Informatik | HS1 | 130 | Franz | Girke | 108 | Fritz | Mller | 8510721 | 4 3721 | Informatik | HS1 | 130 | Franz | Girke | 108 | Hans | Schuh | 8610933 | 1
2. NormalformDie 2. Normalform vermeidet partielle funktionale Abhngigkeiten (diese bewirken Redundanzen). Eine partielle funktionale Abhngigkeit besteht, wenn Attribute (die nicht Schlsselkandidaten sind) funktional schon von einem Teil des Schlssels abhngen. Die zweite Normalform kann durch Elimination der abhngigen Attribute und Auslagerung in eine eigene Relation erreicht werden.
Der Primrschlssel besteht aus dem Attributetupel (Vorlesungsnummer, Verantwortlichennummer, Matrikelnummer)
Wir zerlegen nun die Relation in vier Relationen, die dann in 2. Normalform sind.
2. NormalformO-------------------------------------------O| V.-Nr. | Ver.-Nr. | Matr.-Nr. | Bewertung |O-------------------------------------------O||| 3721 | 102 | 8610826 | 2|| 3721 | 102 | 8610721 | 5 || 3721 | 108 | 8610826 | 3 || 3721 | 108 | 8610721 | 4 || 3721 | 108 | 8610933 | 1 O------------------------------------O| Hrsaal V.-Nr. | V.-Name | Bez. | Gre |O------------------------------------O| | Informatik | HS1 | 130 |3722 | Informatik | HS4 | 140 |O-------------------------------O| Ver.-Nr. | Vorname | Nachname|O------------------------------O102 | Alan | Kurow | 108 | Franz | Girke | O----------------------------------O|Matr.-Nr. | H.-Vorn. | H.-Nachn. |O----------------------------------O|8610826 | Fritz | Maier |8610721 | Fritz | Mller |8610933 | Hans | Schuh |
3. NormalformO-------------------------------------------O|V.-Nr. | V.-Name | Hrsaal-Bezeichnung |O-------------------------------------------O|| Informatik | HS1| Informatik | HS4 || : | : | : |
O-------------------------------------O|Hrsaal-Bezeichnung | Hrsaal-Gre |O-------------------------------------O|HS1 | 130 HS4 | 140 || : | : | Eine Relation ist in dritter Normalform, wenn sie in 2. Normalform ist und es kein Attribut, welches nicht Teil des Schlssels ist, gibt, welches transitiv vom Schlssel abhngt.O------------------------------------O| Hrsaal V.-Nr. | V.-Name | Bez. | Gre |O------------------------------------O| | Informatik | HS1 | 130 |3722 | Informatik | HS4 | 140 |
Relationale Daten SpracheRelationale AlgebraVerknpft konstruktiv die vorhandenen Relationen durch Operatoren wie ,,...Relationaler KalkulusBeschreibt Eigenschaften des gewnschten Ergebnisses mit Hilfe einer Formel der Prdikatenlogik 1. Stufe unter Verwendung von ,,,,,...
Relationale AlgebraSelectionProjectionUnionSet DifferenceCartesian ProductIntersection..........
Einige Beispiele...Selection Semester>10(Studenten)Name(Studenten) ...... ProjektionName (Studenten) Name(Professoren) (2 Relationen mit gleichem Schema) Name (Studenten) - Name(Geprft) (2 Relationen mit gleichem Schema)
Relationaler KalkulusTupelkalkl{t | F(t)} {p|p Professoren p.Alter = 35}
Bereichskalkl{[v1, v2,..., vn] | P(v1, v2,..., vn)}
4. Netzwerk
4. Netzwerk
Topologien im berblick...
OSI-Referenzmodell
5. Architektur von DBMS
5. Architektur von DBMSDie Idee hinter dem ANSI/SPARC Modell ist die Datenunabhngigkeit der Daten gegenber Vernderungen der Speicherstrukturen.Das DBMS ist eine Schnittstelle zu den Daten.
Architekturmodell
Architektur von DBMSClient - Server ArchitekturVerteilte Datenbank ArchitekturMulti Datenbank Architektur
Client/Server Architektur
Hier gibt es typischerweise einen zentralen Datenbank-Server und eine grere Anzahl vernetzter Arbeitsplatzrechner, die keine relevanten Daten speichern. Der Benutzer am Arbeitsplatzrechner sieht die volle Funktionalitt des DBMS. Das System verhlt sich wie ein zentrales Datenbanksystem, die Kommunikation ist fr den Benutzer transparent
Verteiltes DatenbanksystemHier gibt es mehrere Datenbankserver, wobei bestimmte Daten auf nur einem Rechner oder auch auf mehreren (replizit) gespeichert sein knnen. Eine virtuelle Datenbank, deren Komponenten physisch in einer Anzahl unterschiedlicher, real existierender DBMS abgebildet werden.Transaktionen knnen in diesem Fall ber mehrere DBMS laufen.Sammlung von Daten, dieAufgrund gemeinsamer, verknpfender Eigenschaften dem gleichen System angehrenAuf versch. Rechnern im Netzwerk verteilt sindWobei jeder Rechner seine eigene Datenbank besitztAutonom lokal Aufgaben abwickeln kann
Verteiltes Datenbanksystem- gleichzeitige Benutzung der Rechenleistung mehrerer Rechner - Engpa in zentralen Datenbanksystemen bei Zugriff auf die Daten wird vermieden, da die Daten verteilt sind (ggf. repliziert)- Daten werden von einem Datenbanksystem verwaltet- Verteilungstransparenz- Grundlage: 4-Ebenen-Schema-Architektur
Verteiltes Datenbanksystem4 - Ebenen - Schema - Architektu