Hauptspeicher- Datenbanksysteme Hardware-Entwicklungen Anwendungsstudie: Handelsunternehmen Column-...

Hauptspeicher-Datenbanksysteme

• Hardware-Entwicklungen• Anwendungsstudie: Handelsunternehmen• Column- versus Row-Store• OLAP&OLTP: Snapshotting• Kompaktifizierung• Mehrbenutzersynchronisation• Indexierung• Multi-Core Anfragebearbeitung

Vortrag am Freitag Marcel Kornacker Cloudera Impala 13 Uhr

Hauptspeicher-Datenbanksysteme Disk is Tape, Tape is dead … Jim Gray

Die Zeit ist reif für ein Re-engineering der Datenbanksysteme

Man kann heute für 25000 Euro einen Datenbankserver mit 1 TeraByte Hauptspeicher und 32 Rechenkernen kaufen

Einsatz von Hauptspeicher-Datenbanksystemen

Feasibility: Main Memory DBMS Amazon

Data VolumeRevenue: 15 billion

EuroAvg. Item Price: 15

Euro1 billion order lines

per year 54 Bytes per order

line 54 GB per year + additional data - compression

Transaction RateAvg: 32 orders per s Peak rate:

Thousands/s+ inquiries

IntelTera Scale InitiativeServer with several

TB main memoryWe just ordered one

from Dell for 49 K Euro

Main Memory capacity will grow faster than Customers‘ Needs

Cf. RAMcloud-project at StanfordOusterhoud et al.

Leistungsengpässe: Profiling eines klassischen Datenbanksystems

Widerholung: Speicherhierarchie

Register

(L1/L2/L3)

Hauptspeicher

Plattenspeicher

Archivspeicher

Überblick: Speicherhierarchie

Register

Hauptspeicher

Plattenspeicher

Archivspeicher

1 – 8 ByteCompiler

8 – 128 ByteCache-Controller

4 – 64 KBBetriebssystem

Benutzer

1-10ns

Register

10-100ns

100-1000ns

Hauptspeicher

Plattenspeicher

Archivspeicher

Zugriffslücke

1-10ns

Register

10-100ns

100-1000ns

Hauptspeicher

Plattenspeicher

Archivspeicher

Zugriffslü

Kopf (1min)

Raum (10 min)

München (1.5h)

Pluto (2 Jahre)

Andromeda

(2000 Jahre)

Row Store versus Column Store

Anfragebearbeitung

Komprimierung

Datenstrukturen einer Hauptspeicher-Datenbank

Row-Store-Format

Column-Store-Format

Column-Store-Format (cont‘d)

Einfügeoperation eines Tupels

Insert into Verkaeufe values (12, 007, 4711, 27.50)

Anfragen

Hybrides Speichermodell

Anfragebearbeitung

Anwendungsoperationen in der Datenbank: Stored Procedures

Snapshots für Anfragen

Snapshot der Haupt-Datenbank

Haupt-Datenbank

Update Staging: In vielen Systemen verwendet, zB. NewDB von SAP

Scan-only Datenbanken: ISAO von IBM oder Crescando von der ETHZ

Ursprüngliches Schattenspeicher-Verfahren: Lorie77 für IBM System R

Copy on Write

Update aa‘

Snapshotting via fork-ing: Details

Snapshot Maintenance: copy on write

Fast because of Hardware-Support: MMU

OLAP Queries on Tx-Consistent Snapshots

Multiple Query Sessions

Synchronization-Assertions Serializability of the OLTP Transactions

What else if executed serially We support full ACID see coming slides

Snapshot isolation of the OLAP queriesMulti-version mixed synchronization methodSeveral OLAP queries form one Tx = OLAP SessionBernstein, Hadzilacos, Goodman: Chapter 5.5

Kompaktifizierung: Motivation

Kompaktifizierung der Datenbank

Invalidierung gefrorener Datenobjekte

Transaktionsverwaltung: serielle Ausführung auf Partitionen

Snapshot used for Tx-consistentBackup

Logging the Transaction Processing

To Storage Server via 10 Gb/s rDMA Interface

(e.g. Myrinet or Infiniband)

Isolation von OLAP und OLTP

Tentative Ausführung langer Transaktionen

•Stand-By for OLTP

•Active for OLAP•Possible for Backup

High Availability &Load Balancing

A B C D E F

Column-Store

Indexstrukturen für Hauptspeicher-Datenbanken Radix-Baum / Trie / Präfixbaum

Idee des Adaptiven Radix-Baums ART

Adaptive Knoten des ART-Baums

Join-Berechnung Cache-Lokalität

Mehrkern-Parallelität

NUMA-Berücksichtigung

Synchronisations-freie Parallelität

Grundidee des hoch-parallelen Sort/Merge-Joins

Bereichspartitionierung

Hochparallel Bereichs/Radix-Partitionierung

Paralleler Radix-Join

Mehrfache Partitionierung des Radix-Joins: Cache-Lokalität

Hash-Join-Teams: Globale Hashtabelle

Algorithmen auf sehr großen Datenmengen

789013174289

S44179756

• Nested Loop: O(N2)

• Sortieren: O(N log N)

• Partitionieren und Hashing

Hauptspeicher- Datenbanksysteme Hardware-Entwicklungen Anwendungsstudie: Handelsunternehmen Column-...

Documents

Transcript of Hauptspeicher- Datenbanksysteme Hardware-Entwicklungen Anwendungsstudie: Handelsunternehmen Column-...

Zeilen- vs. spaltenorientierte Datenhaltung im … · Einführung und Überblick Aufbau einer Speicherhierarchie, wobei: –Abfragen über oft abgerufene, große Datenmengen im Hauptspeicher

Download (332Kb) - ePub WU - Wirtschaftsuniversität Wienepub.wu.ac.at/608/1/document.pdf · 2 1 Einleitung und Problemstellung Die Entwicklung der Handelsunternehmen ist von zahlreichen

Fakultät für informatik informatik 12 technische universität dortmund Die Speicherhierarchie - Hauptspeicher - Peter Marwedel Informatik 12 TU Dortmund.

1. Data Warehouses - Einführung - dbs.uni-leipzig.de · 1. Data Warehouses - Einführung Definition Data Warehouse Einsatzbeispiele OLTP vs. OLAP , Grobarchitektur Virtuelle vs.

Innovatives Personalmarketing bei einem dezentralen Handelsunternehmen Innovatives Personalmarketing bei einem dezentralen Handelsunternehmen Westfälische.

GESCHÄFTSBERICHT - Hauptversammlung...Mobile Technologien kundenfreundlich in die IT-Landschaften von Banken und Handelsunternehmen zu integrieren, ist eine der wesentlichen Herausforderungen

ABCDEF A B C D E F OLAP OLTP DW-Architektur: Row Store vs Column Store.

FRAGEN & ANTWORTEN · STeP ermöglicht global agierenden Marken und Handelsunternehmen, weltweit nach geeigneten Lieferanten zu suchen, welche ihren Anforderungen hinsichtlich Umweltschutz

INSTITUT FUR INFORMATIK¨ HyPer: HYbrid OLTP&OLAP High PERformance

Betriebssysteme: 09- Virtueller Speicher · bestimmte Datenstrukturen werden nicht voll belegt – Prozesse benötigen evtl. mehr Speicher als Hauptspeicher vorhanden Idee: – Vortäuschen

INSTITUT FUR INFORMATIK¨ HyPer: HYbrid OLTP&OLAP High ... · by various traditional database management features (buﬀer management, logging, locking, etc.) and proving the feasibility

Projekt: Virtualisierung - Gastl · eigenen Komponenten, wie CPU, Hauptspeicher, Festplatten, Grafikkarten, Netzwerkkarte usw. Auf einige Hardwarekomponenten des Computers kann eine

Mit intelligentem Customer Scoring und automatisierten ... · 3Pagen und viele andere Handelsunternehmen setzen Gpredictive erfolgreich ein. optilyz ist Europas führende Software

Würth: Vom Handelsunternehmen zum Innovationstreiber...Würth: Vom Handelsunternehmen zum Innovationstreiber Peter Zürn Mitglied der Konzernführung Logistikforum Nürnberg, 20.11.2019

Mesh: Gesamtheit der Vertex- und Dreicksarrays eines Polygons Streambarer Mesh: Mesh dessen Daten nicht in ihrer Gesamtheit im Hauptspeicher vorhanden.

EMC VSPEX für virtualisierte Oracle Database 12c OLTP ... · Inhalt EMC VSPEX für virtualisierte Oracle Database 12c OLTP-Umgebungen 3 Unterstützt durch EMC VNXe und EMC Data Protection

Automatisierte Hauptspeicher-Forensik auf Basis von Open ... · Automatisierte Hauptspeicher-Forensik auf Basis von Open-Source-Tools - Detektion von Verschlüsselungstrojanern mittels

3 Konzeption und Management · für einen Konzern entwickeln, wesentlich mehr Details berücksichtigen als bei einer Shop-Integration für ein mittelständiges Handelsunternehmen

Vorlesung Rechnerarchitektur - mobile.ifi.lmu.de¼hrung.pdf · Aktuelle Intel-Architektur integriert North Bridge in den Prozessor Grafikprozessor optional in der CPU enthalten Hauptspeicher

OLTP Data Warehouse Data Mining · Data Mining Kapitel 17. 2 OLTP: Online Transaction Processing Beispiele Flugbuchungssystem Bestellungen in einem Handelsunternehmen Charakterisierung