Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web...

54
KFK Verteilte Systeme/Informationssysteme WS 2002 Dezember, 02 Technologische Grundlagen des Web Warehousing Juraj Kosmal [email protected]

Transcript of Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web...

Page 1: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

KFK Verteilte Systeme/Informationssysteme WS 2002Dezember, 02

Technologische Grundlagen des Web Warehousing

Juraj [email protected]

Page 2: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Präsentationsinhalt

Internet / Internetservices

Webkomponente

Datenbankzugang übers Web

Architektur und Kapazität eines Web

Warehouse Systems

Page 3: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Internet und Internetservices

Page 4: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Internet

Topologie

TCP/IP Protokoll

Internetadressierung

Uniform Resource Locator (URL)

Page 5: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Internetservices

World Wide Web (WWW) serverseitige Architektur Client schickt ein Request, Server

verarbeitet ihn und schickt die Antwort zurück (zB HTML)

File Transfer Protocol (FTP) Bewegung in der Verzeichnisstruktur Kopieren von Daten

Page 6: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Internetservices

Gopher Menüführung von einer Seite zur nächsten

Wide Area Information Service (WAIS) ermöglicht eine Dokumentensuche

Telnet ermöglicht eine Fernsteuerung des

Computers

Page 7: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Internetservices

Internet Relay Chat (IRC) ermöglicht die Führung einer

RealzeitkommunikationMail

ermöglicht den Korrespondezaustausch [email protected]

Page 8: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Webkomponente

Page 9: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Webkomponente

HTML

MIME Typen

Zustandslosigkeit

Page 10: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

HTML

erlaubt, eine Sache auf verschiedensten Computern gleich zu sehen

dynamische Bewegung zwischen Seiten mittels Hypertext

nicht nur Text, sondern auch Graphiken, Ton und Bild

Page 11: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

HTML

<HTML><HEAD><TITLE>HALLO</TITLE></HEAD><BODY><CENTER><P>Ich bin zentriert!</P></CENTER><FONT COLOR = "#FF0080">Ich bin rosarot!</FONT><P><FONT SIZE = +2>Ich bin um 2 Einheiten größer!</FONT></P><P><a href="Anderes_Dokument.html">Ich bin ein Link zum anderen Dokument.</a></P><P>Und das bin ich: <IMG SRC = "photo.jpg" WIDTH=100 HEIGHT=120></IMG></P></BODY></HTML>

Page 12: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

HTML

Page 13: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

MIME

Multipurpose Internet Mail Extensions

Browser schickt gleichzeitig mit dem

Request eine Mitteilung, welche

MIME-Typen er unterstützt

Page 14: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

MIME

MIME Typ Beschreibung

text/plain bildet einen einfachen ASCII Text ab

text/html bildet einen Text im HTML-Format ab

application/vmd-lotus 1-2-3 öffnet das Lotus 1-2-3 Programm

Image/gif ein Bild im gif-Format

Image/jpg ein Bild im jpg-Format

Video/mpeg verwendet einen Videoplayer

Page 15: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Zustandslosigkeit

Page 16: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Der Datenbankzugang über das Web

Page 17: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Der Datenbankzugang über das Web

Preprocess and publish approach

(PPP)

Common Gateway Interface (CGI)

Java

Page 18: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Preprocess and publish approach

Dokumente werden vorbereitet, in das HTML Format konvertiert... (preprocess)

...und zur Verfügung gestellt (publish).User bewegt sich mittels

erhaltenen URLs Hypertext

Page 19: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Common Gateway Interface

ArchitekturKomponente

Input Kommunikation Verarbeitung Output

Page 20: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Input

mittels command line

http://www.animal-server.com/dogs/

dog-names.exe?20

Page 21: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Input

mittels HTML

<HTML><HEAD><TITLE>Umfrage</TITLE></HEAD><BODY><CENTER><P><H2>Umfrage</H2></P></CENTER><FORM ACTION = "http://www.umfragezentrale.at"><P>Wieviele Hundenamen möchten Sie bekommen? <INPUT TYPE = "TEXT" NAME = "AnzHN"></P></FORM></BODY></HTML>

Page 22: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Input

mittels HTML

Page 23: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Kommunikation

Browser - Server Übergabe von Methode, URL,

Parametern, MIME-Typen

GET HTTP://WWW.UMFRAGEZENTRALE.AT?AnzHN=20HTTP/2.0Accept text/htmlText/text…………

Page 24: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Kommunikation

Server - Programm Übergabe mehrerer Daten wegen

Zustandslosigkeit...

Page 25: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Variable Zweck

HTTP_ACCEPT MIME Typen, die der Browser akzeptiert

CONTENT_LENGTH die Länge der geschickten Daten

CONTENT_TYPE MIME Typ der vom Browser geschickten Daten

QUERY_STRING die vom User zur Verarbeitung eingegebene

Information

REMOTE_ADDR IP-Adresse des Browsers

REMOTE_HOST voller DNS Hostname des Browsers

REQUEST_METHOD die vom Browser angefragte HTML Methode (GET,

POST..)

SERVER_NAME DNS Hostname oder IP-Adresse des Servers

SERVER_PORT die Portnummer des Servers

SERVER_PROTOCOL die Versionnummer des von Server verwendeten

HTTP

Page 26: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Kommunikation

Server - Programm Übergabe mehrerer Daten wegen

Zustandslosigkeit Darstellung des Responds

einfacher TextHTML Dokument

Page 27: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Verarbeitung

3 Spracharten Scripts Standardprogrammiersprachen Java

Standardisierte Datenbankzugangskonfi-gurationen

Page 28: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Verarbeitung - Scripts

Vorteile Einfach zu lernen,

schreiben, verwenden

Mächtigkeit der Befehle

Einfach zu lesen, ändern

Nachteile Unsicher, weil

uncompiliert gehalten

Ineffizient

Geringe Anzahl an Befehlen

Page 29: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Verarbeitung - Standardprogrammiersprachen

Große Sammlung an BefehlenCompilierbar

Höhere Sicherheit Höhere Effizienz Schwer veränderbar

Schwer zu erlernen

Page 30: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Verarbeitung – Standardisierte Datenbankzugangskonfigurationen

Server Native Database

ODBC Database Interface

Native Remote Database Interface

Middleware-driven Interface

Page 31: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Output

Ausgabe der Information in einem nützlichen Format

Page 32: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Der Datenbankzugang über das Web

Preprocess and publish approach

(PPP)

Common Gateway Interface (CGI)

Java

Page 33: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Java

Page 34: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Java

Charakteristik COBOL des 21. Jahrhunderts Objektorientiert Sicher

Keine ZeigerBytecodeprüfer

Plattformunabhängigkeit Multithreading

Page 35: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Java

Komponente Java Development Kit (JDK)

Compiler, Applet Viewer, Debugger, Applet Demos

Java Application Programming Interface (Java API)java.lang, java.io, java.util, java.net, usw.

Page 36: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Java

Standard Extensions

Enterprise Extensions – remote accessJDBC – relationale DB

RMI

IDL

Commerce Extensions

Page 37: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Java

Standard Extensions

Management Ext.

Server API

Media API

Java Beans

Page 38: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Java Database Connectivity

Datenzugriff mit Java

Sammlung von Klassen und Methoden DriverManager, Driver

Connection, Statement

Query, ResultSet

Close

Page 39: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

JDBC - Beispiel

//* The animal listing program lists all animals in//* the database and their ages import java.sql.* public class Samplet extends java.applet.Applet { public void paint (Graphics g) { //* declare string variables to hold values String driver = "oracle.sql.OracleDriver" String url = "jdbc:oracle:thin:bob@animaldb" String user = "bob" String pass = "bobpw" String query1 = "Select name, age from animal"

Page 40: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

JDBC - Beispiel

try { //*load the driver; Class.forName(driver); //* make the connection Connection c; c = DriverManager.getConnection(url,user,pass); //* create the statement Statement stmt; stmt = c.createStatement(); //* Execute the Query and load into the ResultSet //* called rs ResultSet rs = stmt.executeQuery(query1);

Page 41: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

JDBC - Beispiel

//* create loop for the processing of results //* the value of next will be incremented(the next //* row will be read) until there are none left. //* Then rs.next() will be false and the //* while loop will end while (rs.next()) { //* get the two columns from the next row //* the first column, name, is a String, so use //* getString the second column, age, is an //* Integer, so use getInt print them out

Page 42: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

JDBC - Beispiel

String c1 = rs.getString(1); Integer c2 = rs.getInt(2); g.drawString(c1,20,y); g.drawString(c2,100,y); y = y +10; } //* Close the statement and the connection stmt.close(); c.close(); } } }

Page 43: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Architektur und Kapazität eines Webwarehouse

Page 44: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Architektur und Kapazität eines Webwarehouse

Funktionalität

Architektur

Kapazität

Page 45: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Architektur eines Web Warehouse

Intranet Configuration

Leveraged Inbound Configuration

Leveraged Outbound Configuration

Dual-Leveraged Configuration

Page 46: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Funktionalität der Data Warehousing Umgebung

Erwerbsfunktion (E)

Speicherfunktion (S)

Zugriffsfunktion (Z)

Page 47: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Intranet Configuration

      

  E SZ

Page 48: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Leveraged Inbound Configuration

ES

Z

Page 49: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Leveraged Outbound Configuration

E S Z

Page 50: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Dual-Leveraged Configuration

E S Z

Page 51: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Kapazität

Transaktionsrate

Umfang

Quantität

TPH – transactions

ph

MPH – megabytes

ph

Page 52: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Kapazität

Knotenkapazität

Verbindungskapazität

Page 53: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Präsentationsinhalt

Internet / Internetservices

Webkomponente

Datenbankzugang übers Web

Architektur und Kapazität eines Web

Warehouse Systems

Page 54: Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002 Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at.

Dezember, 02 KFK Verteilte Systeme/Informationssysteme WS 2002

Danke für die Aufmerksamkeit!