Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme...

24
Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsyst eme Kapitel 16: Grundlagen des Data Mining

Transcript of Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme...

Page 1: Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 16: Grundlagen des Data Mining.

Gottfried Vossen5. Auflage 2008

Datenmodelle, Datenbanksprachen

und Datenbankmanagementsysteme

Kapitel 16: Grundlagen des Data Mining

Page 2: Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 16: Grundlagen des Data Mining.

© 2008 Gottfried Vossen

16.1 Einführung

16.2 Klassifikation

16.3 Clusterbildung

16.4 Assoziationsanalyse

16.5 Sequenzanalyse

16.6 Web-Mining

Inhalt

Datenmodelle, 5. Auflage, Kapitel 16 2

Page 3: Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 16: Grundlagen des Data Mining.

© 2008 Gottfried Vossen

Datenquellen (Operationale Datenbanken)

Datenlager(Data Warehouse)

Data Cleansing, Extraction,

Transformation, Loading (ETL)

Selektion

Mining-Resultate

Data Mining

Wissen, Information

Interpretation,Visualisierung

Relevante Daten

16.1 Der KDD-Prozess

3Datenmodelle, 5. Auflage, Kapitel 16

Page 4: Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 16: Grundlagen des Data Mining.

© 2008 Gottfried Vossen

Data Mining

voraussagend(predictive)

beschreibend(descriptive)

KlassifikationClustering

Assoziations-analyse

Sequenz-Analyse

Web-Analyse

16.2 Data Mining in der Übersicht

4Datenmodelle, 5. Auflage, Kapitel 16

Page 5: Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 16: Grundlagen des Data Mining.

© 2008 Gottfried Vossen

Abschluss

Einkommen Einkommen Einkommen

ohne Bachelor Master

-30K 30-50K 50-80K 80+K

16.3 Beispiel einer Klassifikation

5Datenmodelle, 5. Auflage, Kapitel 16

Page 6: Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 16: Grundlagen des Data Mining.

© 2008 Gottfried Vossen

16.4 Beispiel einer in Cluster aufzuteilenden Datenmenge

6Datenmodelle, 5. Auflage, Kapitel 16

Page 7: Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 16: Grundlagen des Data Mining.

© 2008 Gottfried Vossen

16.5 Erstes Clustering

7Datenmodelle, 5. Auflage, Kapitel 16

Page 8: Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 16: Grundlagen des Data Mining.

© 2008 Gottfried Vossen

16.6 Alternatives Clustering

8Datenmodelle, 5. Auflage, Kapitel 16

Page 9: Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 16: Grundlagen des Data Mining.

© 2008 Gottfried Vossen

16.7 Beispiel einer Warenkorbtabelle

9Datenmodelle, 5. Auflage, Kapitel 16

Page 10: Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 16: Grundlagen des Data Mining.

© 2008 Gottfried Vossen

16.8 Nach KundenIDs sortierte Warenkorbtabelle

10Datenmodelle, 5. Auflage, Kapitel 16

Page 11: Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 16: Grundlagen des Data Mining.

© 2008 Gottfried Vossen

ABCD

ABC ABD ACD BCD

AB AC BC AD BD CD

A B C D

{}

16.9 Beispiel zum Dynamic Itemset Counting (DIC)

11Datenmodelle, 5. Auflage, Kapitel 16

Page 12: Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 16: Grundlagen des Data Mining.

© 2008 Gottfried Vossen

16.10 Warenkorbtabelle zum FP-Growth-Verfahren

12Datenmodelle, 5. Auflage, Kapitel 16

Page 13: Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 16: Grundlagen des Data Mining.

© 2008 Gottfried Vossen

{}

f:1

c:1

a:1

m:1

p:1

Kopftabelle

Item Häufigkeit Kopf f 1c 1a 1b 1m 1p 1

16.11 Erster Schritt zur Erzeugung des FP-Tree zum Warenkorb aus Abbildung 16.10

13Datenmodelle, 5. Auflage, Kapitel 16

Page 14: Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 16: Grundlagen des Data Mining.

© 2008 Gottfried Vossen

{}

f:2

c:2

a:2

b:1m:1

p:1 m:1

Kopftabelle

Item Häufigkeit Kopf f 2c 2a 2b 1m 2p 1

16.12 Zweiter Schritt zur Erzeugung des FP-Tree zum Warenkorb aus Abbildung 16.10

14Datenmodelle, 5. Auflage, Kapitel 16

Page 15: Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 16: Grundlagen des Data Mining.

© 2008 Gottfried Vossen

{}

f:4 c:1

b:1

p:1

b:1c:3

a:3

b:1m:2

p:2 m:1

Kopftabelle

Item Häufigkeit Kopf f 4c 4a 3b 3m 3p 3

16.13 Endgültiger FP-Tree zum Warenkorb aus Abbildung 16.10

15Datenmodelle, 5. Auflage, Kapitel 16

Page 16: Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 16: Grundlagen des Data Mining.

© 2008 Gottfried Vossen

16.14 Beispieltabelle studentischer Aktivitäten

16Datenmodelle, 5. Auflage, Kapitel 16

Page 17: Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 16: Grundlagen des Data Mining.

© 2008 Gottfried Vossen

16.15 Beispiel einer Episode

17Datenmodelle, 5. Auflage, Kapitel 16

Page 18: Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 16: Grundlagen des Data Mining.

© 2008 Gottfried Vossen

16.16 Beispiel einer Signalfolge

18Datenmodelle, 5. Auflage, Kapitel 16

Page 19: Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 16: Grundlagen des Data Mining.

© 2008 Gottfried Vossen

16.17 Windows in einer Signalfolge

19Datenmodelle, 5. Auflage, Kapitel 16

Page 20: Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 16: Grundlagen des Data Mining.

© 2008 Gottfried Vossen

16.18 Beispiele für Episoden

20Datenmodelle, 5. Auflage, Kapitel 16

Page 21: Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 16: Grundlagen des Data Mining.

© 2008 Gottfried Vossen

Webseite Hyperlink

16.19 Das Web als Graph

21Datenmodelle, 5. Auflage, Kapitel 16

Page 22: Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 16: Grundlagen des Data Mining.

© 2008 Gottfried Vossen

Such-maschinen

-Index

Benutzeranfrage

Indexer

Laufzeitsystem

Crawler

InternetWebseiten

16.2

0 G

rund

sätz

liche

Arb

eits

wei

se

eine

r Suc

hmas

chin

e

Datenmodelle, 5. Auflage, Kapitel 16 22

Page 23: Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 16: Grundlagen des Data Mining.

© 2008 Gottfried Vossen

Gefundene Dokumente

Relevante und gefundene Dokumente

Relevante Dokumente

Alle Dokumente

16.21 Ergebnisklassifikation im Information Retrieval

23Datenmodelle, 5. Auflage, Kapitel 16

Page 24: Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 16: Grundlagen des Data Mining.

© 2008 Gottfried Vossen

16.22 Ausschnitt aus dem Log eines Web-Servers

24Datenmodelle, 5. Auflage, Kapitel 16