Datenvisualisierung und Entscheidungsfindung - EvIM · Agenda für heute, 24. Oktober 2008 •...

12
Agenda für heute, 24. Oktober 2008 Datenvisualisierung und Entscheidungsfindung Datenvisualisierung und Entscheidungsfindung Diagramme erlauben Vergleiche Diagramme erlauben Vergleiche Pause Grundlagen: Grafische Wahrnehmung Grundlagen: Grafische Wahrnehmung Geometrische Transformationen S b li h D t ll Symbolische Darstellungen Visualisierungen unterstützen die erkundende Datenanalyse Grafische Darstellungen sind oft eine Hilfe für das Verständnis von eine Hilfe für das Verständnis von Ursächlichkeiten (Kausalität) Können sie analytische Aufgaben Können sie analytische Aufgaben bei der Entscheidungsfindung unterstützen? © Departement Informatik, ETH Zürich 2/44 Fallstudie aus der Epidemiologie: Cholera 1854 'Schlechte Luft' wird als Ursache der Cholera-Epidemie in London akzeptiert 1854 Wie konnte die Epidemie durch Stilllegen einer Trinkwasserpumpe beendet 1884 werden, obwohl das Cholerabazillus erst 1884 durch Robert Koch entdeckt wurde? © Departement Informatik, ETH Zürich 3/44 Miasma als Ursache der Cholera Die Theorie um 1850: Schlechte Luft, die aus faulender organischer Materie, dem miasmata entsteht, verursacht die Cholera. Durch das Verbrennen von Kräuter- und Gewürzmischungen sollte die vergiftete Luft beseitigt werden. (Räucherpfanne aus dem 16. Jh.) Selbst Briefe wurden durchstochen in dreiteilige Räucherkästen gelegt. (Desinfizierter Cholera-Brief von 1831) © Departement Informatik, ETH Zürich 4/44

Transcript of Datenvisualisierung und Entscheidungsfindung - EvIM · Agenda für heute, 24. Oktober 2008 •...

Page 1: Datenvisualisierung und Entscheidungsfindung - EvIM · Agenda für heute, 24. Oktober 2008 • Datenvisualisierung und Entscheidungsfindung • Diagramme erlauben VergleicheDiagramme

Agenda für heute, 24. Oktober 2008

•• Datenvisualisierung und EntscheidungsfindungDatenvisualisierung und Entscheidungsfindung• Diagramme erlauben VergleicheDiagramme erlauben Vergleiche• Pause • Grundlagen: Grafische Wahrnehmung• Grundlagen: Grafische Wahrnehmung• Geometrische Transformationen

S b li h D t ll• Symbolische Darstellungen

Visualisierungen unterstützen die erkundende Datenanalyse

Grafische Darstellungen sind oft eine Hilfe für das Verständnis voneine Hilfe für das Verständnis von Ursächlichkeiten (Kausalität)

Können sie analytische AufgabenKönnen sie analytische Aufgaben bei der Entscheidungsfindungunterstützen?

© Departement Informatik, ETH Zürich2/44

Fallstudie aus der Epidemiologie: Cholera

1854'Schlechte Luft' wird als Ursache der Cholera-Epidemie in London akzeptiert

1854

Wie konnte die Epidemie durch Stilllegen einer Trinkwasserpumpe beendet

1884werden, obwohl das Cholerabazillus erst 1884 durch Robert Koch entdeckt wurde?

© Departement Informatik, ETH Zürich3/44

Miasma als Ursache der Cholera

Die Theorie um 1850: Schlechte Luft, die aus faulender organischer Materie, dem miasmata entsteht, verursacht die Cholera.

Durch das Verbrennen von Kräuter-und Gewürzmischungen sollte die vergiftete Luft beseitigt werden. (Räucherpfanne aus dem 16. Jh.)

Selbst Briefe wurden durchstochen in dreiteilige Räucherkästen gelegt. g g(Desinfizierter Cholera-Brief von 1831)

© Departement Informatik, ETH Zürich4/44

Page 2: Datenvisualisierung und Entscheidungsfindung - EvIM · Agenda für heute, 24. Oktober 2008 • Datenvisualisierung und Entscheidungsfindung • Diagramme erlauben VergleicheDiagramme

Zwei Protagonisten

Pro Miasma

Contra Miasma

William Farr, Chief Statistician at the John Snow, Gründungsmitglied der ,Office of the Registrar-General,served on the Committee for Scientific Enquiry into the cholera epidemic of 1854

, g gLondon Epidemiological Society, Narkosearzt von Königin Victoria, befasste sich nach der 1848er Epidemie

it d L d W

© Departement Informatik, ETH Zürich5/44

1854 mit der Londoner Wasserversorgung

William Farrs Prognose-Funktion

F l bt d di St ti tikFarr glaubte, dass diese Statistik seine Miasma-Theorie untermauert

© Departement Informatik, ETH Zürich6/44

John Snows Hypothese

Cholera propagates itself by a 'morbid matter' which, passingfrom one patient in his evacuations, is accidentally swallowedp , yby other persons as a pollution of food or water; . . .

A drop of London water

© Departement Informatik, ETH Zürich7/44

A drop of London waterPunch 1850

Farrs Reaktion auf die Hypothese von Snow

". . . [it] has been suggested by Dr. Snow, that the real cause of whatever was peculiar in the case lay in the use of one particular well, . . .

After careful inquiry we see no reason to adopt this belief "After careful inquiry, we see no reason to adopt this belief."

". .. . . nor is there before us any sufficient evidence to show whether inhabitants of that district, drinking from that well, suffered in proportion more than other inhabitants of the district who drank from other sources "who drank from other sources."

© Departement Informatik, ETH Zürich8/44

Page 3: Datenvisualisierung und Entscheidungsfindung - EvIM · Agenda für heute, 24. Oktober 2008 • Datenvisualisierung und Entscheidungsfindung • Diagramme erlauben VergleicheDiagramme

Snows Strategie

• Ermittelt Bezirke mit• Ermittelt Bezirke, mit Trinkwasser von zwei verschiedenen LieferantenLieferanten

• Während der 1849er Epidemie liefern beide pverschmutztes Wasser (aus dem Flutbecken)

• 1854 liefert einer• 1854 liefert einer sauberes Wasser, der andere verschmutzes

• Erstellt Tabellen, die einen Zusammenhang zwischen den Cholera-Todesfällen und den Wasserquellen zeigen

© Departement Informatik, ETH Zürich

9/44

Snows 'Grand Experiment'

• Snow hatte eine Theorie aber auch statistischen Daten über 300'000 Personen um die wasserbezogene Ursache zu b ü dbegründen.

• Die Daten des Einwohneramtes, publiziert durch William pFarr, zeigten Snow die Mikrostruktur der Epidemie.

Snow musste nicht einen Kausalzusammenhang beweisen• Snow musste nicht einen Kausalzusammenhang beweisen, sondern Anhaltspunkte überzeugend darstellen.

Eine Darstellung der Daten musste gefunden werden, die• Todesfall Statistiken = Zeitliche Daten und• Zugang zu Wasser = Räumliche Datenwirkungsvoll vereinigt

© Departement Informatik, ETH Zürich10/44

wirkungsvoll vereinigt

Die "Geisterkarte" Quelle: Tufte

Ausschnitt aus demAusschnitt aus dem Londoner Stadtteil Soho

x öffentliche Wasserpumpe• Todesfall durch Cholera

© Departement Informatik, ETH Zürich11/44

Wo tauchte die Cholera nicht auf?

Anzahl Opfer

© Departement Informatik, ETH Zürich12/44

Page 4: Datenvisualisierung und Entscheidungsfindung - EvIM · Agenda für heute, 24. Oktober 2008 • Datenvisualisierung und Entscheidungsfindung • Diagramme erlauben VergleicheDiagramme

Die Cholera-Daten als Zeitreihe

© Departement Informatik, ETH Zürich13/44

Die Cholera-Zeitreihe ohne Intervalle

© Departement Informatik, ETH Zürich14/44

Später Ruhm

1866 acht Jahre nach John Snows Tod, anerkannte Farr, dass Wasserder wichtigste Übertragungsweg für Cholera ist und nicht Miasmata

John Snow wird heute allgemein als der 'Vater' der (modernen) Epidemiologie betrachtet

In einer Umfrage der britischen Zeitschrift Hospital Doctor, im März 2003, d J h S ' t t d t f ll ti ' ählt

Epidemiologie betrachtet

wurde John Snow zum 'greatest doctor of all time' gewählt

© Departement Informatik, ETH Zürich15/44

. . . und heute?

Di B d t t P i tDie Broadstreet-Pumpe ist verschwunden.An ihrer Stelle steht dasAn ihrer Stelle steht das John Snow Pub.

© Departement Informatik, ETH Zürich16/44Bilder: http://www.ph.ucla.edu/epi/snow/snowpub.html

Page 5: Datenvisualisierung und Entscheidungsfindung - EvIM · Agenda für heute, 24. Oktober 2008 • Datenvisualisierung und Entscheidungsfindung • Diagramme erlauben VergleicheDiagramme

• Datenvisualisierung und Entscheidungsfindung

•• Diagramme erlauben VergleicheDiagramme erlauben Vergleiche• Grundlagen: Grafische Wahrnehmung • Geometrische Transformationen• Symbolische Darstellungen

Fünf Grundtypen von Vergleichen

Grundtyp VergleichStruktur Anteile an einer GesamtheitRangfolge Reihung von EinzelobjektenZeitreihe Veränderung über ZeitHäufigkeitsverteilung Veränderung von HäufigkeitenZusammenhänge Beziehung zwischen Variablen

Zentrale Frage: Was wird verglichen und womit ?

© Departement Informatik, ETH Zürich17/44

Fünf Grundformen von Diagrammtypen

Kreis Balken Säulen Linien Punkte

Diagramme stellen nicht nur Daten dar, sie erlauben auch Vergleiche!g , g

Diagramme unterstützen eine Aussage!

Drei Schritte: Aussage Vergleich Diagrammform

© Departement Informatik, ETH Zürich18/44

Wie wählt man die geeignete Diagrammform?

Struktur Rangfolge Zeitreihe Häufigkeit Beziehung

Quelle:Kreis

Quelle:G. Zelazny,Wie aus Zahlen

BalkenWie aus Zahlen Bilder werden

Säule

Kurve

Punkt

© Departement Informatik, ETH Zürich19/44

Page 6: Datenvisualisierung und Entscheidungsfindung - EvIM · Agenda für heute, 24. Oktober 2008 • Datenvisualisierung und Entscheidungsfindung • Diagramme erlauben VergleicheDiagramme

Beispiel für Struktur

Florence NightingaleFlorence Nightingale,Pionierin der Krankenpflege und sanitärer Methoden in S itäl

© Departement Informatik, ETH Zürich19/44

Polar-Area Diagram1858 (Krim-Krieg)20/44

Spitälern

Beispiel für Rangfolge

V hi d Lä d d b ü li h d L b tVerschiedene Länder werden bezüglich der Lebenserwartung bei der Geburt miteinander verglichen

© Departement Informatik, ETH Zürich21/44

Lebenserwartung bei der Geburt (alphabetisch nach Land)

© Departement Informatik, ETH Zürich22/44Quelle: Wainer

Beispiel für Zeitreihe

1) V hi d J h d b ü li h d B d t b1) Verschiedene Jahre werden bezüglich der Budgetausgaben des Staates New York miteinander verglichen

2) Die Zunahme der Bildungsausgaben über mehrere Jahre ) g gwird mit der Entwicklung des Bildungsniveaus von Jugendlichen im gleichen Zeitraum verglichen

© Departement Informatik, ETH Zürich23/44

Page 7: Datenvisualisierung und Entscheidungsfindung - EvIM · Agenda für heute, 24. Oktober 2008 • Datenvisualisierung und Entscheidungsfindung • Diagramme erlauben VergleicheDiagramme

Zeitliche Entwicklung von Budgetausgaben Quelle: Tufte

Falsche GeometrieNew York Times,Feb. 1., 1976

Verheimlicht:Die Bevölkerung des Staates New York nahm um 1.7

Optische

Mio. zu!

Optische Verlängerung

der kleinen Budgetsg

© Departement Informatik, ETH Zürich

Optische Erhöhung der neuen Budgets:24/44

Die Realität im Staate New York

Inflationsbereinigte Zahlenunter Berücksichtigung des B ölk hBevölkerungszuwachses

© Departement Informatik, ETH Zürich25/44

Zeitliche Entwicklung von Bildungsvon Bildungs-ausgaben und BildungsniveauBildungsniveau

SAT = Scholastic Aptitude Test

© Departement Informatik, ETH Zürich26/44

Richtige Skalierung wählen!

© Departement Informatik, ETH Zürich27/44

Page 8: Datenvisualisierung und Entscheidungsfindung - EvIM · Agenda für heute, 24. Oktober 2008 • Datenvisualisierung und Entscheidungsfindung • Diagramme erlauben VergleicheDiagramme

Beispiel für Beziehung zwischen Variablen

Di A b it l t i d it d I fl ti t b ü li h ihDie Arbeitslosenrate wird mit der Inflationsrate bezüglich ihrer zeitlichen Entwicklung verglichen

© Departement Informatik, ETH Zürich28/44

Eine inverse Beziehung zwischen Variablen ...6

Quelle: Tufte

Phillips Curve aus Daten über Inflation und Arbeitslosigkeit

69 +

5und Arbeitslosigkeit in den USA 1961 bis 1969(Historische Studie von

+ 68

5

4(Historische Studie von A.W.H. Phillips, 1958)

nsra

te

67 +

4

3

Infla

tion

66 +3

2

Quelle: + 61+ 63

66 +64 +

62 +

2

1QThe Concise Encyclopedia of Economics

+ 611

0

© Departement Informatik, ETH ZürichArbeitslosenrate65 743

0

29/44

... die nur scheinbar existiert ...

Verglichen womit?1961 - 1969 oder1956 - 1976

onsr

ate

Infla

tio

© Departement Informatik, ETH ZürichArbeitslosenrate 30/44

... und die schwierig ist, irgendwo zu finden.

© Departement Informatik, ETH Zürich31/44

Page 9: Datenvisualisierung und Entscheidungsfindung - EvIM · Agenda für heute, 24. Oktober 2008 • Datenvisualisierung und Entscheidungsfindung • Diagramme erlauben VergleicheDiagramme

• Datenvisualisierung und Entscheidungsfindung• Diagramme erlauben Vergleiche

•• Grundlagen: Grafische Wahrnehmung Grundlagen: Grafische Wahrnehmung • Geometrische Transformationen• Symbolische Darstellungen

Grafische Wahrnehmung

Die visuelle Wahrnehmung des Menschen erfasst nicht alle grafischen Elemente mit der gleichen Präzision!

Untersuchungen haben folgende Rangfolge ergeben (präziseste zuerst):( )

1. Position entlang einer gemeinsamen Skala2 Position entlang identischen nicht ausgerichteten Skalen2. Position entlang identischen, nicht ausgerichteten Skalen3. Länge4 Winkel Neigung4. Winkel, Neigung5. Fläche6 V l6. Volumen7. Farbton, Farbsättigung, Dichte

© Departement Informatik, ETH Zürich32/44

Beispiel: Winkel- vs. Positionsbeurteilung Quelle: Cleveland

wenig präzis sehr präzis

© Departement Informatik, ETH Zürich33/44

Beispiel: Neigungs- vs. Positionsbeurteilung

wenig präzis sehr präzis

Quelle: Cleveland

wenig präzis sehr präzis

Mittlere jährliche CO2-Konzentrationen von Mauna Loa Hawaii

Veränderung der CO2-Konzentration pro Jahr

© Departement Informatik, ETH Zürich

von Mauna Loa, Hawaii Jahr

34/44

Page 10: Datenvisualisierung und Entscheidungsfindung - EvIM · Agenda für heute, 24. Oktober 2008 • Datenvisualisierung und Entscheidungsfindung • Diagramme erlauben VergleicheDiagramme

Grafische Täuschung bei Flächen Quelle: Wainer

William Playfair, 1785

© Departement Informatik, ETH Zürich35/44

Playfairs Daten anders dargestellt

Graph der Differenz zwischen Import und ExportGraph der Differenz zwischen Import und Export

© Departement Informatik, ETH Zürich36/44

• Datenvisualisierung und Entscheidungsfindung• Diagramme erlauben Vergleiche

G dl G fi h W h h• Grundlagen: Grafische Wahrnehmung

•• Geometrische TransformationenGeometrische Transformationen• Symbolische Darstellungen

Iris-Daten projiziert auf die Seiten eines Würfels

© Departement Informatik, ETH Zürich37/44

Page 11: Datenvisualisierung und Entscheidungsfindung - EvIM · Agenda für heute, 24. Oktober 2008 • Datenvisualisierung und Entscheidungsfindung • Diagramme erlauben VergleicheDiagramme

Perspektive entfernen

© Departement Informatik, ETH Zürich38/44

Scatterplot-Matrix: verallgemeinerte e a ge e e teProjektionsansicht

© Departement Informatik, ETH Zürich39/44

• Datenvisualisierung und Entscheidungsfindung• Diagramme erlauben Vergleiche

G dl G fi h W h h• Grundlagen: Grafische Wahrnehmung • Geometrische Transformationen

S b li h D t llS b li h D t ll•• Symbolische DarstellungenSymbolische Darstellungen

Datenpunkte können selber wieder Daten sein (1-d) Quelle: Tufte

© Departement Informatik, ETH Zürich

Wachstum nach einer Jahreszeit in Sand mit versch. Mengen Kalzium (in ppm)40/44

Page 12: Datenvisualisierung und Entscheidungsfindung - EvIM · Agenda für heute, 24. Oktober 2008 • Datenvisualisierung und Entscheidungsfindung • Diagramme erlauben VergleicheDiagramme

Angst2-d

Aus: E C ZeemanAus: E.C. Zeeman,Catastrophe TheoryScientific American,234 (April 1976)234 (April 1976)

Anmerkung:Anmerkung:Gilt nicht für Pitbulls

© Departement Informatik, ETH Zürich

WutQuelle: Tufte

41/44

Die Lösung der Aufgabe . . . Quelle: Wainer

Smokers

Quelle:Smoking and

Non-Smokers

Health. Report of the advisory committee to the surgeon general of the

Die unbequeme Ausgangslage

public health service.Washington DC, 19641964

© Departement Informatik, ETH Zürich42/44

. . . liegt im "Verglichen womit?"

Non SmokersDiagramm mit zwei Y-Achsen

Non-Smokers

Smokers

Die Lösung

© Departement Informatik, ETH Zürich43/44

Literatur (kleine Auswahl)

• [Bertin 82] Bertin J. Graphische Darstellungen und die graphische Weiterverarbeitung der Information. Walter de Gruyter & Co. Berlin 1982Berlin, 1982.

• [Cleveland 85] Cleveland W.S. The Elements of Graphing Data.Wadsworth, Belmont Cal., 1985.Wadsworth, Belmont Cal., 1985.

• [Ehrenberg 86] Ehrenberg A.S.C. Statistik oder der Umgang mit Daten.VCH Verlagsgesellschaft, Weinheim,1986.Daten.VCH Verlagsgesellschaft, Weinheim,1986.

• [Tufte 83] Tufte E.R. The Visual Display of Quantitative Information. Graphics Press, Cheshire Conn., 1983.p , ,

• [Tukey 77] Tukey J.W. Exploratory Data Analysis. Addison-Wesley, Reading, Mass. 1977.y, g,

• [Wainer 97] Wainer H. Visual Relations. Copernicus, Springer-Verlag, New York. 1997.

© Departement Informatik, ETH Zürich

g

44/44