Einführung in die räumliche Statistik (2015)

Post on 13-Feb-2017

247 views 1 download

Transcript of Einführung in die räumliche Statistik (2015)

Wo ist der Wald vor lauter Bäumen?

Visualisierung und Beschreibung räumlicher Daten

Jakob Nikolas Kather, 2015

I. Dichtemessung und Aggregation

II. Quantifizierung von Verteilungen

III. Clustering

IV. Anwendungen

I. Dichtemessung und Aggregation

2D-Histogramm Beispieldatensatz 1

Kernel density estimation (KDE) Beispieldatensatz 1

Kernel density estimation (KDE) Beispieldatensatz 2

Kernel density estimation (KDE) echter Datensatz

II. Quantifizierung von Verteilungen

Dichtezählung

Nachbarn und Kanteneffekte

Kanteneffekt

Was ist Zufall?

Baddeley, A. J., & Turner, R. (2004). Spatstat: An R Package for Analyzing Spatial Point Pattens, available from: http://www.spatstat.org/spatstat/doc/spatstatJSSpaper.pdf

F(r): empty space function = point-to-event distribution

G(r): nearest neighbour distance distribution function = event-to-event distribution

K(r): Anzahl der Nachbarn N abhängig vom Radius r

normalisiert auf Gesamtzahl der Punkte n und Gesamtdichte der Punkte λ = n/A

Ripley’s K function

Zufälliges Muster Muster mit Clustern

III. Clustering

k means clustering

1. Lege zufällig k Zentren fest 2. Jeder Datenpunkt wird dem nächsten Zentrum zugeordnet 3. Verschiebe jedes Zentrum in die Mitte der zugehörigen Punktwolke

Jeder Datenpunkt wird dem nächsten Zentrum zugeordnet Verschiebe jedes Zentrum in die Mitte der zugehörigen Punktwolke

Jeder Datenpunkt wird dem nächsten Zentrum zugeordnet

Verschiebe jedes Zentrum in die Mitte der zugehörigen Punktwolke

Jeder Datenpunkt wird dem nächsten Zentrum zugeordnet

Verschiebe jedes Zentrum in die Mitte der zugehörigen Punktwolke

k means clustering

1. Lege zufällig k Zentren fest 2. Jeder Datenpunkt wird dem nächsten Zentrum zugeordnet 3. Verschiebe jedes Zentrum in die Mitte der zugehörigen Punktwolke

Jeder Datenpunkt wird dem nächsten Zentrum zugeordnet Verschiebe jedes Zentrum in die Mitte der zugehörigen Punktwolke

Jeder Datenpunkt wird dem nächsten Zentrum zugeordnet

Verschiebe jedes Zentrum in die Mitte der zugehörigen Punktwolke

Jeder Datenpunkt wird dem nächsten Zentrum zugeordnet

Verschiebe jedes Zentrum in die Mitte der zugehörigen Punktwolke

https://de.wikipedia.org/wiki/K-Means-Algorithmus

k = 2

k = 3

k = 4

k = 5

k = 6

https://en.wikipedia.org/wiki/Category:Data_clustering_algorithms

… noch viel mehr

IV. Anwendungen

http://en.wikipedia.org/wiki/1854_Broad_Street_cholera_outbreak#/media/File:Snow-cholera-map-1.jpg

Ideen für Anwendungen in den Lebenswissenschaften?

Visualisierung ∎ Dichtemessung ∎ Clustering

… von räumlichen Daten auf Landkarten

Diese Präsentation ist verfügbar auf Slideshare

slideshare.net/jnkather

Lebenswissenschaftliches Wochenendseminar

http://www.lwws.de