Durchführung einer hierarchischen Clusteranalyse Dateneingabe und Anforderung:
-
Upload
hrodgar-westphalen -
Category
Documents
-
view
111 -
download
2
Transcript of Durchführung einer hierarchischen Clusteranalyse Dateneingabe und Anforderung:
Durchführung einer hierarchischen ClusteranalyseDateneingabe und Anforderung:
Anforderung der „Single Linkage“-Methode (auf der Basis von quadrierten euklidischen Distanzen):
5
4
3
2
1
54321
4
135
10105
13921
o
o
o
o
o
ooooo
Ermittlung der Distanz-Matrix:
4
13
10
5
92)(
)(
5
4
54
3
21
321
o
o
oo
o
oo
ooo
1. Fusions-Schritt:
5
4
321
54321
4
105)(
)(
o
o
ooo
ooooo
2. Fusions-Schritt:
)(
5)(
)()(
54
321
54321
oo
ooo
ooooo
3. Fusions-Schritt:
SPSS-Befehl:
CLUSTER x1 x2/METHOD SINGLE /MEASURE= SEUCLID /PRINT SCHEDULE CLUSTER(2,5)/PRINT DISTANCE /PLOT DENDROGRAM.
Resultat:Näherungsmatrix
1,000 2,000 9,000 13,000
1,000 5,000 10,000 10,000
2,000 5,000 5,000 13,000
9,000 10,000 5,000 4,000
13,000 10,000 13,000 4,000
Fall1
2
3
4
5
1 2 3 4 5
Quadriertes euklidisches Distanzmaß
Dies ist eine Unähnlichkeitsmatrix
Zuordnungsübersicht
1 2 1,000 0 0 2
1 3 2,000 1 0 4
4 5 4,000 0 0 4
1 4 5,000 2 3 0
Schritt1
2
3
4
Cluster 1 Cluster 2
ZusammengeführteCluster
Koeffizienten Cluster 1 Cluster 2
Erstes Vorkommendes Clusters Nächster
Schritt
Cluster-Zugehörigkeit
1 1 1
1 1 1
2 1 1
3 2 2
4 3 2
Fall1
2
3
4
5
4 Cluster 3 Cluster 2 Cluster
* * * * * * * * * * * * * * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * * * * * * * * * * * * * *
Dendrogram using Single Linkage
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
1 -+-----------+
2 -+ +-----------------------------------+
3 -------------+ I
4 -------------------------------------+-----------+
5 -------------------------------------+
Anforderung der „Complete Linkage“-Methode (auf der Basis von quadrierten euklidischen Distanzen):
5
4
3
2
1
54321
4
135
10105
13921
o
o
o
o
o
ooooo
Ermittlung der Distanz-Matrix:
4
13
10
5
92)(
)(
5
4
54
3
21
321
o
o
oo
o
oo
ooo
1. Fusions-Schritt:
)(
13
135)(
)()(
54
3
21
54321
oo
o
oo
ooooo
2. Fusions-Schritt:
)(
13)(
)()(
54
321
54321
oo
ooo
ooooo
3. Fusions-Schritt:
SPSS-Befehl:
CLUSTER x1 x2/METHOD COMPLETE /MEASURE= SEUCLID /PRINT SCHEDULE CLUSTER(2,5)/PRINT DISTANCE /PLOT DENDROGRAM.
Resultat:
Zuordnungsübersicht
1 2 1,000 0 0 3
4 5 4,000 0 0 4
1 3 5,000 1 0 4
1 4 13,000 3 2 0
Schritt1
2
3
4
Cluster 1 Cluster 2
ZusammengeführteCluster
Koeffizienten Cluster 1 Cluster 2
Erstes Vorkommendes Clusters Nächster
Schritt
Cluster-Zugehörigkeit
1 1 1
1 1 1
2 2 1
3 3 2
4 3 2
Fall1
2
3
4
5
4 Cluster 3 Cluster 2 Cluster
Dendrogram using Complete Linkage
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
1 -+---------------+
2 -+ +-------------------------------+
3 -----------------+ I
4 -------------+-----------------------------------+
5 -------------+
Anforderung der „Average Linkage“-Methode (auf der Basis von quadrierten euklidischen Distanzen):
5
4
3
2
1
54321
4
135
10105
13921
o
o
o
o
o
ooooo
Ermittlung der Distanz-Matrix:
4
13
5,11
5
5,95,3)(
)(
5
4
54
3
21
321
o
o
oo
o
oo
ooo1. Fusions-Schritt:
5
4
321
54321
4
128)(
)(
o
o
ooo
ooooo
2. Fusions-Schritt:
)(
10)(
)()(
54
321
54321
oo
ooo
ooooo
3. Fusions-Schritt:
SPSS-Befehl:
CLUSTER x1 x2/METHOD BAVERAGE /MEASURE= SEUCLID /PRINT SCHEDULE CLUSTER(2,5)/PRINT DISTANCE /PLOT DENDROGRAM.
Resultat:
Zuordnungsübersicht
1 2 1,000 0 0 2
1 3 3,500 1 0 4
4 5 4,000 0 0 4
1 4 10,000 2 3 0
Schritt1
2
3
4
Cluster 1 Cluster 2
ZusammengeführteCluster
Koeffizienten Cluster 1 Cluster 2
Erstes Vorkommendes Clusters Nächster
Schritt
Dendrogram using Average Linkage (Between Groups)
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
1 -+-----------+
2 -+ +-----------------------------------+
3 -------------+ I
4 -----------------+-------------------------------+
5 -----------------+
Cluster-Zugehörigkeit
1 1 1
1 1 1
2 1 1
3 2 2
4 3 2
Fall1
2
3
4
5
4 Cluster 3 Cluster 2 Cluster
Anforderung der „Centroid“-Methode (auf der Basis von quadrierten euklidischen Distanzen):
5
4
3
2
1
54321
4
135
10105
13921
o
o
o
o
o
ooooo
Ermittlung der Distanz-Matrix:
X1
4,54,03,53,02,52,01,51,0,5
X2
4,5
4,0
3,5
3,0
2,5
2,0
1,5
1,0
,5
54
3
21
(2.5, 1)
1. Fusions-Schritt:
4
13
25,11
5
25,925,3)(
)(
5
4
54
3
21
321
o
o
oo
o
oo
ooo
X1
4,54,03,53,02,52,01,51,0,5
X2
4,5
4,0
3,5
3,0
2,5
2,0
1,5
1,0
,5
54
3
21
(2, 4/3)
5
4
23222
32
321
54321
4
)2(4)2()(
)(
o
o
ooo
ooooo
2. Fusions-Schritt:
X1
4,54,03,53,02,52,01,51,0,5
X2
4,5
4,0
3,5
3,0
2,5
2,0
1,5
1,0
,5
54
3
21
(2, 4/3)(3, 4)
)(
111,8)(
)()(
54
321
54321
oo
ooo
ooooo
3. Fusions-Schritt:
SPSS-Befehl:
CLUSTER x1 x2/METHOD CENTROID /MEASURE= SEUCLID /PRINT SCHEDULE CLUSTER(2,5)/PRINT DISTANCE /PLOT DENDROGRAM.
Resultat:
Zuordnungsübersicht
1 2 1,000 0 0 2
1 3 3,250 1 0 4
4 5 4,000 0 0 4
1 4 8,111 2 3 0
Schritt1
2
3
4
Cluster 1 Cluster 2
ZusammengeführteCluster
Koeffizienten Cluster 1 Cluster 2
Erstes Vorkommendes Clusters Nächster
Schritt
Dendrogram using Centroid Method
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
1 -+-------------+
2 -+ +---------------------------------+
3 ---------------+ I
4 ---------------------+---------------------------+
5 ---------------------+
Cluster-Zugehörigkeit
1 1 1
1 1 1
2 1 1
3 2 2
4 3 2
Fall1
2
3
4
5
4 Cluster 3 Cluster 2 Cluster
Anforderung der „Median“-Methode (auf der Basis von quadrierten euklidischen Distanzen):
5
4
3
2
1
54321
4
135
10105
13921
o
o
o
o
o
ooooo
Ermittlung der Distanz-Matrix:
X1
4,54,03,53,02,52,01,51,0,5
X2
4,5
4,0
3,5
3,0
2,5
2,0
1,5
1,0
,5
54
3
21
(2.5, 1)
4
13
25,11
5
25,925,3)(
)(
5
4
54
3
21
321
o
o
oo
o
oo
ooo
1. Fusions-Schritt:
X1
4,54,03,53,02,52,01,51,0,5
X2
4,5
4,0
3,5
3,0
2,5
2,0
1,5
1,0
,5
54
3
21
(1.75, 1.5)
5
4
2222321
54321
4
5,225,25,225,0)(
)(
o
o
ooo
ooooo
2. Fusions-Schritt:
X1
4,54,03,53,02,52,01,51,0,5
X2
4,5
4,0
3,5
3,0
2,5
2,0
1,5
1,0
,5
54
3
21
(1.75, 1.5)(3, 4)
)(
5,225,1)(
)()(
54
22321
54321
oo
ooo
ooooo
3. Fusions-Schritt:
SPSS-Befehl:
CLUSTER x1 x2/METHOD MEDIAN /MEASURE= SEUCLID /PRINT SCHEDULE CLUSTER(2,5)/PRINT DISTANCE /PLOT DENDROGRAM.
Resultat:
Zuordnungsübersicht
1 2 1,000 0 0 2
1 3 3,250 1 0 4
4 5 4,000 0 0 4
1 4 7,813 2 3 0
Schritt1
2
3
4
Cluster 1 Cluster 2
ZusammengeführteCluster
Koeffizienten Cluster 1 Cluster 2
Erstes Vorkommendes Clusters Nächster
Schritt
Dendrogram using Median Method
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
1 -+---------------+
2 -+ +-------------------------------+
3 -----------------+ I
4 -----------------------+-------------------------+
5 -----------------------+
Cluster-Zugehörigkeit
1 1 1
1 1 1
2 1 1
3 2 2
4 3 2
Fall1
2
3
4
5
4 Cluster 3 Cluster 2 Cluster