Self Organizing Tree Algorithm

Self Organizing Tree Algorithm

Bastian JarzembinskiEnrico Bade

Tobias Aagard

2

Gliederung

Theorie Hintergrund Lernverfahren

Experimente Attributskalierung Wachstumssteuerung

Bewertung Vergleich mit anderen Verfahren Einsatz

3

Theorie Hintergrund Lernverfahren

4

Theorie Hintergrund

Bioinformatik Microarrays

Ähnliches Aussehen = Ähnliche Funktion?

5

Theorie Lernverfahren

n-dimensionale Vektoren mit metrischen Attributen

Knoten bilden Clusterzentren Knoten mit größter Varianz wird geteilt

6


Inputvektor

Repräsentant

Distanz

Lernrate

Fehler

7

Theorie LernverfahrenWurzel

Blatt

Zuordnung

8


Ressource /mittlere Abweichung

Variability /Spannweite

9


10


?

11


Ancestor / Vorfahre

Sister / Schwester

12

Experimente Attributskalierung Fallbeispiel

Experimente Attributskalierung Parameter in KNIME können das

zyklisches Wachsen des Treesbeeinflussen: Lerningrates min. variablity und min. ressource

nur bei „Use variablity“ berücksichtigt

min. Error Distance: Euclid. Oder Cosinus

Clustern ohne Zielattribut

Experimente Fallbeispiel IRIS-Datenset

4 Attribute, metrisch skaliert Zielattribut mit 3 Klassen LIVE DEMO

Quantitativer Vergleich zu Klassifikationsalgorithmen i.d.F. k-Means Keine signifikanten Unterschiede

Anwendung des SOTA auf Daten mit und ohne Zielattribut Keine signifikanten Unterschiede

15

Bewertung Vergleich mit anderen Verfahren Einsatz

16

Bewertung Vergleich mit anderen Verfahren Eigenschaften k-Means

Wenige Iterationen Einfaches Verfahren Anfällig für Rauschen / Ausreißer Ergebnis von initialen Zerlegung abhängig

17

Bewertung Vergleich mit anderen Verfahren Eigenschaften k-Means

Wenige Iterationen Einfaches Verfahren Anfällig für Rauschen / Ausreißer Ergebnis von initialen Zerlegung abhängig

Annähernd lineares LaufzeitverhaltenPunkt für k-Means

ResistentUnabhängig

Eigenschaften SOTA

18

Bewertung Vergleich mit anderen Verfahren

Hierarchisches Clustern

Divisiv oder agglomerativ

Knoten sind einfache Darstellung der Teilmengen

Zwischenschritte sind irreversibel

19

Hierarchisches Clustern

Divisiv oder agglomerativ

Knoten sind einfache Darstellung der Teilmengen

Zwischenschritte sind irreversibel

Bewertung Vergleich mit anderen Verfahren

Divisives Verfahren

Knoten sind Mittelwerte sämtlicher folgenden Knoten

Zuordnung wird ständig angepasst

Eigenschaften SOTA

20

Bewertung Vergleich mit anderen Verfahren Self Organizing Map (Kohonen Map)

Ähnliches Verfahren, aber andere Topologie SOM: vorgegebenes Netz, wird bestmöglich an den

Eingaberaum angepasst SOTA: wächst dynamisch, um den Eingaberaum

bestmöglich darzustellen; Hierarchie vorhanden

21

Bewertung Einsatz

Methodisch vielversprechend Erfolge nicht reproduzierbar Mögliche Ursachen

Ungeeignete Daten Ungeeignete Parameterjustierung Mangelndes (Aufgaben-)Verständnis

Weitere Untersuchung Hintergrundwissen Bioinformatik Microarray-Datensätze wählen

22

Fin

23

Theorie Hintergrund

24

Theorie Hintergrund

Self Organizing Tree Algorithm

Documents

Transcript of Self Organizing Tree Algorithm