Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

50
Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler

Transcript of Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Page 1: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Seminar Robotfußball, SoSe 2003

Selbstorganisation und Lernen

Carsten Keßler

Page 2: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 2 von 50Seminar Robotfußball, SoSe 2003

Überblick

• Einleitung

• Künstliche neuronale Netze

• Das Modell

• Roboter mit Eigeninitiative

• Visuelle Sensoren

• Zusammenfassung

Page 3: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 3 von 50Seminar Robotfußball, SoSe 2003

Überblick

• Einleitung

• Künstliche neuronale Netze

• Das Modell

• Roboter mit Eigeninitiative

• Visuelle Sensoren

• Zusammenfassung

Page 4: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 4 von 50Seminar Robotfußball, SoSe 2003

Einleitung

• Anpassungs- / Lernfähigkeit ist ein Hauptaugenmerk bei autonomen Agenten

• Der Lernprozess besteht häufig aus einer indirekten Programmierung des Agenten („Reinforcement Learning“)

Page 5: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 5 von 50Seminar Robotfußball, SoSe 2003

Einleitung

• Engere Definition von Selbständigkeit:

• Echte Selbständigkeit muss Eigeninitiative beinhalten

Page 6: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 6 von 50Seminar Robotfußball, SoSe 2003

Einleitung – die „Vision“

• Startzustand: • Roboter, gesteuert durch ein neuronales Netz

• das neuronale Netz ist in einem „Tabula rasa“ Zustand

• der Roboter reagiert nicht auf seine Sensor-Messwerte

• Aktivitäten sind rein zufällig• die Umgebung enthält statische und dynamische Objekte

Page 7: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 7 von 50Seminar Robotfußball, SoSe 2003

Einleitung – die „Vision“

• Die Aufgabe:• komplett internes Ziel für den Roboter definieren, damit:

• er anfängt, sich zu bewegen

• während der Bewegung ein Bild von seiner Umgebung entwickelt

• dies sollte unabhängig von den Sensoren und der Fortbewegungsart des Roboters sein

Page 8: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 8 von 50Seminar Robotfußball, SoSe 2003

Überblick

• Einleitung

• Künstliche neuronale Netze

• Das Modell

• Roboter mit Eigeninitiative

• Visuelle Sensoren

Page 9: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 9 von 50Seminar Robotfußball, SoSe 2003

Künstliche neuronale Netze

• Die Nervenzelle als biologisches Vorbild

Quelle: Prof. Lippe, Skript „Softcomputing“

Page 10: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 10 von 50Seminar Robotfußball, SoSe 2003

Künstliche neuronale Netze

• Schematische Darstellung eines künstlichen Neurons

Quelle: Dan Patterson – Künstliche neuronale Netze

Page 11: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 11 von 50Seminar Robotfußball, SoSe 2003

Künstliche Neuronale Netze

• Formal: Tupel, bestehend aus

• Eingabevektor

• Gewichtsvektor

• Aktivierungsfunktion

• Ausgabefunktion

Page 12: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 12 von 50Seminar Robotfußball, SoSe 2003

Künstliche neuronale Netze

Quelle: Prof. Lippe, Skript „Softcomputing“

Page 13: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 13 von 50Seminar Robotfußball, SoSe 2003

Künstliche neuronale Netze

Quelle: Prof. Lippe, Skript „Softcomputing“

Page 14: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 14 von 50Seminar Robotfußball, SoSe 2003

Künstliche neuronale Netze

• Typen des Lernens• Entwicklung neuer Verbindungen

• Löschen existierender Verbindungen

• Modifikation der Gewichte

• Modifikation des Schwellenwertes

• Modifikation der Aktivierungs- / Ausgabefunktion

• Entwickeln neuer Zellen

• Löschen bestehender Zellen

Page 15: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 15 von 50Seminar Robotfußball, SoSe 2003

Künstliche neuronale Netze

• Lernstrategien• überwacht (supervised learning)

• bestärkend (reinforcement learning)

• unüberwacht (unsupervised learning)

Page 16: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 16 von 50Seminar Robotfußball, SoSe 2003

Künstliche neuronale Netze

• Anwendungen• Diagnostik• Vorhersage• Mustererkennung• Optimierung• Risikoabschätzung• Steuerung• ..........

Page 17: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 17 von 50Seminar Robotfußball, SoSe 2003

Überblick

• Einleitung

• Künstliche neuronale Netze

• Das Modell

• Roboter mit Eigeninitiative

• Visuelle Sensoren

• Zusammenfassung

Page 18: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 18 von 50Seminar Robotfußball, SoSe 2003

Das Modell

• Der Ansatz:

• der Agent überwacht selbst seinen eigenen Lernprozess

Page 19: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 19 von 50Seminar Robotfußball, SoSe 2003

Das Modell

• Problem:

• die Sensorwerte müssen mit einem Modell vorausberechenbar sein, um im nächsten Schritt die gemessenen mit den vorausberechneten Werten zu vergleichen

Page 20: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 20 von 50Seminar Robotfußball, SoSe 2003

Das Modell

• Ausgabe des Controllers:

• xt є Rn: Vektor der Sensorwerte zum Zeitpunkt t

• c: Parameter Vektor

Page 21: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 21 von 50Seminar Robotfußball, SoSe 2003

Das Modell

• Das adaptive Modell soll xt+1 berechnen:

Page 22: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 22 von 50Seminar Robotfußball, SoSe 2003

Das Modell

• der Fehler dabei beträgt:

Page 23: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 23 von 50Seminar Robotfußball, SoSe 2003

Das Modell

• Lernregeln:• für das Modell:

• für den Controller:

Page 24: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 24 von 50Seminar Robotfußball, SoSe 2003

Das Modell

• Der Khepera Roboter• 8 IR-Sensoren

• 2 Motoren

• max. 1m/s

• erweiterbar

Quelle: http://www.k-team.com

Page 25: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 25 von 50Seminar Robotfußball, SoSe 2003

Das Modell

• Beispiel

• der Roboter bewegt sich mit konstanter Geschwindigkeit

• der Output des Controllers gibt nur die Drehgeschwindigkeit an

• Modellierung durch ein einzelnes Neuron:

Page 26: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 26 von 50Seminar Robotfußball, SoSe 2003

Quelle: Der / Liebscher: True autonomy from self-organized adaptivity

Page 27: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 27 von 50Seminar Robotfußball, SoSe 2003

Quelle: Der / Liebscher: True autonomy from self-organized adaptivity

Page 28: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 28 von 50Seminar Robotfußball, SoSe 2003

Quelle: Der / Liebscher: True autonomy from self-organized adaptivity

Page 29: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 29 von 50Seminar Robotfußball, SoSe 2003

Überblick

• Einleitung

• Künstliche neuronale Netze

• Das Modell

• Roboter mit Eigeninitiative

• Visuelle Sensoren

• Zusammenfassung

Page 30: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 30 von 50Seminar Robotfußball, SoSe 2003

Roboter mit Eigeninitiative

• Das Problem:

• Bislang war die Geschwindigkeit gegeben

• Das Modell strebt möglichst konstant bleibende Sensorwerte an

Das ist gegeben, wenn der Roboter nichts tut

Page 31: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 31 von 50Seminar Robotfußball, SoSe 2003

Roboter mit Eigeninitiative

• Die Lösung:

• Der Roboter bekommt einen Anreiz zur Aktivität

• Dazu wird im Vorhersagemodell „die Zeit umgedreht“

Page 32: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 32 von 50Seminar Robotfußball, SoSe 2003

Roboter mit Eigeninitiative

• Die Zeitschleife:

Page 33: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 33 von 50Seminar Robotfußball, SoSe 2003

Roboter mit Eigeninitiative

• Dabei entsteht der Fehler

mit

Der Fehler ist klein, wenn das aktuelle Verhalten des Roboters gut durch das Modell repräsentiert wird

Page 34: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 34 von 50Seminar Robotfußball, SoSe 2003

Roboter mit Eigeninitiative

• Berücksichtigung der Dynamik, die nicht durch das Modell

beschrieben ist (Störung, Messfehler, „Rauschen“):

Page 35: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 35 von 50Seminar Robotfußball, SoSe 2003

Roboter mit Eigeninitiative

• Daraus folgt:

• Der Fehler durch das Rauschen pflanzt sich in der Zeit „rückwärts“ fort

• Der Modellfehler wird minimiert, wenn die Roboter-Sensormesswerte instabil sind

Anreiz zur Aktivität

Page 36: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 36 von 50Seminar Robotfußball, SoSe 2003

Roboter mit Eigeninitiative

• Verhalten des Roboters:

• Der Roboter zeigt sofort Aktivität, wenn er im Tabula rasa Zustand gestartet wird

• Beim Aufprall auf Hindernisse wird der Messfehler sprunghaft so groß, dass der Roboter sofort umdreht

Page 37: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 37 von 50Seminar Robotfußball, SoSe 2003

Überblick

• Einleitung

• Künstliche neuronale Netze

• Das Modell

• Roboter mit Eigeninitiative

• Visuelle Sensoren

• Zusammenfassung

Page 38: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 38 von 50Seminar Robotfußball, SoSe 2003

Visuelle Sensoren

Quelle: Der / Liebscher: True autonomy from self-organized adaptivity.

Page 39: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 39 von 50Seminar Robotfußball, SoSe 2003

Visuelle Sensoren

• Eingabevektor:

x=(vl, vr, s1,…sK)

• vl, vr: Geschwindigkeiten der Räder

• si: Pixelwerte der Kamera im R3

Page 40: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 40 von 50Seminar Robotfußball, SoSe 2003

Visuelle Sensoren

• Preprocessing:

• Binäre Klassifizierung der Pixel, ob sie der Farbe des Balles entsprechen oder nicht

• Herunterskalieren des Bildes auf 32 * 32 Pixel in Graustufen

• Erzeugen eines Bewegungsvektors im R2 für den Ball aus 2 aufeinander folgenden Bildern

Page 41: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 41 von 50Seminar Robotfußball, SoSe 2003

Visuelle Sensoren

• Der Controller besteht aus 2 Neuronen

• Neuron 1 regelt die Geschwindigkeit

• gefüttert mit der Geschwindigkeit des Balles in Fahrtrichtung sowie den Sensormesswerten von den Rädern

Funktioniert wie eben gesehen

Page 42: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 42 von 50Seminar Robotfußball, SoSe 2003

Visuelle Sensoren

• Der Controller besteht aus 2 Neuronen

• Neuron 2 regelt die Lenkung

• wird gefüttert mit den Pixelwerten aus dem vorher aufbereiteten Bild

• Annahme: die Komponente g2 des Bewegungsvektors g soll sich nicht ändern

Page 43: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 43 von 50Seminar Robotfußball, SoSe 2003

Visuelle Sensoren

• Fehlerberechnung

Page 44: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 44 von 50Seminar Robotfußball, SoSe 2003

Visuelle Sensoren

• Ausgabefunktionen

Page 45: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 45 von 50Seminar Robotfußball, SoSe 2003

Visuelle Sensoren

• Lernregeln

Page 46: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 46 von 50Seminar Robotfußball, SoSe 2003

Visuelle Sensoren

• Ergebnisse:

• Anpassung der Geschwindigkeit funktioniert beim Pioneer ähnlich gut wie beim Khepera

• Anpassung der Richtung aufgrund der Kameradaten bereitet noch Probleme, die allerdings technischer Natur sind

Page 47: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 47 von 50Seminar Robotfußball, SoSe 2003

Überblick

• Einleitung

• Künstliche neuronale Netze

• Das Modell

• Roboter mit Eigeninitiative

• Visuelle Sensoren

• Zusammenfassung

Page 48: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 48 von 50Seminar Robotfußball, SoSe 2003

Zusammenfassung

• Wir haben gesehen, wie:• Roboter mit Hilfe von neuronalen Netzen lernen können

• Sie mit Hilfe von neuronalen Netzen dazu gebracht werden können, Aktivität zu entwickeln

• Wie die Verarbeitung von visuellen Informationen in dieses Modell integriert werden kann

Page 49: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 49 von 50Seminar Robotfußball, SoSe 2003

Zusammenfassung

• Bezug zum Roboterfußball:

• Zur Zeit noch keine praktische Anwendung der hier vorgestellten Ergebnisse

• In der Anwendung dominiert noch die klassische KI

• Ergebnisse sind noch sehr frisch, daher wahrscheinlich in Zukunft auch relevant für die Praxis

Page 50: Seminar Robotfußball, SoSe 2003 Selbstorganisation und Lernen Carsten Keßler.

Carsten Keßler: Selbstorganisation und Lernen 50 von 50Seminar Robotfußball, SoSe 2003

Vielen Dank für die Aufmerksamkeit!