Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB...

36
Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe Künstliche Intelligenz

Transcript of Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB...

Page 1: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

Eine geschichtete Architekturzur

reaktiven VerhaltenssteuerungFreie Universität Berlin

FB Mathematik und InformatikInstitut für Informatik

ArbeitsgruppeKünstliche Intelligenz

Page 2: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

Überblick• Problemstellung• Ansätze zur Verhaltenssteuerung• Dual Dynamics• Hierarchische Architektur• RoboCup-Beispiel

• einzelne Verhalten• Pfadplanung• Vorhersagen• Verhaltensübersicht

Page 3: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

Autonome Mobile Roboter• vollständiger

Agent• Autonomie• Selbsterhaltun

g• Körperlichkeit• Situiertheit

• ökologische Nische

• billig, ungenau„Fungus Eater“ by Isabelle FollathMasanao Toda 1962, Rolf Pfeifer 1994

Page 4: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

RoboCup• Fußballspiel als Benchmark der KI-

Forschung• seit 1997 jährliche WM, lokale

Wettbewerbe• Ligen:

Simulation

Sony Hunde

MidSize

SmallSize

Humanoide

Page 5: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

Problemstellung der Verhaltenssteuerung• Gegeben: Agent, Situation• Gesucht: Was soll ich jetzt tun?

Umwelt

Agent

Sensoren AktuatorenKontrolle

Page 6: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

Architekturen zur Verhaltenssteuerung• deliberativ

• sense-plan-act• langsam, komplex

• reaktiv• sense-act• schnell, primitiv

• hybrid• deliberative und reaktive

Schicht• eventuell Zwischenschicht• verhaltensbasiert• mehrere einfache Verhalten• Interaktion erzeugt

Komplexität

Page 7: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

Deliberative Verhaltenssteuerung• Konstruktion eines vollständigen

Weltmodells• Ausarbeitung eines mehrstufigen Plans• Durchführung des Plans• Bsp.: Blocks World, ShakeyStart Ziel

adb

c efg b

ea

cdf

g

Heuristische Suche erzeugt Plan:a->T; b->T; d->c; e->b; a->e; f->d

Page 8: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

Reaktive Verhaltenssteuerung• kein Weltmodell• kein Plan• direkte Kopplung von Sensoren und

Aktuatoren• Bsp.: Braitenberg Vehikel

Taxis

Valentino Braitenberg 1984

Page 9: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

• Versuch, das Beste aus beiden Welten zu vereinen

• Bsp.: drei Schichten • reaktive Schicht (Regler)

• zustandslos, schnell, sensorgetrieben • Zwischenschicht (Sequenzer)

• Repräsentation der Vergangenheit, Abstraktion• Fehlererkennung, Alternativverhalten

• deliberative Schicht (Planer)• Repräsentation der Zukunft, langsam,

zielgetrieben

Hybride Verhaltenssteuerung

Erann Gat 1998: Alfred

Page 10: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

Subsumptionsarchitektur• verhaltensbasiert, DEAs, Nachrichten• Kompetenzebenen, steigende

Komplexität • Subsumption: Eingriff in niedrigere

Ebene• inkrementelles Design

Rodney Brooks 1985

Hindernisvermeidung

Herumfahren

Exploration

Kartierung

Sensoren Aktuatoren

Page 11: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

Dual Dynamics• verhaltensbasiert• dynamische Systeme• zwei Verhaltensarten: elementar, komplex• elementare Verhalten haben zwei Module:

• Aktivierungsdynamik: Soll ich jetzt etwas tun?• Zieldynamik: Was soll ich tun?

• keine Zieldynamik bei komplexen Verhalten• Modi, Bifurkationen, Multifunktionalität

Herbert Jaeger 1995

Page 12: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

Hierarchie reaktiver Verhalten

schnell

langsam

Sensoren Verhalten Aktuatoren

Page 13: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

Aufbau einer Ebene

tiefere Ebene

höhere Ebene

Sensoren Verhalten Aktuatoren

Page 14: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

Hemmung von Verhalten

• mehrere Verhalten können gleichzeitig aktiv sein • gerichteter azyklischer Hemmgraph• multiplikative Hemmung• Testverhalten hemmen alle anderen Verhalten

iHj

jii )1(~ i

Aktivierungswunschi~Aktivierung

1

0

0

1

Page 15: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

Aktuatordynamik• Typen

• Float• Vektor• Boolean• Objekt

• Roboter• Ball• Tor• Position

• Kombination• gewichtetes Mittel

• gewichtete Mehrheit• Verhalten stimmen mit

Aktivierung für einen Wert• Wert mit den meisten

Stimmen gewinnt

else:1:/

,,)(

i

iiiii

jji

jijji

aa

aw

Page 16: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

Team-Ebenen

Team-sensoren

Team-aktuatoren

Team-verhalten

Roboter-sensoren

Roboter-aktuatoren

Roboter-verhalten

Roboter-sensoren

Roboter-aktuatoren

Roboter-verhalten

Roboter-sensoren

Roboter-aktuatoren

Roboter-verhalten

Roboter-sensoren

Roboter-aktuatoren

Roboter-verhalten

Roboter-sensoren

Roboter-aktuatoren

Roboter-verhalten

Page 17: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

Anlauf

x

x/2

Schußziel

Ball

Vollstrecken aktiv

Page 18: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

Ball abfangen

Ballvorhersage

Anlauf

Haurein

Page 19: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

Panikausweichen

Page 20: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

Pfadplanung

• Dynamische Programmierung• Best-First-Suche

Start

Ziel

Knick

Page 21: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

Vorhersagen• Problem: Regelverzögerung 100...150ms• exakt und langsam oder schell und ungenau• Ansatz:

• Vorhersage des Bewegungszustands• für die Zeit der Regelverzögerung• Verhaltenssteuerung, als ob keine Verzögerung• Eingabe:

• letzte Bewegungsinformationen• letzte Aktuatorwerte

• Neuronales Netz, trainiert mit Daten des Monitors• Ergebnis: schnell und genau

Page 22: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

FeldspielerverhaltenTeamEbene 0:

Angriff, Abwehr, Aufstellen, Elfmeter, Freistoß, ...Ebene 2:

BallBewegen, Decken, Gruppenfahren, Positionieren, ...

Ebene 1:Anlauf, Dribbeln, Vollstrecken, Haurein, Hauweg,Passen, Pfadplanen, Positionieren, ...

Ebene 0:Steuern, PanikAusweichen, TorwartFlucht, ...

Ebene –1:Bewegungsregelung

Page 23: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

TorwartverhaltenEbene 0:

Stellen, Halten,Hauweg, Elfmeter, ...

Ebene –1:Bewegungsregelung

Stellen

Halten

Page 24: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

SchussPfadplanen

StellenZiel

Schussziel

Anlauf

Vollstrecken

Pfadplanen Halten

Page 25: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

Schuss

Anlauf

Stellen

Ziel

Schussziel

Anlauf

Vollstrecken

Pfadplanen Halten

Page 26: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

Schuss

Anlauf Stellen

Ziel

Schussziel

Anlauf

Vollstrecken

Pfadplanen Halten

Page 27: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

Schuss

VollstreckenStellen

Schussziel

Anlauf

Vollstrecken

Pfadplanen Halten

Page 28: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

Schuss

Vollstrecken

Halten

Schussziel

Anlauf

Vollstrecken

Pfadplanen Halten

Page 29: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

Schuss

Vollstrecken Halten

Schussziel

Anlauf

Vollstrecken

Pfadplanen Halten

Page 30: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

Schuss

Halten

Anlauf

Vollstrecken

Pfadplanen Halten

Page 31: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

PassenAnlauf

Positionieren

Ziel

Schussziel

Anlauf Positionieren

Page 32: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

Passen Passen

Positionieren

Ziel

Schussziel

Anlauf Positionieren Passen

Page 33: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

PassenPassen

Haurein

Ziel

Schussziel

PassenPositionierenAnlauf Haurein

Page 34: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

Passen

Haurein

HaureinPassenAnlauf Positionieren

Page 35: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

Passen

Haurein

HaureinAnlauf Positionieren Passen

Page 36: Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Freie Universität Berlin FB Mathematik und Informatik Institut für Informatik Arbeitsgruppe.

Passen

Haurein

HaureinAnlauf Positionieren Passen