Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Sven Behnke Freie Universität...

Eine geschichtete Architekturzur

reaktiven VerhaltenssteuerungSven Behnke

Freie Universität BerlinFB Mathematik und Informatik

Institut für Informatik

ArbeitsgruppeKünstliche Intelligenz

Überblick• Problemstellung• Ansätze zur Verhaltenssteuerung• Dual Dynamics• Hierarchische Architektur• RoboCup-Beispiel

• einzelne Verhalten• Pfadplanung• Vorhersagen• Verhaltensübersicht

Autonome Mobile Roboter• vollständiger

Agent• Autonomie• Selbsterhaltun

g• Körperlichkeit• Situiertheit

• ökologische Nische

• billig, ungenau„Fungus Eater“ by Isabelle FollathMasanao Toda 1962, Rolf Pfeifer 1994

RoboCup• Fußballspiel als Benchmark der KI-

Forschung• seit 1997 jährliche WM, lokale

Wettbewerbe• Ligen:

Simulation

Sony Hunde

MidSize

SmallSize

Humanoide

Problemstellung der Verhaltenssteuerung• Gegeben: Agent, Situation• Gesucht: Was soll ich jetzt tun?

Umwelt

Sensoren AktuatorenKontrolle

Architekturen zur Verhaltenssteuerung• deliberativ

• sense-plan-act• langsam, komplex

• reaktiv• sense-act• schnell, primitiv

• hybrid• deliberative und reaktive

Schicht• eventuell Zwischenschicht• verhaltensbasiert• mehrere einfache Verhalten• Interaktion erzeugt

Komplexität

Deliberative Verhaltenssteuerung• Konstruktion eines vollständigen

Weltmodells• Ausarbeitung eines mehrstufigen Plans• Durchführung des Plans• Bsp.: Blocks World, ShakeyStart Ziel

c efg b

Heuristische Suche erzeugt Plan:a->T; b->T; d->c; e->b; a->e; f->d

Reaktive Verhaltenssteuerung• kein Weltmodell• kein Plan• direkte Kopplung von Sensoren und

Aktuatoren• Bsp.: Braitenberg Vehikel

Valentino Braitenberg 1984

• Versuch, das Beste aus beiden Welten zu vereinen

• Bsp.: drei Schichten • reaktive Schicht (Regler)

• zustandslos, schnell, sensorgetrieben • Zwischenschicht (Sequenzer)

• Repräsentation der Vergangenheit, Abstraktion• Fehlererkennung, Alternativverhalten

• deliberative Schicht (Planer)• Repräsentation der Zukunft, langsam,

zielgetrieben

Hybride Verhaltenssteuerung

Erann Gat 1998: Alfred

Subsumptionsarchitektur• verhaltensbasiert, DEAs, Nachrichten• Kompetenzebenen, steigende

Komplexität • Subsumption: Eingriff in niedrigere

Ebene• inkrementelles Design

Rodney Brooks 1985

Hindernisvermeidung

Herumfahren

Exploration

Kartierung

Sensoren Aktuatoren

Dual Dynamics• verhaltensbasiert• dynamische Systeme• zwei Verhaltensarten: elementar, komplex• elementare Verhalten haben zwei Module:

• Aktivierungsdynamik: Soll ich jetzt etwas tun?• Zieldynamik: Was soll ich tun?

• keine Zieldynamik bei komplexen Verhalten• Modi, Bifurkationen, Multifunktionalität

Herbert Jaeger 1995

Hierarchie reaktiver Verhalten

schnell

langsam

Sensoren Verhalten Aktuatoren

Aufbau einer Ebene

tiefere Ebene

höhere Ebene

Sensoren Verhalten Aktuatoren

Hemmung von Verhalten

• mehrere Verhalten können gleichzeitig aktiv sein • gerichteter azyklischer Hemmgraph• multiplikative Hemmung• Testverhalten hemmen alle anderen Verhalten

jii )1(~ i

Aktivierungswunschi~Aktivierung

Aktuatordynamik• Typen

• Float• Vektor• Boolean• Objekt

• Roboter• Ball• Tor• Position

• Kombination• gewichtetes Mittel

• gewichtete Mehrheit• Verhalten stimmen mit

Aktivierung für einen Wert• Wert mit den meisten

Stimmen gewinnt

else:1:/

Team-Ebenen

Team-sensoren

Team-aktuatoren

Team-verhalten

Roboter-sensoren

Roboter-aktuatoren

Roboter-verhalten

Roboter-sensoren

Roboter-aktuatoren

Roboter-verhalten

Roboter-sensoren

Roboter-aktuatoren

Roboter-verhalten

Roboter-sensoren

Roboter-aktuatoren

Roboter-verhalten

Roboter-sensoren

Roboter-aktuatoren

Roboter-verhalten

Anlauf

Schußziel

Vollstrecken aktiv

Ball abfangen

Ballvorhersage

Anlauf

Haurein

Panikausweichen

Pfadplanung

• Dynamische Programmierung• Best-First-Suche

Vorhersagen• Problem: Regelverzögerung 100...150ms• exakt und langsam oder schell und ungenau• Ansatz:

• Vorhersage des Bewegungszustands• für die Zeit der Regelverzögerung• Verhaltenssteuerung, als ob keine Verzögerung• Eingabe:

• letzte Bewegungsinformationen• letzte Aktuatorwerte

• Neuronales Netz, trainiert mit Daten des Monitors• Ergebnis: schnell und genau

FeldspielerverhaltenTeamEbene 0:

Angriff, Abwehr, Aufstellen, Elfmeter, Freistoß, ...Ebene 2:

BallBewegen, Decken, Gruppenfahren, Positionieren, ...

Ebene 1:Anlauf, Dribbeln, Vollstrecken, Haurein, Hauweg,Passen, Pfadplanen, Positionieren, ...

Ebene 0:Steuern, PanikAusweichen, TorwartFlucht, ...

Ebene –1:Bewegungsregelung

TorwartverhaltenEbene 0:

Stellen, Halten,Hauweg, Elfmeter, ...

Ebene –1:Bewegungsregelung

Stellen

Halten

SchussPfadplanen

StellenZiel

Schussziel

Anlauf

Vollstrecken

Pfadplanen Halten

Schuss

Anlauf

Stellen

Schussziel

Anlauf

Vollstrecken

Pfadplanen Halten

Schuss

Anlauf Stellen

Schussziel

Anlauf

Vollstrecken

Pfadplanen Halten

Schuss

VollstreckenStellen

Schussziel

Anlauf

Vollstrecken

Pfadplanen Halten

Schuss

Vollstrecken

Halten

Schussziel

Anlauf

Vollstrecken

Pfadplanen Halten

Schuss

Vollstrecken Halten

Schussziel

Anlauf

Vollstrecken

Pfadplanen Halten

Schuss

Halten

Anlauf

Vollstrecken

Pfadplanen Halten

PassenAnlauf

Positionieren

Schussziel

Anlauf Positionieren

Passen Passen

Positionieren

Schussziel

Anlauf Positionieren Passen

PassenPassen

Haurein

Schussziel

PassenPositionierenAnlauf Haurein

Passen

Haurein

HaureinPassenAnlauf Positionieren

Passen

Haurein

HaureinAnlauf Positionieren Passen

Passen

Haurein

HaureinAnlauf Positionieren Passen

Resultate• Hierarchische Architektur zur reaktiven

Verhaltenssteuerung vorgeschlagen• Entwicklungsumgebung mit Verhaltensrahmen,

Vorhersagen, Monitor, Simulator• Anwendung in RoboCup-Team FU-Fighters

• SmallSize 1999-2002: • 3x Vizeweltmeister, 1x vierter Platz• Europameister 2000• Gewinner GermanOpen 2002, zweiter Platz 2001

• MidSize 2002: • Teilnahme GermanOpen, WM in Fukuoka

• Nutzung durch CMU Hunde im RoboCup 2000

Ausblick• Ausbau der höheren Ebenen

• Mehr komplexe Verhalten• Teamverhalten

• Lernen• Verstärkungslernen• Lernen von Vorhersagen• Parameterlernen

• Anwendung auf andere Domänen• Sony-Hunde, humanoide Roboter

Verhaltensgruppe• Prof. Raúl Rojas• Alexander Gloye, Lars Knipping,

Daniel Szer• Andreas Schebesch, Martin Sprengel,

Wolf Lindstrot, Lars Wolter, Mark Simon,Kirill Koulechov, Fabian Wiesel

Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Sven Behnke Freie Universität...

Documents

Transcript of Eine geschichtete Architektur zur reaktiven Verhaltenssteuerung Sven Behnke Freie Universität...

Bericht zum Unterrichtsprak- tikum im Fach Informatik · Fachbereich Informatik und Ausblick auf den Informatik-Leistungskurs Das Fach Informatik erfreut sich großer Beliebtheit,

Informatik Differenzierungskurs. Bezugswissenschaften zum FachMethodenAnforderungenInhalte Physik Mathematik Informatik.

Fakultät für informatik informatik 12 technische universität dortmund Applications (2) Peter Marwedel Informatik 12, TU Dortmund.

Apostelkirche Kaiserslautern Geschichtete Außenbau Innenraum.

Angewandte Informatik – Psychologie und Informatik · Angewandte Informatik – Psychologie und Informatik 3 „Die Kombination aus Psychologie und Informatik ist unerlässlich,

Informatik Grundlagen, Seminar 8 WS04 1 Informatik Grundlagen, WS04, Seminar 8 Informatik.

Bachelor Informatik...Informatik: Aufbau des Studiums und Regelstudienzeit Bachelor Informatik 1 IT-Systeme Grundlagen Technische Informatik 1 Softwareentwicklung 1 Analysis Lineare

Modulhandbuch Praktische Informatik Praktische …...Modulhandbuch Praktische Informatik erzeugt am 25.01.2018,10:22 Praktische Informatik Pflichtfächer (Übersicht) Modulbezeichnung

Grundlagen der Informatik - hs-weingarten.deertel/vorlesungen/ginf/skript.pdf · Kapitel 1 Was ist Informatik? 1.1 Informatik Deﬁnition 1.1 Informatik ist die Wissenschaft der automatischen

Vorlesung: Technische Informatik 3 · Arbeitsbereich FachbereichInformatik Vorlesung: Technische Informatik 3 Vorlesung:Technische Informatik 3 { Rechnerarchitektur und Betriebssysteme

FESTIGKEITSPROFILE DER LITHOSPHÄRE - … · Geschichtete und geschieferte Gesteine können statistisch gesehen als homogene, anisotrope ... Welle eines Erdbebens oder einer Explosion

Conrad Jon Godly. Geschichtete Zeit · auch von Paul Cézanne, ohne dass Godly Farb - flecken vom Gegenstand gelöst aufträgt wie er. Trotz Unterschieden in Tradition und Auffassung

Geschichtete Veneers mit IPS e.max Ceram Selection · Deutschland, August Bruguera, Spanien, und Gérald Ubassy, Frankreich. 13 Light Absorber-Massen 11 Special Enamel-Massen 12 Light

Fakultät für informatik informatik 12 technische universität dortmund Lehrstuhl Informatik 12 Technische Informatik/Eingebettete Systeme Arbeitsbereich.

Die Teilgebiete der Informatik - homepages.thm.de · Prof. Dr. A. Christidis • WS 2017 /18 Die Teilgebiete der Informatik Technische Informatik Praktische Informatik Theoretische

© Jochen SträterDezernat 46 1Seite 01.01.2007 Informatik Sekundarstufe I – Zertifikatskurs Informatik: Theoretische Informatik.

Effekte der Hypnotherapie - MEG Tübingen · Perzeptuelles Konzeptuelles Gedächtnis (z.T. unbewußt) (bewußt) Abbildung 1: Explizite und implizite Verhaltenssteuerung Es scheint,

Fakultät für informatik informatik 12 technische universität dortmund Universität Dortmund Controllersynthese Peter Marwedel Informatik 12.

Fakultät für informatik informatik 12 technische universität dortmund VHDL P. Marwedel Informatik 12, U. Dortmund.

ho Tax Compliance und Umsatzsteuer - ilf-frankfurt.de · Risikomanagement und Verhaltenssteuerung der Finanzverwaltung contra Umsatzsteuer Compliance der Unternehmen Stand: 03.12.2014