Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung...

41
Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Mikroökonomik B 4.3 Wiederholte Spiele Dennis L. Gärtner 6. Juli 1 / 41

Transcript of Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung...

Page 1: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Devi ation’-Prinzip Beispiel: Kollusion

Mikroökonomik B4.3 Wiederholte Spiele

Dennis L. Gärtner

6. Juli

1 / 41

Page 2: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Devi ation’-Prinzip Beispiel: Kollusion

ÜbersichtAnnahmen:

◮ Dynamisches Spiel: Spieler treffen Entscheidungensequentiell.

◮ Vollständige Information: Präferenzen der Spieler überErgebnisse sind allgemein bekannt .

◮ Perfekte Information: Ziehende Spieler kennen gesamteGeschichte des Spiels.

Konzepte:◮ Endlich wiederholte Spiele.◮ Unendlich wiederholte Spiele.◮ Das ‘One-Deviation Principle’.

Anwendungen/Beispiele:◮ Das Gefangenen-Dilemma◮ Wiederholtes Duopol

2 / 41

Page 3: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Devi ation’-Prinzip Beispiel: Kollusion

Literaturangaben

◮ Gibbons: Kapitel 2.3◮ Osborne (2004): Kapitel 14, 15◮ Mas-Collel et al.: Kapitel 12, App. A

Weiterführende Literatur:George J. Mailath und Larry Samuelson (2006): Re-peated Games and Reputations: Long-Run Relation-ships, Oxford University Press.

3 / 41

Page 4: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Devi ation’-Prinzip Beispiel: Kollusion

MotivationErinnern wir uns an das Gefangenendilemma:

−1,−1

0,−9

−9, 0

−6,−6Prisoner 1

cooperate

defect

Prisoner 2cooperate defect

Frage: Kann Kooperation erreicht werden wenn Spielwiederholt gespielt wird?

Idee: Spieler können Kooperationsanreize schaffen, indem sieAktionen auf die Geschichte des Spiels (insbesondere:vergangene Aktionen des andern) konditionieren.

Zum Beispiel:

4 / 41

Page 5: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Devi ation’-Prinzip Beispiel: Kollusion

Motivation

Beispiele, wie in wiederholten Spielen Kooperationsanreizegeschafft werden könnten:

◮ ‘Grim-Trigger’-Strategien: Starte mit Kooperation, undfahre mit Kooperation dann (und nur dann) fort, wennbeide Spieler in der Vergangenheit kooperiert haben.

◮ ‘Tit-for-Tat’-Strategien (‘Wie-Du-mir-so-ich-Dir’): Startemit Kooperation, und tue anschliessend das, was derandere Spieler in der letzten Runde getan hat.

Werden sehen: Substanzielle Unterschiede zwischen endlichund unendlich wiederholten Spielen!

5 / 41

Page 6: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispi el: Kollusion

Endlich Wiederholte Spiele

Beispiel: 2-Mal wiederholtes GefangenendilemmaNehmen wir an, das Gefangenendilemma wird zwei Malwiederholt:

1

2

2

c

d

c

d

d

c

· · ·

· · ·

· · ·

1

2

2

c

d

c

d

d

c

(−1−6,−1−6)

(−9−6, 0−6)

(−6−6,−6−6)

( 0−6,−9−6)

Wiederholungsfrage: Wie viele Strategien hat jeder Spieler?Behauptung: Im einzigen Tsp-Nash-GG spielen Spieler inbeiden Runden defect .Warum? Rollen wir per Rückwärtsinduktion das Spiel vonhinten auf. . .

6 / 41

Page 7: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispi el: Kollusion

1

2

2

c

d

c

d

d

c

· · ·

· · ·

· · ·

1

2

2

c

d

c

d

d

c

(−1−6,−1−6)

(−9−6, 0−6)

(−6−6,−6−6)

( 0−6,−9−6)

◮ Für jedes beliebige Ergebnis der ersten Runde ist (d,d)das einzige Nash-GG in jedem der Teilspiele der zweitenRunde.

◮ Damit können wir das gesamte Spiel reduzieren auf dieeinmalige Variante, wobei zu jedem Ergebnis der erstenRunde Payoffs von (−6,−6) hinzuaddiert werden.

7 / 41

Page 8: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispi el: Kollusion

Endlich Wiederholte Spiele: AllgemeinerAllgemeiner: Sei Γ ein ssf mit Spielern 1, . . . ,N,Aktionsmengen Ai und Auszahlungsfunktionen ui .

Definition: Endlich Wiederholtes Spiel

Wir bezeichnen mit Γ(T ) das endlich wiederholte Spiel inwelchem Γ T Mal hintereinander gespielt wirdund in welchemdie Payoffs über Ergebnisse durch die diskontierte Summe derPayoffs in jeder Wiederholung gegeben ist:

ui(a1, . . . aT ) = ui(a

1) + δui(a2) + δ2ui(a

3) + · · ·+ δT−1ui(aT ),

wobei at ∈ A1 × · · · ×AN die Aktionen aller Spieler in der t-tenRunde von Γ(T ) bezeichnet.

Terminologie: Γ=̂‘Stufenspiel’, t ∈ {1, . . . ,T}=̂‘Stufe’.Wiederholungsfrage: Warum ist dasN-Runden-Verhandlungsspiel kein wiederholtes Spiel?

8 / 41

Page 9: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispi el: Kollusion

Gleichgewichte in endlich wiederholten SpielenResultat: Gleichgewichte in endlich wiederholten Spielen

Falls das Stufenspiel Γ ein eindeutiges Nash-GG besitzt, dannhat für beliebige endliche T das wiederholte Spiel Γ(T ) eineindeutiges teilspielperfektes Nash-GG: Das Nash-GG von Γwird in jeder Runde gespielt.

Warum? Per Rückwärtsinduktion: Sei a∗ ≡ (a∗

1, . . . ,a∗

N) dasNash-GG von Γ.

◮ a∗ ist das eindeutige Nash-GG der letzten Stufe T .◮ Aktionen der vorletzten Runde T − 1 haben also keinen

Einfluss auf künftige Payoffs; (a∗,a∗) ist also auch daseindeutige Nash-GG des Teilspiels beginnend in T − 1....

Bem.: Resultat gilt auch für Stufenspiele in extensiver Form miteindeutigem teilspielperfektem Nash-GG.

9 / 41

Page 10: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispi el: Kollusion

Gleichgewichte in endlich wiederholten Spielen

Also. . .In endlich wiederholten Spielen mit eindeutigemStufenspiel-GG ist nur wiederholtes Spielen des Nash-GGmöglich.

→ Warum? Etwas anderes zu spielen ist in t = T nichtglaubwürdig ⇒ t = T − 1 ⇒ · · · ⇒ t = 1

⇒ Das Konditionieren künftiger auf vergangene Aktionen istunglaubwürding !

Offene Fragen◮ Was ist mit Stufenspielen mit multiplen Nash-GG?◮ Was ist mit unendlich wiederholten Spielen?

10 / 41

Page 11: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispi el: Kollusion

Kooperation in endlich wiederholten Spielen:Ein Beispiel

Nehmen wir an das folgende Stufenspiel wird 2 Mal gespielt:

−1,−10,−9

−9,−9

−9, 0−6,−6−9,−9

−9,−9−9,−9−4,−4

P1cdd′

P2c d d′

Stufenspiel hat zweiNash-GG:(d,d) und (d′,d′).

Idee: Spiele ‘gutes’ GG in t = 2 wenn (und nur wenn) in t = 1kooperiert wurde.Behauptung: Für δ gross genug (Spieler sind ‘hinreichendgeduldig’) ist folgendes Strategieprofil ein Tsp-Nash-GG:

◮ In t = 1 spielt jeder Spieler i c.◮ In t = 2 spielt jeder Spieler i

◮ d′ falls beide Spieler in t = 1 c gespielt haben, und◮ d für jede andere Geschichte des Spiels.

11 / 41

Page 12: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispi el: Kollusion

Kooperation in endlich wiederholten Spielen:Ein Beispiel

Strategien sind offensichtlich GG im t = 2-Teilspiel.Um für t = 1 zu prüfen: Addieren wir GG-Payoffs aus t = 2 zurstrategischen Form für t = 1:

−1 − 4δ,−1 − 4δ0 − 6δ,−9 − 6δ

−9 − 6δ,−9 − 6δ

−9 − 6δ, 0 − 6δ−6 − 6δ,−6 − 6δ−9 − 6δ,−9 − 6δ

−9 − 6δ,−9 − 6δ−9 − 6δ,−9 − 6δ−4 − 6δ,−4 − 6δ

P1c

d

d′

P2c d d′

c ist somit beste Antwort auf c g.d.w.

−1 − 4δ > 0 − 6δ ⇐⇒ δ > 1/2

Strategien sind also ein GG für hinreichend geduldige Spieler.Allerdings: Setzt Spielen eines Pareto-dominierten GG int = 2 voraus?

12 / 41

Page 13: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispi el: Kollusion

Zusammenfassung:Kooperation in endlich wiederholten Spielen

◮ Einsicht : In endlich wiederholten Spielen kann nur dasVorhandensein multipler Nash-GG im StufenspielDrohungen glaubwürdig machen, welche künftigesVerhalten auf heutiges heutiges Verhalten konditionieren.

◮ Grund : Alles andere als Nash (etwa ‘Grim-Trigger’ oder‘Tit-for-Tat’) ist in letzter Runde unglaubwürdig →Rückwärtsinduktion

Aber: Resultate basieren auf. . .

◮ eindeutigem Vorhandensein einer letzten Runde◮ ‘sehr rationale’ Spieler, was Rückwärtsinduktion anbelangt.

⇒ unendlich wiederholte Spiele13 / 41

Page 14: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion

Unendlich wiederholte SpieleSei Γ ein ssf mit Spielern 1, . . . ,N, Aktionsmengen Ai undAuszahlungsfunktionen ui .

Definition: Unendlich wiederholtes SpielWir bezeichnen mit Γ(∞) das unendlich wiederholte Spiel inwelchem Γ unendlich oft hintereinander gespielt wird, in wel-chem Ergebnisse unendliche Aktionsfolgen (a1,a2, . . .) sind,wobei at ∈ A1 × · · · ×AN das Aktionsprofil der Spieler in Stufet = 1,2, . . . angibt, und in welchem die Payoffs über Ergebnis-se durch die diskontierte Summe der Payoffs in jeder Wieder-holung gegeben ist:

ui(a1, . . . aT ) = ui(a

1) + δui(a2) + δ2ui(a

3) + · · · ,

wobei δ < 1 der (Spielern gemeine) Diskontfaktor ist.

14 / 41

Page 15: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion

Unendlich wiederholte Spiele

Anmerkungen

◮ Falls Sie die Idee einer unendlichen Wiederholung nichtmögen: Interpretieren Sie δ als die Wahrscheinlichkeit,dass das Spiel in jeder Stufe endet.

Wichtig ist hier die Unbestimmtheit einer letzten Runde.

◮ Alle Teilspiele eines unendlich wiederholten Spiels sindidentisch zum ganzen Spiel selbst (zeichnen sich jedochdurch andere vorangehende Geschichten aus).

15 / 41

Page 16: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion

Das unendlich wiederholte GefangenendilemmaBetrachten wir das unendlich wiederholte Gefangenendilemma:

−1,−10,−9

−9, 0−6,−6

cooperatedefect

cooperate defect

◮ Ein Tsp-Nash-GG: beide spielen ‘d’ in jeder Runde.◮ Aber : ∞-Wiederholung eröffnet zusätzlich Möglichkeit

anderer (besserer!) GG.◮ Zum Beispiel : Beide Spieler spielen ‘Grim-Trigger ’:

Grim-Trigger-Strategie : Spiele ‘c’ in t = 1. Danach, injeder Stufe t > 1, spiele ‘c’ g.d.w. beide Spieler in allent − 1 vorangehenden Runden ‘c’ gespielt haben.

Wenn beide Spieler GT spielen ⇒ Kooperation (c, c) injeder Runde!Nett, aber ist dieses Strategieprofil teilspielperfekt? 16 / 41

Page 17: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion

‘Grim-Trigger’-Strategien

Ist es ein Tsp-Nash-GG, wenn beide Grim-Trigger Spielen?Nehmen wir an P2 spielt GT. Was ist P1’s beste Antwort injedem Teilspiel?

1. Betrachten wir ein beliebiges Tsp, in dem irgendeinSpieler vorher ‘d’ gespielt hat:

⇒ P2 spielt in aller Zukunft ‘d’.⇒ Beste Antwort für P1 ist, das selbe zu tun!

17 / 41

Page 18: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion

‘Grim-Trigger’-Strategien

2. Betrachten wir ein beliebiges Tsp, in dem kein Spielervorher ‘d’ gespielt hat:

◮ Sich an GT zu halten gibt P1 Payoff −1 in jeder Runde.◮ Beste alternative Strategie: in erster Runde des Tsp ‘d’

spielen (Payoff 0) und ‘d’ auch in allen weiteren Runden(Payoff −6).

⇒ GT ist beste Antwort g.d.w.

−1 + (−1) · δ + (−1) · δ2 + · · ·︸ ︷︷ ︸ > 0 + (−6) · δ + (−6) · δ2 + · · ·︸ ︷︷ ︸−1/(1 − δ) > −6δ/(1 − δ)

⇐⇒ δ > 1/6

18 / 41

Page 19: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion

GG im ∞-wiederholten GefangenenendilemmaAlso: für δ nahe genug bei 1 (für ‘geduldige Spieler’) sindfolgende Strategieprofile Tsp-Nash-GG:

◮ Jeder Spieler spielt in jeder Runde ‘d’.⇒ GG-Payoff von −6 in jeder Runde.

◮ Jeder Spieler spielt GT.⇒ GG-Payoff von −1 in jeder Runde.

Gibt es weitere? Ja, z.B.:◮ Jeder Spieler spielt ‘d’ in ungeraden Runde

t = 1,3,5, . . ., und ‘c’ in geraden Runde sofern keinSpieler vorher ‘d’ in einer geraden Runde gespielt hat.⇒ GG-Payoffs −6,−1,−6,−1, . . ..

◮ Im GG alterniert P1 zwischen ‘c’ und ’d’; P2 spielt imGG immer ‘c’. Weicht einer hiervon ab, spielen beide inaller Zukunft ‘d’.⇒ P1: −1,0,−1,0, . . .; P2: −1,−9,−1,−9, . . ..

19 / 41

Page 20: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion

Charakterisierung aller Tsp-Nash-GG

◮ Es scheint viele Tsp-Nash-GG zu geben im∞-Gefangenendilemma!

◮ Können wir alle beschreiben?◮ Allgemein schwierig, aber möglich für Limit δ → 1.◮ Brauchen zwei Definitionen:

20 / 41

Page 21: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion

Durchschnittliche Payoffs

Definition: Durchschnittliche PayoffsFür eine beliebige Sequenz von Stufenspiel-Aktionsprofilen(a1,a2, . . .) sei Spieler i ’s durchschnittlicher Payoff definiertals

u i =1

1 − δ

(ui(a

1) + δui(a2) + δ2ui(a

3) + . . .)

.

Bemerkung: Für eine Sequenz konstanter Aktionen (a,a, . . .)gilt ui = ui(a).

21 / 41

Page 22: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion

Erreichbare durchschnittliche Payoffs

Definition: Erreichbare (‘Feasible’) Durchschnittl. Payo ffs

Wir nennen ein Profil (u1, . . . ,uN) durchschnittlicher Payoffserreichbar (‘feasible’) , falls eine Sequenz von Stufenspiel-Aktionsprofilen (a1,a2, . . .) existiert, sodass für alle i =1, . . . ,N gilt: u i(ai) = u i .

Bemerkung: Entspricht der konvexifizierten Menge möglicherPayoffprofile im Stufenspiel.

22 / 41

Page 23: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion

Erreichbare ∅-Payoffs im GefangenendilemmaErreichbare durchschnittliche Payoffs im Gefangenendilemma:

−10 −5 0−10

−5

0

(d,d) (d, c)

(c,d)(c, c)

u1

u2

Intuitiv: Menge erreichbarer durchschnittlicher Payoffs sammeltPayoffprofile, welche für beliebige Sequenz von Aktionsprofilen(a1,a2, . . .) resultieren können.

⇒ Durchschnittl. Payoffs für Tsp-Nash-GG-Strategieprofile?23 / 41

Page 24: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion

Das Folk Theorem

Resultat: Das Folk TheoremSei

◮ Γ ein ssf mit vollständiger Info;◮ (u1, . . . ,uN) das Payoffprofil eines Nash-GG von Γ;◮ (u1, . . . ,uN) ein beliebiges erreichbares

durchschnittliches Payoffprofil von Γ(∞).

Dann gilt: Falls ui > u i für alle i = 1, . . . ,N und falls δ < 1gross genug, so existiert ein teilspielperfektes Nash-GG vonΓ(∞), welches (u1, . . . ,uN) als durchschnittliche Payoffs lie-fert.

24 / 41

Page 25: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion

Das Folk Theorem im Gefangenendilemma

−10 −5 0−10

−5

0

(d,d)(NE)

(d, c)

(c,d)(c, c)

u1

u2

Intuition: Jeder Spieler muss mindestens den Payoff desStufenspiel-Nash-GG erhalten.Warum? Da er immer darauf zurückfallen kann, in jeder Rundeseine Stufenspiel-Nash-GG-Strategie zu spielen (woraufhin esoptimal für den anderen ist, das selbe zu tun).

25 / 41

Page 26: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion

Zusammenfassung:Kooperation in unendlich wiederholten Spielen

◮ Allgemeine Einsicht : Für unendlich wiederholte Spielekann Kooperation (also: durchschnittliche Payoffs überNash) auch in Spielen mit eindeutigem Nash-GG desStufenspiels erreicht werden.

◮ Intuition : Trigger-Strategien u.Ä. werden glaubwürdig, daes keine definitive ‘letzte Runde’ gibt.

◮ Allerdings : Sehr viele mögliche Gleichgewichte ⇒ keineklare Vorhersage.

→ Selektionskriterien wie Effizienz bzw. Pareto-Dominanz.

26 / 41

Page 27: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion

Das ‘One-Deviation’-Prinzip in wiederholten Spielen

Das Problem: Identifizierung von Tsp-Nash-GG inwiederholten Spielen (endlich wie auch unendlich) kannmühsam sein, da wir in allen Teilspielen (sehr viele und z.T.sehr ‘lang’) alle möglichen Abweichungsmöglichkeitenüberprüfen müssen!

→ Lösung / Vereinfachung: Das ‘One-Deviation’-Prinzip.

27 / 41

Page 28: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion

Das ‘One-Deviation’-Prinzip in wiederholten Spielen

Definition: ‘One-Deviation’-EigenschaftEin Strategieprofil eines wiederholten Spiels erfüllt die‘One-Deviation’-Eigenschaft , wenn für jedes Teilspiel gilt:Kein Spieler i kann seinen Payoff erhöhen, indem eram Anfang des Teilspiels eine andere Aktion wählt (Strategiender anderen Spieler sowie den Rest der Strategie von Spieler ihalten wir dabei fest).

28 / 41

Page 29: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion

Das ‘One-Deviation’-Prinzip in wiederholten Spielen

Resultat: ‘One-Deviation’-PrinzipEin Strategieprofil eines wiederholten Spiels (endlich oder un-dendlich) ist dann und nur dann ein teilspielperfektes Nash-GG, wenn es die ‘One-Deviation’-Eigenschaft erfüllt.

Beispiel: Um zu zeigen, dass Grim-Trigger imGefangenendilemma oben eine gegenseitig beste Antwortdarstellt, müssen wir nur zeigen, dass es in jedem beliebigenTeilspiel (schwach) besser ist als einmal am Anfangabzuweichen und dann wieder zu Grim-Triggerzurückzukehren.

29 / 41

Page 30: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion

Intuition für das ‘One-Deviation’-PrinzipBetrachten Sie das folgende Ein-Spieler-, 2-Züge-Spiel:

Teilspiel ‘C’ Teilspiel ‘D’

1

1 1C D

E F G H

Um zu überprüfen, dass ‘CFH’ ein Tsp-Nash-GG ist, müssenwir nicht alle anderen 7(!) Strategien überprüfen (‘DFH’, ‘CEG’,‘CEH’, ‘CFG’,. . . ), sondern nur:

◮ ‘CFH’ gegen ‘DFH’,◮ ‘F’ gegen ‘E’ in Teilspiel ‘C’, und◮ ‘H’ gegen ‘G’ in Teilspiel ‘D’.

30 / 41

Page 31: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion

Intuition für das ‘One-Deviation’-Prinzip

Anmerkungen:◮ Gegeben Strategien der anderen ist Bestimmung der

besten Antwort wie ein Ein-Spieler-Spiel!◮ Obwohl Argument auf Rückwärtsinduktion zu basieren

scheint, kann gezeigt werden, dass es auch für unendlicheSpiel gilt (mit δ < 1).

31 / 41

Page 32: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion

Anwendung des ‘One-Deviation’-Prinzips: Ein BeispielBetrachten Sie folgende Strategien im ∞-wiederholtenGefangenendilemma:‘Tit-For-Tat’ : Spieler spielen ‘c’ in der ersten Runde. In allenfolgenden Runden wählen Spieler jene Aktion, welche der an-dere Spieler in der Runde vorher gewählt hat.

Wir müssen vier Klassen von Teilspielen unterscheiden,charakterisiert durch ihre Aktionen entlang desGleichgewichtspfads:

◮ Fall 1: t = 1, t > 1 & at−1 = (c, c)◮ Fall 2: t > 1 & at−1 = (c,d)◮ Fall 3: t > 1 & at−1 = (d, c)◮ Fall 4: t > 1 & at−1 = (d,d)

Wenden wir jeweils das OD-Prinzip an. . .32 / 41

Page 33: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion

Anwendung des ‘One-Deviation’-Prinzips: Ein BeispielFall 1: t = 1, t > 1 & at−1 = (c, c)

◮ GG-Pfad: (c, c), (c, c), (c, c), . . .◮ OPD P1: (d, c), (c,d), (d, c), . . .

Damit ‘Tit-for-Tat’ P1 besser stellt als seine profitabelsteOne-Period-Deviation brauchen wir daher

−1(1 + δ + · · · ) > 0(1 + δ2 + · · · )− 9(δ + δ3 + · · · )

−11 − δ

⇐⇒ > −9δ

1 − δ2

δ⇐⇒ > 1/8

Analoges vorgehen in den verbleibenden Fällen ergibt:Fall 2: t > 1 und at−1 = (c, d)

◮ GG-Pfad: (d, c), (c,d), (d, c), . . .◮ OPD P1: (c, c), (c, c), (c, c), . . .

}⇒ δ 6 1/8

33 / 41

Page 34: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion

Anwendung des ‘One-Deviation’-Prinzips: Ein BeispielFall 3: t > 1 und at−1 = (d, c)

◮ GG-Pfad: (c,d), (d, c), (c,d), . . .◮ OPD P1: (d,d), (d,d), (d,d), . . .

}⇒ δ > 1/2

Fall 4: t > 1 und at−1 = (d, d)

◮ GG-Pfad: (d,d), (d,d), (d,d), . . .◮ OPD P1: (c,d), (d, c), (c,d), . . .

}⇒ δ 6 1/2

⇒ ‘Tit-for-Tat’ ist kein Tsp-Nash-GG, für beliebiges δ.Anmerkungen :

◮ Es ist allerdings ein Tsp-Nash-GG für δ = 1/8 wenn wirdie Stufenspiel-Auszahlungen der Spieler für (d,d) von −6auf −8 anpassen (es müssen nur Fälle 3 & 4 neu evaluiertwerden).

◮ ‘Tit-for-Tat’ scheint in experimentellen Spielen eine guteStrategie zu sein (siehe Osborne 14.9)! 34 / 41

Page 35: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Devi ation’-Prinzip Beispiel: Kollusion

Beispiel: Kollusion zwischen Cournot-Duopolisten

Betrachten Sie eine unendlich wiederholte Interaktionzwischen zwei Cournot-Duopolisten mit Grenzkosten c undNachfrage P(Q) = a − Q.

Was wir über das Stufenspiel wissen. . .◮ Im eindeutigen Nash-GG setzen Spieler qC

i = (a − c)/3und machen Gewinne πC

i = (a − c)2/9.◮ Gewinnsumme wäre maximiert wenn Firmen q1,q2 setzen

sodass q1 + q2 = qM , wobei qM = (a − c)/2Monopolmenge bezeichnet.→ Ergibt Gewinnsumme πM = (a − c)2/4.→ Insbesondere: beide Firmen würden besser fahren, wenn

sie sich auf q1 = q2 = qM/2 koordinieren könnten (gibtπM/2 für beide).

35 / 41

Page 36: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Devi ation’-Prinzip Beispiel: Kollusion

Beispiel: Kollusion zwischen Cournot-Duopolisten

Wiederholung◮ Endliche Wiederholung: Im einzigen Tsp-Nash-GG

setzen Firmen in jeder Runde qC .

◮ Unendliche Wiederholung: Möglich, darauf zukoordinieren (‘kolludieren’), dass jede Firma qM/2 setzt!

Betrachten wir hierzu folgende Grim-Trigger-Strategie:

Jede Firma produziere qM/2 in der ersten Runde, sowiein jeder späteren Runde sofern beide Firmen in der Ver-gangenheit immer qM/2 produziert haben. Für jede an-dere Geschichte setzt jede Firma qC .

36 / 41

Page 37: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Devi ation’-Prinzip Beispiel: Kollusion

Beispiel: Kollusion zwischen Cournot-DuopolistenWenden wir das ODP an:

◮ Fall 1: Teilspiele in welchen eine Firma inVergangenheit qi 6= qM

i /2 gespielt hat.

⇒ Gegeben, dass Firma 2 Grim-Trigger spielt (also qC in jederRunde) ist es für Firma 1 optimal, das selbe zu tun.

◮ Fall 2: Teilspiele in welchen keine Firma inVergangenheit qi 6= qM

i /2 gespielt hat.◮ GG-Payoff (beide spielen Trigger) von πM/2 in jeder Runde.◮ In bester One-Period-Deviation setzt Firma 1

qD = argmaxq1(a − q1 − qM/2)q1

in der ersten Runde des Teilspiels, und qC danach(gegeben, dass Spieler 2 qC setzt).

37 / 41

Page 38: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Devi ation’-Prinzip Beispiel: Kollusion

Beispiel: Kollusion zwischen Cournot-Duopolisten

Berechnung der besten One-Period-Deviation ergibtqD

1 = 3(a − c)/8 und πD1 = 9(a − c)2/64.

⇒ Firmen finden es optimal nicht vom GG-Pfad abzuweichen,wenn

12π

M + δ 12π

M + · · · > πD + δπC + δ2πC + · · ·

⇐⇒1

1 − δ· 1

2πM> πD +

δ

1 − δπC

⇐⇒ δ >πD − 1

2πM

πD − πC=

917

38 / 41

Page 39: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Devi ation’-Prinzip Beispiel: Kollusion

Erweiterung: Ungeduldige Cournot-DuopolistenWas wenn δ < 9/17? Gibt es bessere Tsp-Nash-GG als injeder Runde qC zu produzieren?Duopolisten könnten obige Trigger-Strategien mit einer‘gemässigten’ Kollusionsmenge q∗ ∈ (qC ,qM/2) (statt qM/2)erwägen. Dies gibt

◮ einen geringeren GG-Gewinn von πE = q∗ · (a − c − 2q∗)(statt πM/2);

◮ einen kleineren Abweichungsgewinn in der erstenTsp-Periode von πD = (a − q∗ − c)2/4.

Für beliebiges (q∗, δ) werden es Firmen optimal finden, sich andie Strategie zu halten, falls

πE + δπE + · · · > πD + δπC + δ2πC + · · ·

39 / 41

Page 40: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Devi ation’-Prinzip Beispiel: Kollusion

Erweiterung: Ungeduldige Cournot-Duopolisten

11 − δ

· πE⇐⇒ > πD +δ

1 − δπC

⇐⇒ q∗ 69 − 5δ

3(9 − δ)(a − c) ≡ q∗(δ),

wobei q∗(δ) in δ abnimmt, für δ = 9/17 den Wert qM/2annimmt, und sich für δ → 0 der Menge qC annähert.

40 / 41

Page 41: Mikroökonomik B 4.3 Wiederholte Spiele · Mikro B - 4.3 Wiederholte Spiele Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion Literaturangaben

Mikro B - 4.3 Wiederholte Spiele

Endliche Wiederholung Unendliche Wiederholung ‘One-Devi ation’-Prinzip Beispiel: Kollusion

Erweiterung: Ungeduldige Cournot-Duopolisten

Illustration: Minimale durch GT stützbare kollusive Menge:

0.2 0.4 0.6 0.8 1.00

qC

12qM

q

q∗(δ)

41 / 41