Post on 13-Aug-2019
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Devi ation’-Prinzip Beispiel: Kollusion
Mikroökonomik B4.3 Wiederholte Spiele
Dennis L. Gärtner
6. Juli
1 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Devi ation’-Prinzip Beispiel: Kollusion
ÜbersichtAnnahmen:
◮ Dynamisches Spiel: Spieler treffen Entscheidungensequentiell.
◮ Vollständige Information: Präferenzen der Spieler überErgebnisse sind allgemein bekannt .
◮ Perfekte Information: Ziehende Spieler kennen gesamteGeschichte des Spiels.
Konzepte:◮ Endlich wiederholte Spiele.◮ Unendlich wiederholte Spiele.◮ Das ‘One-Deviation Principle’.
Anwendungen/Beispiele:◮ Das Gefangenen-Dilemma◮ Wiederholtes Duopol
2 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Devi ation’-Prinzip Beispiel: Kollusion
Literaturangaben
◮ Gibbons: Kapitel 2.3◮ Osborne (2004): Kapitel 14, 15◮ Mas-Collel et al.: Kapitel 12, App. A
Weiterführende Literatur:George J. Mailath und Larry Samuelson (2006): Re-peated Games and Reputations: Long-Run Relation-ships, Oxford University Press.
3 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Devi ation’-Prinzip Beispiel: Kollusion
MotivationErinnern wir uns an das Gefangenendilemma:
−1,−1
0,−9
−9, 0
−6,−6Prisoner 1
cooperate
defect
Prisoner 2cooperate defect
Frage: Kann Kooperation erreicht werden wenn Spielwiederholt gespielt wird?
Idee: Spieler können Kooperationsanreize schaffen, indem sieAktionen auf die Geschichte des Spiels (insbesondere:vergangene Aktionen des andern) konditionieren.
Zum Beispiel:
4 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Devi ation’-Prinzip Beispiel: Kollusion
Motivation
Beispiele, wie in wiederholten Spielen Kooperationsanreizegeschafft werden könnten:
◮ ‘Grim-Trigger’-Strategien: Starte mit Kooperation, undfahre mit Kooperation dann (und nur dann) fort, wennbeide Spieler in der Vergangenheit kooperiert haben.
◮ ‘Tit-for-Tat’-Strategien (‘Wie-Du-mir-so-ich-Dir’): Startemit Kooperation, und tue anschliessend das, was derandere Spieler in der letzten Runde getan hat.
Werden sehen: Substanzielle Unterschiede zwischen endlichund unendlich wiederholten Spielen!
5 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispi el: Kollusion
Endlich Wiederholte Spiele
Beispiel: 2-Mal wiederholtes GefangenendilemmaNehmen wir an, das Gefangenendilemma wird zwei Malwiederholt:
1
2
2
c
d
c
d
d
c
· · ·
· · ·
· · ·
1
2
2
c
d
c
d
d
c
(−1−6,−1−6)
(−9−6, 0−6)
(−6−6,−6−6)
( 0−6,−9−6)
Wiederholungsfrage: Wie viele Strategien hat jeder Spieler?Behauptung: Im einzigen Tsp-Nash-GG spielen Spieler inbeiden Runden defect .Warum? Rollen wir per Rückwärtsinduktion das Spiel vonhinten auf. . .
6 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispi el: Kollusion
1
2
2
c
d
c
d
d
c
· · ·
· · ·
· · ·
1
2
2
c
d
c
d
d
c
(−1−6,−1−6)
(−9−6, 0−6)
(−6−6,−6−6)
( 0−6,−9−6)
◮ Für jedes beliebige Ergebnis der ersten Runde ist (d,d)das einzige Nash-GG in jedem der Teilspiele der zweitenRunde.
◮ Damit können wir das gesamte Spiel reduzieren auf dieeinmalige Variante, wobei zu jedem Ergebnis der erstenRunde Payoffs von (−6,−6) hinzuaddiert werden.
7 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispi el: Kollusion
Endlich Wiederholte Spiele: AllgemeinerAllgemeiner: Sei Γ ein ssf mit Spielern 1, . . . ,N,Aktionsmengen Ai und Auszahlungsfunktionen ui .
Definition: Endlich Wiederholtes Spiel
Wir bezeichnen mit Γ(T ) das endlich wiederholte Spiel inwelchem Γ T Mal hintereinander gespielt wirdund in welchemdie Payoffs über Ergebnisse durch die diskontierte Summe derPayoffs in jeder Wiederholung gegeben ist:
ui(a1, . . . aT ) = ui(a
1) + δui(a2) + δ2ui(a
3) + · · ·+ δT−1ui(aT ),
wobei at ∈ A1 × · · · ×AN die Aktionen aller Spieler in der t-tenRunde von Γ(T ) bezeichnet.
Terminologie: Γ=̂‘Stufenspiel’, t ∈ {1, . . . ,T}=̂‘Stufe’.Wiederholungsfrage: Warum ist dasN-Runden-Verhandlungsspiel kein wiederholtes Spiel?
8 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispi el: Kollusion
Gleichgewichte in endlich wiederholten SpielenResultat: Gleichgewichte in endlich wiederholten Spielen
Falls das Stufenspiel Γ ein eindeutiges Nash-GG besitzt, dannhat für beliebige endliche T das wiederholte Spiel Γ(T ) eineindeutiges teilspielperfektes Nash-GG: Das Nash-GG von Γwird in jeder Runde gespielt.
Warum? Per Rückwärtsinduktion: Sei a∗ ≡ (a∗
1, . . . ,a∗
N) dasNash-GG von Γ.
◮ a∗ ist das eindeutige Nash-GG der letzten Stufe T .◮ Aktionen der vorletzten Runde T − 1 haben also keinen
Einfluss auf künftige Payoffs; (a∗,a∗) ist also auch daseindeutige Nash-GG des Teilspiels beginnend in T − 1....
Bem.: Resultat gilt auch für Stufenspiele in extensiver Form miteindeutigem teilspielperfektem Nash-GG.
9 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispi el: Kollusion
Gleichgewichte in endlich wiederholten Spielen
Also. . .In endlich wiederholten Spielen mit eindeutigemStufenspiel-GG ist nur wiederholtes Spielen des Nash-GGmöglich.
→ Warum? Etwas anderes zu spielen ist in t = T nichtglaubwürdig ⇒ t = T − 1 ⇒ · · · ⇒ t = 1
⇒ Das Konditionieren künftiger auf vergangene Aktionen istunglaubwürding !
Offene Fragen◮ Was ist mit Stufenspielen mit multiplen Nash-GG?◮ Was ist mit unendlich wiederholten Spielen?
10 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispi el: Kollusion
Kooperation in endlich wiederholten Spielen:Ein Beispiel
Nehmen wir an das folgende Stufenspiel wird 2 Mal gespielt:
−1,−10,−9
−9,−9
−9, 0−6,−6−9,−9
−9,−9−9,−9−4,−4
P1cdd′
P2c d d′
Stufenspiel hat zweiNash-GG:(d,d) und (d′,d′).
Idee: Spiele ‘gutes’ GG in t = 2 wenn (und nur wenn) in t = 1kooperiert wurde.Behauptung: Für δ gross genug (Spieler sind ‘hinreichendgeduldig’) ist folgendes Strategieprofil ein Tsp-Nash-GG:
◮ In t = 1 spielt jeder Spieler i c.◮ In t = 2 spielt jeder Spieler i
◮ d′ falls beide Spieler in t = 1 c gespielt haben, und◮ d für jede andere Geschichte des Spiels.
11 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispi el: Kollusion
Kooperation in endlich wiederholten Spielen:Ein Beispiel
Strategien sind offensichtlich GG im t = 2-Teilspiel.Um für t = 1 zu prüfen: Addieren wir GG-Payoffs aus t = 2 zurstrategischen Form für t = 1:
−1 − 4δ,−1 − 4δ0 − 6δ,−9 − 6δ
−9 − 6δ,−9 − 6δ
−9 − 6δ, 0 − 6δ−6 − 6δ,−6 − 6δ−9 − 6δ,−9 − 6δ
−9 − 6δ,−9 − 6δ−9 − 6δ,−9 − 6δ−4 − 6δ,−4 − 6δ
P1c
d
d′
P2c d d′
c ist somit beste Antwort auf c g.d.w.
−1 − 4δ > 0 − 6δ ⇐⇒ δ > 1/2
Strategien sind also ein GG für hinreichend geduldige Spieler.Allerdings: Setzt Spielen eines Pareto-dominierten GG int = 2 voraus?
12 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispi el: Kollusion
Zusammenfassung:Kooperation in endlich wiederholten Spielen
◮ Einsicht : In endlich wiederholten Spielen kann nur dasVorhandensein multipler Nash-GG im StufenspielDrohungen glaubwürdig machen, welche künftigesVerhalten auf heutiges heutiges Verhalten konditionieren.
◮ Grund : Alles andere als Nash (etwa ‘Grim-Trigger’ oder‘Tit-for-Tat’) ist in letzter Runde unglaubwürdig →Rückwärtsinduktion
Aber: Resultate basieren auf. . .
◮ eindeutigem Vorhandensein einer letzten Runde◮ ‘sehr rationale’ Spieler, was Rückwärtsinduktion anbelangt.
⇒ unendlich wiederholte Spiele13 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion
Unendlich wiederholte SpieleSei Γ ein ssf mit Spielern 1, . . . ,N, Aktionsmengen Ai undAuszahlungsfunktionen ui .
Definition: Unendlich wiederholtes SpielWir bezeichnen mit Γ(∞) das unendlich wiederholte Spiel inwelchem Γ unendlich oft hintereinander gespielt wird, in wel-chem Ergebnisse unendliche Aktionsfolgen (a1,a2, . . .) sind,wobei at ∈ A1 × · · · ×AN das Aktionsprofil der Spieler in Stufet = 1,2, . . . angibt, und in welchem die Payoffs über Ergebnis-se durch die diskontierte Summe der Payoffs in jeder Wieder-holung gegeben ist:
ui(a1, . . . aT ) = ui(a
1) + δui(a2) + δ2ui(a
3) + · · · ,
wobei δ < 1 der (Spielern gemeine) Diskontfaktor ist.
14 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion
Unendlich wiederholte Spiele
Anmerkungen
◮ Falls Sie die Idee einer unendlichen Wiederholung nichtmögen: Interpretieren Sie δ als die Wahrscheinlichkeit,dass das Spiel in jeder Stufe endet.
Wichtig ist hier die Unbestimmtheit einer letzten Runde.
◮ Alle Teilspiele eines unendlich wiederholten Spiels sindidentisch zum ganzen Spiel selbst (zeichnen sich jedochdurch andere vorangehende Geschichten aus).
15 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion
Das unendlich wiederholte GefangenendilemmaBetrachten wir das unendlich wiederholte Gefangenendilemma:
−1,−10,−9
−9, 0−6,−6
cooperatedefect
cooperate defect
◮ Ein Tsp-Nash-GG: beide spielen ‘d’ in jeder Runde.◮ Aber : ∞-Wiederholung eröffnet zusätzlich Möglichkeit
anderer (besserer!) GG.◮ Zum Beispiel : Beide Spieler spielen ‘Grim-Trigger ’:
Grim-Trigger-Strategie : Spiele ‘c’ in t = 1. Danach, injeder Stufe t > 1, spiele ‘c’ g.d.w. beide Spieler in allent − 1 vorangehenden Runden ‘c’ gespielt haben.
Wenn beide Spieler GT spielen ⇒ Kooperation (c, c) injeder Runde!Nett, aber ist dieses Strategieprofil teilspielperfekt? 16 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion
‘Grim-Trigger’-Strategien
Ist es ein Tsp-Nash-GG, wenn beide Grim-Trigger Spielen?Nehmen wir an P2 spielt GT. Was ist P1’s beste Antwort injedem Teilspiel?
1. Betrachten wir ein beliebiges Tsp, in dem irgendeinSpieler vorher ‘d’ gespielt hat:
⇒ P2 spielt in aller Zukunft ‘d’.⇒ Beste Antwort für P1 ist, das selbe zu tun!
17 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion
‘Grim-Trigger’-Strategien
2. Betrachten wir ein beliebiges Tsp, in dem kein Spielervorher ‘d’ gespielt hat:
◮ Sich an GT zu halten gibt P1 Payoff −1 in jeder Runde.◮ Beste alternative Strategie: in erster Runde des Tsp ‘d’
spielen (Payoff 0) und ‘d’ auch in allen weiteren Runden(Payoff −6).
⇒ GT ist beste Antwort g.d.w.
−1 + (−1) · δ + (−1) · δ2 + · · ·︸ ︷︷ ︸ > 0 + (−6) · δ + (−6) · δ2 + · · ·︸ ︷︷ ︸−1/(1 − δ) > −6δ/(1 − δ)
⇐⇒ δ > 1/6
18 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion
GG im ∞-wiederholten GefangenenendilemmaAlso: für δ nahe genug bei 1 (für ‘geduldige Spieler’) sindfolgende Strategieprofile Tsp-Nash-GG:
◮ Jeder Spieler spielt in jeder Runde ‘d’.⇒ GG-Payoff von −6 in jeder Runde.
◮ Jeder Spieler spielt GT.⇒ GG-Payoff von −1 in jeder Runde.
Gibt es weitere? Ja, z.B.:◮ Jeder Spieler spielt ‘d’ in ungeraden Runde
t = 1,3,5, . . ., und ‘c’ in geraden Runde sofern keinSpieler vorher ‘d’ in einer geraden Runde gespielt hat.⇒ GG-Payoffs −6,−1,−6,−1, . . ..
◮ Im GG alterniert P1 zwischen ‘c’ und ’d’; P2 spielt imGG immer ‘c’. Weicht einer hiervon ab, spielen beide inaller Zukunft ‘d’.⇒ P1: −1,0,−1,0, . . .; P2: −1,−9,−1,−9, . . ..
19 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion
Charakterisierung aller Tsp-Nash-GG
◮ Es scheint viele Tsp-Nash-GG zu geben im∞-Gefangenendilemma!
◮ Können wir alle beschreiben?◮ Allgemein schwierig, aber möglich für Limit δ → 1.◮ Brauchen zwei Definitionen:
20 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion
Durchschnittliche Payoffs
Definition: Durchschnittliche PayoffsFür eine beliebige Sequenz von Stufenspiel-Aktionsprofilen(a1,a2, . . .) sei Spieler i ’s durchschnittlicher Payoff definiertals
u i =1
1 − δ
(ui(a
1) + δui(a2) + δ2ui(a
3) + . . .)
.
Bemerkung: Für eine Sequenz konstanter Aktionen (a,a, . . .)gilt ui = ui(a).
21 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion
Erreichbare durchschnittliche Payoffs
Definition: Erreichbare (‘Feasible’) Durchschnittl. Payo ffs
Wir nennen ein Profil (u1, . . . ,uN) durchschnittlicher Payoffserreichbar (‘feasible’) , falls eine Sequenz von Stufenspiel-Aktionsprofilen (a1,a2, . . .) existiert, sodass für alle i =1, . . . ,N gilt: u i(ai) = u i .
Bemerkung: Entspricht der konvexifizierten Menge möglicherPayoffprofile im Stufenspiel.
22 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion
Erreichbare ∅-Payoffs im GefangenendilemmaErreichbare durchschnittliche Payoffs im Gefangenendilemma:
−10 −5 0−10
−5
0
(d,d) (d, c)
(c,d)(c, c)
u1
u2
Intuitiv: Menge erreichbarer durchschnittlicher Payoffs sammeltPayoffprofile, welche für beliebige Sequenz von Aktionsprofilen(a1,a2, . . .) resultieren können.
⇒ Durchschnittl. Payoffs für Tsp-Nash-GG-Strategieprofile?23 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion
Das Folk Theorem
Resultat: Das Folk TheoremSei
◮ Γ ein ssf mit vollständiger Info;◮ (u1, . . . ,uN) das Payoffprofil eines Nash-GG von Γ;◮ (u1, . . . ,uN) ein beliebiges erreichbares
durchschnittliches Payoffprofil von Γ(∞).
Dann gilt: Falls ui > u i für alle i = 1, . . . ,N und falls δ < 1gross genug, so existiert ein teilspielperfektes Nash-GG vonΓ(∞), welches (u1, . . . ,uN) als durchschnittliche Payoffs lie-fert.
24 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion
Das Folk Theorem im Gefangenendilemma
−10 −5 0−10
−5
0
(d,d)(NE)
(d, c)
(c,d)(c, c)
u1
u2
Intuition: Jeder Spieler muss mindestens den Payoff desStufenspiel-Nash-GG erhalten.Warum? Da er immer darauf zurückfallen kann, in jeder Rundeseine Stufenspiel-Nash-GG-Strategie zu spielen (woraufhin esoptimal für den anderen ist, das selbe zu tun).
25 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion
Zusammenfassung:Kooperation in unendlich wiederholten Spielen
◮ Allgemeine Einsicht : Für unendlich wiederholte Spielekann Kooperation (also: durchschnittliche Payoffs überNash) auch in Spielen mit eindeutigem Nash-GG desStufenspiels erreicht werden.
◮ Intuition : Trigger-Strategien u.Ä. werden glaubwürdig, daes keine definitive ‘letzte Runde’ gibt.
◮ Allerdings : Sehr viele mögliche Gleichgewichte ⇒ keineklare Vorhersage.
→ Selektionskriterien wie Effizienz bzw. Pareto-Dominanz.
26 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion
Das ‘One-Deviation’-Prinzip in wiederholten Spielen
Das Problem: Identifizierung von Tsp-Nash-GG inwiederholten Spielen (endlich wie auch unendlich) kannmühsam sein, da wir in allen Teilspielen (sehr viele und z.T.sehr ‘lang’) alle möglichen Abweichungsmöglichkeitenüberprüfen müssen!
→ Lösung / Vereinfachung: Das ‘One-Deviation’-Prinzip.
27 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion
Das ‘One-Deviation’-Prinzip in wiederholten Spielen
Definition: ‘One-Deviation’-EigenschaftEin Strategieprofil eines wiederholten Spiels erfüllt die‘One-Deviation’-Eigenschaft , wenn für jedes Teilspiel gilt:Kein Spieler i kann seinen Payoff erhöhen, indem eram Anfang des Teilspiels eine andere Aktion wählt (Strategiender anderen Spieler sowie den Rest der Strategie von Spieler ihalten wir dabei fest).
28 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion
Das ‘One-Deviation’-Prinzip in wiederholten Spielen
Resultat: ‘One-Deviation’-PrinzipEin Strategieprofil eines wiederholten Spiels (endlich oder un-dendlich) ist dann und nur dann ein teilspielperfektes Nash-GG, wenn es die ‘One-Deviation’-Eigenschaft erfüllt.
Beispiel: Um zu zeigen, dass Grim-Trigger imGefangenendilemma oben eine gegenseitig beste Antwortdarstellt, müssen wir nur zeigen, dass es in jedem beliebigenTeilspiel (schwach) besser ist als einmal am Anfangabzuweichen und dann wieder zu Grim-Triggerzurückzukehren.
29 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion
Intuition für das ‘One-Deviation’-PrinzipBetrachten Sie das folgende Ein-Spieler-, 2-Züge-Spiel:
Teilspiel ‘C’ Teilspiel ‘D’
1
1 1C D
E F G H
Um zu überprüfen, dass ‘CFH’ ein Tsp-Nash-GG ist, müssenwir nicht alle anderen 7(!) Strategien überprüfen (‘DFH’, ‘CEG’,‘CEH’, ‘CFG’,. . . ), sondern nur:
◮ ‘CFH’ gegen ‘DFH’,◮ ‘F’ gegen ‘E’ in Teilspiel ‘C’, und◮ ‘H’ gegen ‘G’ in Teilspiel ‘D’.
30 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion
Intuition für das ‘One-Deviation’-Prinzip
Anmerkungen:◮ Gegeben Strategien der anderen ist Bestimmung der
besten Antwort wie ein Ein-Spieler-Spiel!◮ Obwohl Argument auf Rückwärtsinduktion zu basieren
scheint, kann gezeigt werden, dass es auch für unendlicheSpiel gilt (mit δ < 1).
31 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion
Anwendung des ‘One-Deviation’-Prinzips: Ein BeispielBetrachten Sie folgende Strategien im ∞-wiederholtenGefangenendilemma:‘Tit-For-Tat’ : Spieler spielen ‘c’ in der ersten Runde. In allenfolgenden Runden wählen Spieler jene Aktion, welche der an-dere Spieler in der Runde vorher gewählt hat.
Wir müssen vier Klassen von Teilspielen unterscheiden,charakterisiert durch ihre Aktionen entlang desGleichgewichtspfads:
◮ Fall 1: t = 1, t > 1 & at−1 = (c, c)◮ Fall 2: t > 1 & at−1 = (c,d)◮ Fall 3: t > 1 & at−1 = (d, c)◮ Fall 4: t > 1 & at−1 = (d,d)
Wenden wir jeweils das OD-Prinzip an. . .32 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion
Anwendung des ‘One-Deviation’-Prinzips: Ein BeispielFall 1: t = 1, t > 1 & at−1 = (c, c)
◮ GG-Pfad: (c, c), (c, c), (c, c), . . .◮ OPD P1: (d, c), (c,d), (d, c), . . .
Damit ‘Tit-for-Tat’ P1 besser stellt als seine profitabelsteOne-Period-Deviation brauchen wir daher
−1(1 + δ + · · · ) > 0(1 + δ2 + · · · )− 9(δ + δ3 + · · · )
−11 − δ
⇐⇒ > −9δ
1 − δ2
δ⇐⇒ > 1/8
Analoges vorgehen in den verbleibenden Fällen ergibt:Fall 2: t > 1 und at−1 = (c, d)
◮ GG-Pfad: (d, c), (c,d), (d, c), . . .◮ OPD P1: (c, c), (c, c), (c, c), . . .
}⇒ δ 6 1/8
33 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Deviation’-Prinzip Beispiel: Kollusion
Anwendung des ‘One-Deviation’-Prinzips: Ein BeispielFall 3: t > 1 und at−1 = (d, c)
◮ GG-Pfad: (c,d), (d, c), (c,d), . . .◮ OPD P1: (d,d), (d,d), (d,d), . . .
}⇒ δ > 1/2
Fall 4: t > 1 und at−1 = (d, d)
◮ GG-Pfad: (d,d), (d,d), (d,d), . . .◮ OPD P1: (c,d), (d, c), (c,d), . . .
}⇒ δ 6 1/2
⇒ ‘Tit-for-Tat’ ist kein Tsp-Nash-GG, für beliebiges δ.Anmerkungen :
◮ Es ist allerdings ein Tsp-Nash-GG für δ = 1/8 wenn wirdie Stufenspiel-Auszahlungen der Spieler für (d,d) von −6auf −8 anpassen (es müssen nur Fälle 3 & 4 neu evaluiertwerden).
◮ ‘Tit-for-Tat’ scheint in experimentellen Spielen eine guteStrategie zu sein (siehe Osborne 14.9)! 34 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Devi ation’-Prinzip Beispiel: Kollusion
Beispiel: Kollusion zwischen Cournot-Duopolisten
Betrachten Sie eine unendlich wiederholte Interaktionzwischen zwei Cournot-Duopolisten mit Grenzkosten c undNachfrage P(Q) = a − Q.
Was wir über das Stufenspiel wissen. . .◮ Im eindeutigen Nash-GG setzen Spieler qC
i = (a − c)/3und machen Gewinne πC
i = (a − c)2/9.◮ Gewinnsumme wäre maximiert wenn Firmen q1,q2 setzen
sodass q1 + q2 = qM , wobei qM = (a − c)/2Monopolmenge bezeichnet.→ Ergibt Gewinnsumme πM = (a − c)2/4.→ Insbesondere: beide Firmen würden besser fahren, wenn
sie sich auf q1 = q2 = qM/2 koordinieren könnten (gibtπM/2 für beide).
35 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Devi ation’-Prinzip Beispiel: Kollusion
Beispiel: Kollusion zwischen Cournot-Duopolisten
Wiederholung◮ Endliche Wiederholung: Im einzigen Tsp-Nash-GG
setzen Firmen in jeder Runde qC .
◮ Unendliche Wiederholung: Möglich, darauf zukoordinieren (‘kolludieren’), dass jede Firma qM/2 setzt!
Betrachten wir hierzu folgende Grim-Trigger-Strategie:
Jede Firma produziere qM/2 in der ersten Runde, sowiein jeder späteren Runde sofern beide Firmen in der Ver-gangenheit immer qM/2 produziert haben. Für jede an-dere Geschichte setzt jede Firma qC .
36 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Devi ation’-Prinzip Beispiel: Kollusion
Beispiel: Kollusion zwischen Cournot-DuopolistenWenden wir das ODP an:
◮ Fall 1: Teilspiele in welchen eine Firma inVergangenheit qi 6= qM
i /2 gespielt hat.
⇒ Gegeben, dass Firma 2 Grim-Trigger spielt (also qC in jederRunde) ist es für Firma 1 optimal, das selbe zu tun.
◮ Fall 2: Teilspiele in welchen keine Firma inVergangenheit qi 6= qM
i /2 gespielt hat.◮ GG-Payoff (beide spielen Trigger) von πM/2 in jeder Runde.◮ In bester One-Period-Deviation setzt Firma 1
qD = argmaxq1(a − q1 − qM/2)q1
in der ersten Runde des Teilspiels, und qC danach(gegeben, dass Spieler 2 qC setzt).
37 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Devi ation’-Prinzip Beispiel: Kollusion
Beispiel: Kollusion zwischen Cournot-Duopolisten
Berechnung der besten One-Period-Deviation ergibtqD
1 = 3(a − c)/8 und πD1 = 9(a − c)2/64.
⇒ Firmen finden es optimal nicht vom GG-Pfad abzuweichen,wenn
12π
M + δ 12π
M + · · · > πD + δπC + δ2πC + · · ·
⇐⇒1
1 − δ· 1
2πM> πD +
δ
1 − δπC
⇐⇒ δ >πD − 1
2πM
πD − πC=
917
38 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Devi ation’-Prinzip Beispiel: Kollusion
Erweiterung: Ungeduldige Cournot-DuopolistenWas wenn δ < 9/17? Gibt es bessere Tsp-Nash-GG als injeder Runde qC zu produzieren?Duopolisten könnten obige Trigger-Strategien mit einer‘gemässigten’ Kollusionsmenge q∗ ∈ (qC ,qM/2) (statt qM/2)erwägen. Dies gibt
◮ einen geringeren GG-Gewinn von πE = q∗ · (a − c − 2q∗)(statt πM/2);
◮ einen kleineren Abweichungsgewinn in der erstenTsp-Periode von πD = (a − q∗ − c)2/4.
Für beliebiges (q∗, δ) werden es Firmen optimal finden, sich andie Strategie zu halten, falls
πE + δπE + · · · > πD + δπC + δ2πC + · · ·
39 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Devi ation’-Prinzip Beispiel: Kollusion
Erweiterung: Ungeduldige Cournot-Duopolisten
11 − δ
· πE⇐⇒ > πD +δ
1 − δπC
⇐⇒ q∗ 69 − 5δ
3(9 − δ)(a − c) ≡ q∗(δ),
wobei q∗(δ) in δ abnimmt, für δ = 9/17 den Wert qM/2annimmt, und sich für δ → 0 der Menge qC annähert.
40 / 41
Mikro B - 4.3 Wiederholte Spiele
Endliche Wiederholung Unendliche Wiederholung ‘One-Devi ation’-Prinzip Beispiel: Kollusion
Erweiterung: Ungeduldige Cournot-Duopolisten
Illustration: Minimale durch GT stützbare kollusive Menge:
0.2 0.4 0.6 0.8 1.00
qC
12qM
0δ
q
q∗(δ)
41 / 41