63
Nullsummenspiele

Nullsummenspiele 5 2015.ppt [Read-Only] - socio.ethz.ch · Tennis „Serve-and-Return Play“ Vorhand Rückhand Vorhand 1 -1 Rückhand -1 1 Receiver Server Walker, M. and Wooders,

  • Upload
    lyduong

  • View
    214

  • Download
    0

Embed Size (px)

Citation preview

Nullsummenspiele

1. Was sind Nullsummenspiele?2. Dominante Strategien3. Sattelpunkt4. Spiele ohne Sattelpunkt: Gemischte

Strategien5. Beispiele6. Einige Sätze

1.Nullsummenspiele

Nullsummenspiele sind Modelle für Entscheidungs-situationen mit antagonistischen Interessen derAkteure. Der Gewinn des einen ist der Verlust desanderen Spielers.

Beispiele: Die meisten Gesellschaftsspiele

Genauer: Konstantsummenspiel

Die Nutzenskala hat keinen “natürlichen” Nullpunkt. Sie kann linear transformiert werden (Intervallskala). Die Interessen der Akteure sind antagonistisch, wenn die Summe der Auszahlungen in jeder Zelle der Spielmatrix konstant ist. Durch Addition einer Konstanten können die Auszahlungen Immer so normiert werden, dass die Summe null ergibt.

S1 S2Z1 4, -4 3, -3Z2 1, -1 2, -2

S1 S2Z1 4 3Z2 1 2

Weil für die Auszahlung an Spaltenspieler = Konstante minus Auszahlung an Zeilenspieler gilt, genügt es, in der Spielmatrix die Summe auf Null zu normieren und nur die Auszahlung an den Zeilenspieler anzugeben.

Bimatrixspiel

Matrixspiel

S1 S2Z1 4, -4 3, -3Z2 1, -1 2, -2

S1 S2Z1 4 3Z2 1 2

Die rationale Entscheidung?

S1 S2Z1 4, -4 3, -3Z2 1, -1 2, -2

S1 S2Z1 4 3Z2 1 2

2. Nullsummensiele mit dominanter Strategie (für Zeile)

Der Zeilenspieler wählt Z1, der Spaltenspieler wählt S2,Die Auszahlung ist u(Z1,S2) = (3,-3)

S1 S2Z1 2 3Z2 1 4

Und hier?

Dominante Strategie für Spalte

S1 S2Z1 2 3Z2 1 4

Spalte wählt S1. Zeile muss entsprechend Z1 wählen.

S1 S2 S3

Z1 2 4 9

Z2 6 5 7

Z3 8 3 1

3. Sattelpunkt

Dominante Strategie?

S1 S2 S3

Z1 2 4 9

Z2 6 5 7

Z3 8 3 1

Zeile und Spalte haben beide keine dominante Strategie.

S1 S2 S3

Z1 2 4 9

Z2 6 5 7

Z3 8 3 1

Zeile und Spalte haben beide keine dominante Strategie.Aber es gibt einen Sattelpunkt: Minimum in der Zeile, Maximum in der Spalte (“Minimax”).

► Zeile wählt Z2, Spalte wählt S2

Weshalb Sattelpunkt?

Sattelpunkt-Theorem

Minimum in der Zeile, Maximum in der Spalte

S1 S2Z1 4 3Z2 1 2

Dominante Strategie (für Zeile)

Der Zeilenspieler wählt Z1, der Spaltenspieler wählt S2,Die Auszahlung ist u(Z1,S2) = (3,-3)

• Auch hier ist das Resultat wechselseitig rationalerWahl ein Sattelpunkt.

• Bei einer dominanten Strategie existiert immer einSattelpunkt (das Umgekehrte gilt allerdings nicht).

• Und: Ein Sattelpunkt ist ein Nash-Gleichgewicht.

Problem multipler Gleichgewichte?

3, 3 2, 4

4, 2 1, 1

Bei Nicht-Nullsummenspielen, hier z.B. Chicken

S1 S2 S3 S4

Z1 2 4 9 3

Z2 6 5 7 5

Z3 7 5 6 5

Z4 2 4 7 4

Z5 8 3 1 2

Was ist hier los?

S1 S2 S3 S4

Z1 2 4 9 3

Z2 6 5 7 5

Z3 7 5 6 5

Z4 2 4 7 4

Z5 8 3 1 2

► Z2 und Z3 und S2 und S4 sind Sattelpunktstrategien

► Alle Kombinationen dieser Strategien ergebeneinen Sattelpunkt (vergleiche dagegen Chicken!)

► Alle Sattelpunkte haben den gleichen Wert.

► Sattelpunktstrategien sind austauschbar (d.h. jede Kombination der Strategien ergibt einen Sattelpunkt).

► Alle Sattelpunkte haben den gleichen Wert.

Die Schlacht in der Bismarcksee im Süd-Pazifik 1943

►General Imamura (Japan) hatte Befehl, Truppen durch die Bismarcksee nach Neuguinea zu transportieren.► General Kenneys (USA) Ziel war es, die Schiffe durch Bombardierung aus der Luft zu zerstören.► Es gibt zwei Routen durch die Bismarcksee nach Neuguinea: Eine kürzere Nordroute und eine längere Südroute.► Dirigieren Imamura die Schiffe und Kenney die Bomber zu verschiedenen Routen, können die Flugzeuge nur mit Verzögerung zur anderen Route wechseln. Die Bombardierung ist weniger wirkungsvoll.

Bismarcksee

Nord SüdNord 2 2Süd 1 3

Die Schlacht in der Bismarcksee im Süd-Pazifik 1943

Imamura

Kenney

Nach Rasmussen (2005)

Nord SüdNord 2 2Süd 1 3

Die Schlacht in der Bismarcksee im Süd-Pazifik 1943

Imamura

Kenney

Nach Rasmussen (2005)

Imamura hat eine „schwach“ dominante Strategie.

Nord SüdNord 2 2Süd 1 3

Die Schlacht in der Bismarcksee im Süd-Pazifik 1943

Imamura

Kenney

Nach Rasmussen (2005)

Nord/Nord ist das Ergebnis, das 1943 eingetreten ist.„2890 Soldaten und Seeleute“ starben (Wikipedia).

Wikipedia Commons

4. Ist hier ein Sattelpunkt?

S1 S2Z1 2 3Z2 4 1

4.

S1 S2Z1 2 3Z2 4 1

Weder dominante Strategie noch Sattelpunkt. Was nun?

4.

S1 S2Z1 2 3Z2 4 1

Weder dominante Strategie noch Sattelpunkt. Was nun?

► Gemischte Strategie

z = (p1, p2) = (p1, 1-p1)s = (q1, q2) = (q1, 1-q1)

S1 S2Z1 2 3Z2 4 1

Gemischte Strategie Zeile: z = (p1, p2)

Gemischte Strategie Spalte: s = (q1, q2).

Erwartungswert der Auszahlung:

E = 2p1q1+3p1q2+4 p2q1+1p2q2

wobei Spalte -E erhält.

Rationale Wahl gemischter Strategien? Welche Strategie werden rationale Spieler wählen?

Die Lösung z*, s* hat folgende Eigenschaft: Wenn beide Spieler z*, s* wählen, hat keiner der beiden Spieler einen Anreiz, einseitig auf eine andere Strategie umzusteigen.

p1 und q1 wird so gewählt, dass dieses Kriterium erfüllt wird.

Zeile wählt p1* so, dass Spalte indifferent ist zwischen S1 und S2. Spalte wählt q1* so, dass Zeile indifferent ist zwischen Z1 und Z2.

Zeile: 2p1+4(1-p1) = 3p1+1(1-p1)

Spalte: 2q1+3(1-q1) = 4q1+1(1-q1)

Lösung: p1* = 0,75, q1* = 0,50.

oder: z* = (0,75; 0,25), s* = (0,50; 0,50).

S1 S2Z1 2 3Z2 4 1

Voraussetzung:Die Zahlen in der Matrix sind nicht Ränge,sondern kardinale Nutzenmessungen

Erwartungswert:E = 2p1q1+3p1q2+4 p2q1+1p2q2

E = 2 · 0,75 · 0,50 + 3 · 0,75 · 0,50 + 4 · 0,25 · 0,50+ 0,25 · 0,50 = 2,5

Das Gleichgewicht ist nicht strikt. Wenn ein Spieler einseitig abweicht, gewinnt er nicht, aber er verliert auch nicht.

“Matching Pennies”

Wappen Rechts

Wappen 1 -1

Kopf -1 1

Spieler 2

Spieler 1

“Matching Pennies”

Wappen Rechts

Wappen 1 -1

Kopf -1 1

Spieler 2

Spieler 1

Spieler 1 (Zeile): 1 p1 + (-1) p2 = (-1) p1 + 1 p2 mit p1 = 1 – p2►p1 = p2 = ½. Entsprechend für Spieler 2.

Torwart und Elfmeterschütze: Links oder rechts? (siehe Vorlesung 1)

Links Rechts

Links 1 -1

Rechts -1 1

Elfmeterschütze

Torwart

Der unberechenbare Torwartbeim Elfmeter

• Optimale Strategie: Den Ball in die rechte oder in die linke Ecke schiessen, Torwart nach links oder rechts mit jeweils p = 0,5. Gleiches für „matching pennies“.

Elfmeter in der dt. Bundesliga

Links Rechts

Links 202 (23%) 220 (25%)

Rechts 225 (26%) 231 (26%)

Elfmeterschütze

Torwart

878 Elfmeter aus der Spielsaison 92/93 bis 03/04. Nach Berger und Hammer (2007).

Daten auf aggregierter Ebene konsistentMit spieltheoretischer Rationalität. AberAuf individueller Ebene?

Schweiz gegen Ukraine 2006

Tennis„Serve-and-Return Play“

Vorhand Rückhand

Vorhand -1 1

Rückhand 1 -1

Receiver

Server

Tennis„Serve-and-Return Play“

Vorhand Rückhand

Vorhand 1 -1

Rückhand -1 1

Receiver

Server

Walker, M. and Wooders, John, 2001. Minimax Play at Wimbledon. American Economic Review 91: 1521-1538

• Analyse von 40 Spielsituationen. • Profi-Spieler verwenden näherungsweise gemischte Strategien. • Allerdings wird häufiger alterniert als bei einem Münzwurf.

Fiktives Beispiel: VRVVRVRVRRVRV• Die Abweichung ist aber gering und kann vom Gegner nicht ausgenutzt

werden. (Dixit, A. und Skeath, S., 2004. Games of Strategy. 2. Aufl. New York: Norton.)

D-Day Juni 1944

Calais Normandie

Calais -1 1

Normandie 1 -1

Nazi-Deutschland

Allierte

Einmaliges „Spiel“: Münze werfen? Täuschung? Kann Täuschung überhaupt erfolgreich sein?

D-Day Juni 1944

Calais Normandie

Calais -1 1

Normandie 1 -1

Nazi-Deutschland

Allierte

Falsche Signale an den Gegner: „Doppelagent“ wird denDeutschen als solcher „angepriesen“. Gibt er Information A, tritt nicht-A ein. So glauben die Deutschen, er sei ein Doppelagent der Briten. Nach dieser Phase gibt der Agent die Nachricht weiter: „Die Invasion wird in der Normandie erfolgen“.(Dixit, A. und Nalebuff, B., 1991. Thinking Strategically. New York: Norton; Andrew, C., 1986. Her Majesty‘s Secret Service. New York: Penguin.)

Allgemein für 2x2-Nullsummenspiele

p* = (d-c)/((a+d)-(b+c))

q* = (d-b)/((a+d)-(b+c)

S1 (q) S2 (1-q)

Z1 (p) a b

Z2 (1-p) c d

Methode 1: Ableitung nach „Indifferenztheorem“

Allgemein für 2x2-Nullsummenspiele

p* = (d-c)/((a+d)-(b+c))

q* = (d-b)/((a+d)-(b+c)

S1 (q) S2 (1-q)

Z1 (p) a b

Z2 (1-p) c d

Methode 2: Ableitung mittels Erwartungswert E:(EZ ist Erwartungswert Zeile, ES ist Erwartungswert Spalte)

EZ = pqa + p(1-q)b + (1-p)qc + (1-p)(1-q)ddEZ/dp = 0 ► q*

ES = -EZdES/dq = 0 ► p*

Stein Schere PapierStein 0 1 -1

Schere -1 0 1

Papier 1 -1 0

Stein Schere PapierStein 0 1 -1

Schere -1 0 1

Papier 1 -1 0

„Rock-Strategie“: Payoff = -1

Stein Schere PapierStein 0 1 -1

Schere -1 0 1

Papier 1 -1 0

Gemischte Strategie: (1/3, 1/3, 1/3)

Erwartungswert: 0

„The Final Problem“: Sherlock Holmes und Professor Moriarty

Canterbury DoverCanterbury - 100 80

Dover 100 - 100

Holmes’ Strategie: z* = (0,53; 0,47).

Moriartys Strategie: s* = (0,47; 0,53).

Das Beispiel (mit anderen Zahlen) ist von Oskar Morgenstern (1928). John von Neumann und Oskar Morgenstern, 1944: Theory of Games and Economic Behavior. Princeton, Princeton University Press: 176-178.

C (q)

D (1-q)

C (p)

3, 3 2, 4

D(1-p)

4, 2 1, 1

Gemischte Strategienim Chickenspiel.Das dritte Gleichgewicht

3p + 2(1-p) = 4p + 1(1-p)

3q + 2(1-q) = 4q + 1(1-q)

p* = 0,5; q* = 0,5 und E* = 0,25 (3 + 2 + 4 + 1) = 2,5Symmetrisch, aber nicht Pareto-optimal. Frage: Rationalität im Chickenspiel?

Achtung: Dies ist kein Nullsummenspiel. Zeiles Berechnung muss die Auszahlungen von Spalte in seiner „Indifferenzgleichung“aufführen. Deshalb 3 und 2 sowie 4 und 1, denn Spaltes Auszahlungen sind nun nicht mehr (-1) mal Zeile. Gleiches gilt für Spalte.

OX

„Tic-Tac-Toe“

Anzahl der Strategienbeim erstenZug deszweiten Spielers?

Hat das Spiel einenSattelpunkt?

Einige Theoreme

1. Zermelo (1913)

Jedes Nullsummenspiel mit endlicher Anzahl von Strategien und perfekter Information hat

mindestens einen Sattelpunkt.

(Zermelo, E., 1913: Über eine Anwendung der Mengenlehre auf die Theorie des Schachspiels. In: Proceedings of the

Fifth International Congress of Mathematicians.)

z.B. Schach, Mühle, Dame, „Tic-tac-toe“ etc.

2. John von Neumann (1928)

Minimax-Theorem. Jedes Nullsummenspiel mit endlicher Anzahl Strategien

hat ein Gleichgewicht in reinen oder gemischten Strategien

(John von Neumann, 1928: Theorie der Gesellschaftsspiele)

Anmerkung: Ein Nullsummenspiel mit einem Sattelpunkt ist ein Spezialfall mit einer reinen Gleichgewichtsstrategie. Eine reine

Strategie ist ein Spezialfall einer gemischten Strategie mit p = 1.

3. John F. Nash (1950, 1951)

Jedes endliche Spiel (= Spiel mit endlicher Zahl von Spielern und endlicher Anzahl von Strategien) hat

mindestens ein Gleichgewicht in reinen oder gemischten Strategien.

Nash, John F. (1950): Equilibrium points in n-person games. Proceedings of the National Academy of Sciences, USA, 36: 48-49.

Nash, John F. (1951): Non-cooperative games. Annals of Mathematics 54: 286-295.

Beweisskizze in Luce, R. D. und Raiffa, H., 1957. Games and Decisions.New York: Wiley.Originaltexte Zermelo, von Neumann und Nash zum Download hier:http://www.socio.ethz.ch/publications/spieltheorie

• Nullsummenspiel (bzw. Konstantsummenspiel)• Sattelpunkt, Eindeutigkeit der Lösung• Nullsummenspiele ohne Sattelpunkt• Gemischte Strategie• Nash-Gleichgewicht in gemischten Strategien• Berechnung des Nash-Gleichgewichts in

gemischten Strategien• Theorem von Zermelo• Minimax-Theorem von John von Neumann• Theorem von Nash• Beispiele: Matching Pennies u.a.

Historisches & Biographisches zur Spieltheorie:

Poundstone, William, 1992: Prisoner's Dilemma. John von Neumann, Game Theory, and the Puzzle of the Bomb. New York: Doubleday.

In einer Grafik auf S. 64 in von Neumann und Morgenstern (1947) findet man einen Elefanten. Warum versteckt sich das Tier in der Abbildung? Die Antwort findet man im Nachwort von Oskar Morgenstern zur Neuauflage der „Theory of Games and Economic Behavior“.

Warum erfand John von Neuman die Spieltheorie?

Warum hat John von Neumann die Spieltheorie entwickelt?

Warum hat John von Neumann die Spieltheorie entwickelt?

1. Er war begeisterter Poker-Spieler und wollte Poker auf eine rationale Grundlage stellen.

Warum hat John von Neumann die Spieltheorie entwickelt?

1. Er war begeisterter Poker-Spieler und wollte Poker auf eine rationale Grundlage stellen.

2. Er wollte „Kontroversen“ mit seiner Frau „rational“ lösen.

Warum hat John von Neumann die Spieltheorie entwickelt?

1. Er war begeisterter Poker-Spieler und wollte Poker auf eine rationale Grundlage stellen.

2. Er wollte „Kontroversen“ mit seiner Frau „rational“ lösen.

3. Frau von Neumann soll gesagt haben, sie interessiere sich nur für Spieltheorie, wenn darin ein Elefant vorkäme.

John von Neumann und Oskar Morgenstern, 1947: Theory of Games and Economic Behavior. Princeton, Princeton University Press: 64 (2. Aufl.)