40
Algorithmic Game Theory, Chapter 2 The Complexity of Finding Nash Equilibria 秋秋 秋秋 (B4) 2010/10/22, 秋秋秋秋秋 秋秋 秋秋秋 1

Algorithmic Game Theory, Chapter 2 The Complexity of Finding Nash Equilibria

Embed Size (px)

DESCRIPTION

2010/10/22, 今井研究室 輪読 冬学期. Algorithmic Game Theory, Chapter 2 The Complexity of Finding Nash Equilibria. 秋葉 拓哉 (B4). 内容 (1/2). Introduction 計算量を考える意味 ,組合せ的側面 Is the Nash Equilibrium Problem NP-Complete? NP 完全ではないこと The Lemke- Howson Algorithm ★ ナッシュ均衡を求めるアルゴリズム The Class PPAD - PowerPoint PPT Presentation

Citation preview

Page 1: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

Algorithmic Game Theory, Chapter 2

The Complexity of FindingNash Equilibria

秋葉 拓哉 (B4)

2010/10/22, 今井研究室 輪読 冬学期

1

Page 2: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

内容 (1/2)

1. Introduction– 計算量を考える意味,組合せ的側面

2. Is the Nash Equilibrium Problem NP-Complete?– NP 完全ではないこと

3. The Lemke-Howson Algorithm ★– ナッシュ均衡を求めるアルゴリズム

4. The Class PPAD– 問題 Nash が属する計算量クラス

2

Page 3: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

内容 (2/2)

5. Succinct Representations of Games– ゲームを入力とする際の入力長に関する考察

6. The Reduction– PPAD 完全,問題 Brower から Nash への帰着

7. Correlated Equilibria ★– 第三者による recommendation と均衡

★ が付いているものは他に比べて多く話す項目

3

Page 4: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

2.1 INTRODUCTION計算量を考える意味,組合せ的側面

4

Page 5: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

計算量を考える意味

全ての有限ゲームは mixed Nash equibrium を持つ

では,それは簡単に計算できるのか?(先週 LP で解けたのは two-player zero-sum game のみ)

• 経済との関連– “If your laptop cannot find it, neither can the market” (Kamal Jain)– 効率的に計算できない ≒ あまり自然な帰結ではないかもしれない

5

Page 6: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

Best responses & Supports

用語• pure strategy: 1 つの決定的な戦略• mixed strategy: 確率分布に従って戦略を決定する

(pure strategy mixed strategy)⊂

• best response: payoff の期待値が最良となる strategy   ( 相手の strategy は given)• support: ある mixed strategy で確率が正となっている pure strategy

自分の

戦略

相手の戦略

数字は payoff

相手の mixed strategy が (0, 1/3, 2/3)

自分の best response も (0, 1/3, 2/3)

Support は strategy 2, 3 の 2 つ6

Page 7: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

組合せ的問題であること (1/2)以降,問題 Nash について考えてゆく.

Best response と support に関わる定理

略証 背理法による. best response でない strategy が含まれていたら,それを取り除いた方がより良くなるので矛盾.

定義 Nash ( 問題 )ゲームが strategic form で与えられた時,ナッシュ均衡を 1 つ求めよ.

定理 2.1 ある mixed strategy が best response⇔ その strategy の support が全て best response

これは pure strategy

7

Page 8: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

組合せ的問題であること (2/2)

support が得られれば,連立方程式が立つ–特に 2-player の場合は 線形

組合せ的であると言える

ナッシュ均衡を探すこと≒

正しい support を探すこと

8

Page 9: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

2.2 IS THE NASH EQUILIBRIUM PROBLEM NP-COMPLETE?

NP 完全ではないこと

9

Page 10: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

問題 Nash は NP 完全ではない

• 問題 Nash は,全てのゲームはナッシュ均衡を持つという点で特殊

• Nash が NP 完全であることを仮定すると, NP=coNP となってしまう(証明略)

• よって, Nash は NP 完全ではないと考えられる

10

Page 11: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

Brower’s fixpoint theorem

• ナッシュ均衡の存在証明はこの定理への帰着

• Brower’s fixpoint を探すことは,やはり難しい問題として知られている

• 実はさらに, Brower’s fixpoint を探すことを Nash へ帰着できる!(後述)

Brower’s fixpoint theorem任意の連続関数 f : Un → Un (Un : n 次元単位球 ) は不動点を持つ(不動点: f(x) = x なる点)

11

Page 12: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

2.3 THE LEMKE-HOWSON ALGORITHMナッシュ均衡を求めるアルゴリズム

12

Page 13: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

Lemke-Howson Algorithm

• 2-player game の Nash 均衡を求める最良の組合せ的アルゴリズムの 1 つ

• support の組合せ的構造を用いる

• simplex pivoting を繰り返す

13

Page 14: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

Symmetric Game への帰着 (1/2)

定義 Symmetric Nash ( 問題 )Symmetric game が与えられたとき, symmetric Nash equilibrium を 1 つ求めよ

用語• symmetric game: 行列 A, B で表される bimatrix game で A = BT

(つまり,相手と自分は全くおなじ状況)

• symmetric Nash equilibrium: 2 人がおなじ mixed strategy での Nash equilibrium

14

Page 15: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

Symmetric Game への帰着 (2/2)

略証 行列 A, B で表される 2-player game について,

で表される symmetric game を考え,その symmetric Nash equilibrium を(x, y) とおく.( A の行数を m としたとき, x は最初の m 要素とする)

このとき, x は y への best response , y は x への best response .

定理 2.4 Nash から Symmetric Nash への polynomial reduction が存在

よって,以下では Symmetric Nash を考える

15

Page 16: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

凸多面体 (1/3)

n × n 行列 A で表現される symmetric 2-player game – WLOG. A の要素はすべて非負,全て 0 の行なし

以下の凸多面体 P を考える

性質 :空でない ,有界

以下,非退化 (nondegenerate) を仮定

Az 1≦ , z 0≧

(2n 個の不等式 )

16

Page 17: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

凸多面体 (2/3)

Az 1≦ , z 0≧

用語• represented: 以下の 1 つ以上が満たされるとき,戦略 i は represented• zi = 0• Aiz = 1

• represented twice: 両方が満たされている時

17

Page 18: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

凸多面体 (3/3)

頂点 z (≠ 0) において全ての戦略が represented のとき,

なる x は symmetric Nash equilibrium である.

略証 Aiz = 1 の戦略 i は best strategy ,全ての support は best strategy

Az 1≦ , z 0≧

よって,全ての戦略が represented となる(0 以外の ) 頂点を探したい!

(和が 1 になるように正規化)

18

Page 19: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

Pivoting (1/5)

• degenerate の仮定より,各頂点は n 個の隣接点を持つ

• 隣接点への移動は,以下と同じ– 1 つの tight な不等式を relax し (tight ではなくし ) ,– 別のある 1 つの tight でない 不等式を tight にする

• 戦略 1 以外の全ての戦略が represented となっている頂点集合 V を考える– 0 は全ての戦略が represented , 0 ∈ V のため空でない

• V の中でのパス <v0, v1, v2 , …> を考える

19

Page 20: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

Pivoting (2/5)

アルゴリズム Lemke-Howson

• 初期化– 頂点 0 からスタート, v0 = 0

– v0 から,第 1 要素のみ非ゼロの隣接頂点 v1 に移動• ここでは,戦略 1 以外の戦略は全て represented• よって, v1 ∈ V

(次スライドへ続く)

20

Page 21: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

Pivoting (3/5)

アルゴリズム Lemke-Howson

( 前スライドの続き )

• i = 1, 2, … で繰り返す– 全ての戦略が represented ⇒ 完了!– そうでないなら,ある戦略 j (j > 1) が represented twice のはず

• n 個の tight な不等式, n-1 個の represented な戦略,鳩の巣原理• vij = 0 かつ Ajvi = 1

– j に関する 2 つの不等式の片方を relax して vi+1 とする• 2 つの可能性のうち片方は vi-1 なので,そうでない方を選ぶ

21

Page 22: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

Pivoting (4/5)

• 頂点に書いてあるのは represented な戦略の集合• 肩に 2 と書いてあるものは represented twice

細かいこと

この図の例では,戦略 1 の代わりに戦略 2 がrepresented でないことを許している.

22

Page 23: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

Lemke-Howson が終了すること:– ループは有り得ない

• V の点で V に含まれる隣接点は 2 つ以下– 0 にも戻らない

• 0 の V に含まれる隣接点は 1 つ

これは, two-player, nondegenerate game に mixed Nash equilibrium が存在することの証明でもある

残念ながら, Lemke-Howson は効率的とは言えない– 頂点の個数が指数的に増加

Pivoting (5/5)

有り得ない状況

23

Page 24: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

2.4 THE CLASS PPAD 問題 Nash が属する計算量クラス

24

Page 25: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

クラス PPAD

• Lemke-Howson は path のようなグラフの上を辿る– 各頂点,入次数・出次数 1 以下– 1 つの source が既知 (standard source)– 頂点数が指数的に増加– 別の source あるいは sink が解– (他にも条件…)

• 同様の状況となる問題が知られている– Approximate Brouwer fixpoint– Ham Sandwitch

• n 次元上の 2n 個の点が与えられ,半分に分割する超平面を求める

• これらの問題の計算量クラスを PPAD と呼ぶ– Polynomial Parity Arguments on Directed graphs

25

Page 26: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

クラス PPAD-Complete

• PPAD-Complete となる問題が存在する– 全ての PPAD の問題を帰着可能

• Brower, Nash は PPAD-Complete– Section 2.6 で示されること

26

Page 27: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

2.5 SUCCINCT REPRESENTATIONS OF GAMES

ゲームを入力とする際の入力長に関する考察

27

Page 28: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

問題 Nash の入力長問題 Nash ではゲームが入力だが,ゲームの記述の長さはどうなる

のか?

全ての組み合わせに関する payoff を与える方法

• 2-player の場合– 戦略の個数が m と n なら, 2mn 個の数

• n-player の場合– 戦略の個数が s なら, nsn 個の数 (とても大きい!)– 自明なアルゴリズムが n に関して多項式になる…

• 全ての support の組み合わせを試せばよい, (2s)n 通り

大きい人数の問題を考える際,これは好ましくない

28

Page 29: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

Succinctly Representable なゲーム

入力としてより簡潔に表現できるゲーム

• Graphical Games– プレーヤの関係のグラフが存在– 隣接するプレーヤの戦略のみが自分の payoff に影響

• その他– Sparse Games: nsn 個の paoyff の一部だけが非ゼロ– Symmetric Games: プレーヤは全て同じ– Anonymous Games: 他のプレーヤは全て同じ

• それ以外にもいっぱいあります

以降は Succinctly Representable なゲームを扱う

29

Page 30: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

2.6 THE REDUCTIONPPAD 完全,問題 Brower から Nash への帰着

30

Page 31: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

証明されること

• 問題 Brower が PPAD-Complete であることは既知– Brower は Brower’s fixpoint を探す問題を離散化した物

• 問題 Brower を問題 Nash に帰着する– Nash が PPAD-Complete であると分かる– ここで Brower は unit cube 上とする

31

Page 32: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

概要

Brower のインスタンスから Graphical Game を作る

• 全てのプレーヤは 0, 1 の 2 つの戦略 のみ– mixed strategy は [0, 1] の 1 つの実数で表せる

• 3 人のプレーヤが cube 上の座標を表す• 残りのプレーヤが Brower の関数をシミュレートし,

不動点でないと均衡が起こらないようにする

証明の詳細は省略

32

Page 33: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

2.7 CORRELATED EQUILIBRIA第三者による recommendation と均衡

33

Page 34: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

ゲーム Chicken (1/3)

下の行列で表される symmetric game

(交差点で,止まるか・進むか)

自分止まる

進む

止まる 進む

相手

34

Page 35: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

ゲーム Chicken (2/3)

Nash equilibrium における戦略の確率分布: 3 通り

確率分布が下のようになるのは自然– 半分の確率でどちらかが進む

しかし,これは Nash equibrium では得られない

35

Page 36: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

ゲーム Chicken (3/3)

この確率分布を得るためには,第三者が必要– 交差点の例では,信号のようなもの

第三者が各プレーヤの戦略を recommendation として指定することを考える

36

Page 37: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

Correlated Equilibrium (1/3)

定義 correlated equilibriumrecommendation の確率分布であって,全プレーヤについて self-enforcing なもの

用語• self-enforcing: 他のプレーヤが従うならば自分も従うのが最良であるような recommendation ( の分布 ) の状況

• 各プレーヤが受け取るのは自分についての recommendation のみ• 全体への recommendation ではない

• 各プレーヤは全体への recommendation の分布は知っている• 期待値的に self-enforcing であればよい

37

Page 38: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

Correlated Equilibrium (2/3)

式で表現 (この式を以降 CE と呼ぶ)プレーヤ i が戦略 j を recommend された状況での条件

• S-i : プレーヤ i を除いた全プレーヤの戦略の組合せ• sj, sj’ : プレーヤ i 以外の戦略を s, プレーヤ i の戦略

を j, j’• us : payoff

• ps : recommendation の確率分布

38

Page 39: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

Correlated Equilibrium (3/3)

ゲーム Chicken での CE の例

CE 不等式は ps に関して線形なので,Correlated Nash equilibrium は LP で求まる!

39

Page 40: Algorithmic Game Theory,  Chapter 2 The Complexity of Finding Nash  Equilibria

Correlated vs Nash普通の mixed Nash equilibrium は, Correlated equilibrium の特殊なケース

– Nash equilibrium Correlated equilibrium⊂

• Mixed Nash equilibrium: 計算困難• Correlated equilibrium: 多項式時間で計算可能

( 3 人以上の場合はその限りではない)

定理 2.5 nondegenerate 2-player game において Nash equilibria は CE 不等式で作られる多面体の頂点

40