15
Ovaj materijal je preuzet iz knjige Finansijska matematika, autora Prof. dr Želimira Branovića Teorija igara Uvod Postoje situacije u realnoj ekonomiji kada postoje suprostavljeni interesi ekonomskih subjekata, kada se dva ili više njih nalaze u konfliktnim odnosima, iz kojih žele da za sebe ostvare što povoljniji rezultat. Zbog toga, recimo, jedna proizvodna firma u postupku definisanja svojih planova prodaje mora voditi računa o mogućim potezima firmi konkurenata koje izlaze na tržište sa istim ili sličnim proizvodima i isto tako žele da ostvare što povoljniji finansijski rezultat (veći profit). Isto tako u domenu poslovnog odlučivanja se mora posvetiti pažnja potencijalnom ponašanju raznih drugih subjekata (banke, potrošači, tržište, državne mere,...). Pri tome, nijedan od ekonomskih subjekata ne može u potpunosti kontrolisati rezultate svoji h odluka, jer i suprostavljene strane odlučuju u uslovima da ne poznaju odluke »protivnika«. Proučavanje teorija i metodologije koje se koriste za analizu i rešavanje konfliktnih situacija u kojima učesnici imaju suprostavljene interese spada u matematičku teoriju igara. Naziv je proistekao iz činjenice da se tipični primeri konfliktnih situacija sreću kod raznih društvenih igara kao što su sportske utakmice, kartaške igre (poker, bridž, i sl.), šah itd. Medjutim, i pored toga što je najveći broj termina koji se koriste u okviru matematičke teorije igara sličan sa terminologijom društvenih igara, ova teorija ima znatno širu primenu, pre svega u samoj matematici, zatim politici, ekonomiji, vojnoj strategiji, itd. Napomenimo , da i pored toga što se elementi teorije igara mogu prepoznati u radovima iz prve polovine XIX veka, ideju opšte teorije igara su izneli 1944. god. John von Neumann i Oskar Morgenstern u svom findamentalnom radu »Teorija igara i ekonomsko ponašanje«. U periodu koji je usledio nijedno područje ekonomske analize i matematičkog modeliranja ekonomskih pojava nije ostvarilo toliku ekspanziju i razvoj kao što je to slučaj sa teorijom igara. Da bi se korišćenjem odgovarajućeg matematičkog modela mogla analizirati konfliktna situacija neophodno je da se se putem uprošćavanja u razmatranje uključe samo najznačajniji faktori koji utiču na mogući ishod konflikta. Igra će onda predstavljati uprošćeni model konflikta koji obuhvata skup pravila ponašanja učesnika igre (igrača), koja opredeljuju njihove moguće poteze kao i potencijalne rezultate njihovog izbora koji se obično predstavljaju funkcijom plaćanja (numerički izraz dobitaka, odnosno gubitaka učesnika igre). Igrači mogu biti pojedinci, grupe pojedinaca, firme, vojne formacije, i sl. i oni nastoje da u igri postignu takvo rešenje koje im obezbeđuje najpovoljniji mogući rezultat. Svaki od igrača unapred poznaje moguće alternative koje mu stoje na raspolaganju tokom igre to su strategije i one obuhvataju ukupnost pravila ponašanja igrača, kao i potencijalne rezultate izbora pojedinih alternativa u svakoj konkretnoj situaciji. Svaka igra se realizuje preko pojedinačnih poteza igrača, pri čemu potez predstavlja izbor moguće alternative od strane igrača. Skup većeg broja poteza je partija. Postoje različite vrste igara, koje se mogu klasifikovati prema broju igrača (najmanje 2), broju strategija, karakteru funkcije plaćanja, međusobnoj povezanosti igrača i sl. Postojanje 3 ili više učesnika igre otvara mogućnost stvaranja tzv. koalicija, odnosno da dva ili više igrača usklađuju svoje interese i saobrazno tome se opredeljuju u izboru strategija. Ukoliko svakom od igrača stoji na raspolaganju konačan broj strategija tada je reč o konačnoj igri, za razliku od beskonačne igre kada broj strategija nije ograničen.

Teorija igara - tfzr.uns.ac.rs

  • Upload
    others

  • View
    13

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Teorija igara - tfzr.uns.ac.rs

Ovaj materijal je preuzet iz knjige Finansijska matematika, autora Prof. dr Želimira Branovića

Teorija igara

Uvod

Postoje situacije u realnoj ekonomiji kada postoje suprostavljeni interesi ekonomskih subjekata, kada se dva ili više njih nalaze u konfliktnim odnosima, iz kojih žele da za sebe ostvare što povoljniji rezultat. Zbog toga, recimo, jedna proizvodna firma u postupku definisanja svojih planova prodaje mora voditi računa o mogućim potezima firmi konkurenata koje izlaze na tržište sa istim ili sličnim proizvodima i isto tako žele da ostvare što povoljniji finansijski rezultat (veći profit). Isto tako u domenu poslovnog odlučivanja se mora posvetiti pažnja potencijalnom ponašanju raznih drugih subjekata (banke, potrošači, tržište, državne mere,...). Pri tome, nijedan od ekonomskih subjekata ne može u potpunosti kontrolisati rezultate svojih odluka, jer i suprostavljene strane odlučuju u uslovima da ne poznaju odluke »protivnika«. Proučavanje teorija i metodologije koje se koriste za analizu i rešavanje konfliktnih situacija u kojima učesnici imaju suprostavljene interese spada u matematičku teoriju igara. Naziv je proistekao iz činjenice da se tipični primeri konfliktnih situacija sreću kod raznih društvenih igara kao što su sportske utakmice, kartaške igre (poker, bridž, i sl.), šah itd. Medjutim, i pored toga što je najveći broj termina koji se koriste u okviru matematičke teorije igara sličan sa terminologijom društvenih igara, ova teorija ima znatno širu primenu, pre svega u samoj matematici, zatim politici, ekonomiji, vojnoj strategiji, itd. Napomenimo , da i pored toga što se elementi teorije igara mogu prepoznati u radovima iz prve polovine XIX veka, ideju opšte teorije igara su izneli 1944. god. John von Neumann i Oskar Morgenstern u svom findamentalnom radu »Teorija igara i ekonomsko ponašanje«. U periodu koji je usledio nijedno područje ekonomske analize i matematičkog modeliranja ekonomskih pojava nije ostvarilo toliku ekspanziju i razvoj kao što je to slučaj sa teorijom igara. Da bi se korišćenjem odgovarajućeg matematičkog modela mogla analizirati konfliktna situacija neophodno je da se se putem uprošćavanja u razmatranje uključe samo najznačajniji faktori koji utiču na mogući ishod konflikta. Igra će onda predstavljati uprošćeni model konflikta koji obuhvata skup pravila ponašanja učesnika igre (igrača), koja opredeljuju njihove moguće poteze kao i potencijalne rezultate njihovog izbora koji se obično predstavljaju funkcijom plaćanja (numerički izraz dobitaka, odnosno gubitaka učesnika igre).

Igrači mogu biti pojedinci, grupe pojedinaca, firme, vojne formacije, i sl. i oni nastoje da u igri postignu takvo rešenje koje im obezbeđuje najpovoljniji mogući rezultat.

Svaki od igrača unapred poznaje moguće alternative koje mu stoje na raspolaganju tokom igre – to su strategije i one obuhvataju ukupnost pravila ponašanja igrača, kao i potencijalne rezultate izbora pojedinih alternativa u svakoj konkretnoj situaciji.

Svaka igra se realizuje preko pojedinačnih poteza igrača, pri čemu potez predstavlja izbor moguće alternative od strane igrača. Skup većeg broja poteza je partija. Postoje različite vrste igara, koje se mogu klasifikovati prema broju igrača (najmanje 2), broju strategija, karakteru funkcije plaćanja, međusobnoj povezanosti igrača i sl. Postojanje 3 ili više učesnika igre otvara mogućnost stvaranja tzv. koalicija, odnosno da dva ili više igrača usklađuju svoje interese i saobrazno tome se opredeljuju u izboru strategija. Ukoliko svakom od igrača stoji na raspolaganju konačan broj strategija tada je reč o konačnoj igri, za razliku od beskonačne igre kada broj strategija nije ograničen.

Page 2: Teorija igara - tfzr.uns.ac.rs

U zavisnosti od funkcije plaćanja igre se dele na igre sa nultom i igre sa nenultom sumom. U prvom slučaju je suma plaćanja jednaka nuli, tj. ukupan dobitak jednog ili više igrača je jednak ukupnom gubitku »poraženih« igrača (recimo igra pokera). U drugom slučaju u igrama gde se obično prepliću odnosi konflikta i kooperacije igrača suma ukupnog plaćanja je različita od nule- recimo u igri lutrije organizator zadržava za sebe deo ukupnog dobitka. U zavisnosti od međusobnog odnosa igrača postoje kooperativne igre (gde igrači formiraju koalicije) i ostale, nekooperativne ili antagonističke. Igre se mogu predstavljati različito. Ako kod igre ne postoji potpuna informisanost igrača o potencijalnim odgovorima protivnika na njihov izbor pojedinih strategija onda se rezultat svih poteza u toku igre obračunava tek na kraju igre, kada se obavi predviđeni broj poteza , odnosno realizuje jedna partija. Ova vrsta igre se zove igra ekstenzivnog (opšteg) oblika i predstavlja se obično preko stabla igre, u kome se ex post predstavljaju odabrani potezi igrača- takva je, recimo, igra pokera. U sitaciji kada postoji puna informisanost o potencijalnim rezultatima odabranih strategija od strane igrača radi se o igri u normalnoj formi i ovde su unapred poznata plaćanja za sve kombinacije odabranih strategija od strane igrača.

1. Proste matrične igre

Posmatrajmo igru dva igrača A i B , sa nultom sumom u normalnoj formi, i to u slučaju

kada svakom igraču stoji na raspolaganju određeni, konačan broj strategija. Neka igrač A

raspolaže sa m strategija A1, A2,...,Am , a igrač B sa n strategija B1,B2,...,Bn . Izboru bilo koje od

strategija igrača A odgovara izbor neke od strategija igrača B. Isto tako pretpostavimo da je igra

determinističkog tipa (nema slučajnosti u izboru strategija) te da izbor svakog para mogućih

strategija oba igrača rezultira dobitkom jednog igrača (igrača A) i gubitkom drugog igrača

(igrača B). Rezultat igre pri izboru para strategija (Ai,Bj ) neka je aij. Ukoliko je aij< 0 to

pokazuje da će igrač A morati da plati igraču B iznos od | aij | novčanih jedinica, što znači da je

“dobitak” za igrača A sada negativan.

Svi potencijalni rezultati različitih kombinacija izbora strategija od strane igrača A i B se

mogu predstaviti u obliku matrice igre, odnosno matrice plaćanja P koja predstavlja tabelarni

zapis funkcije plaćanja u igri dva lica sa nultom sumom:

a11 a12 ... a1n

P = a21 a22 a2n

... ... ...

am1 am2 amn

Za potrebe analize i rešavanja igre matrica plaćanja se često prikazuje u vidu

odgovarajuće tabele:

B B1 B2 ... Bn

A

A1 a11 a12 ... a1n

A2 a21 a22 ... a2n

... ... ... ...

Am am1 am2 ... amn

Page 3: Teorija igara - tfzr.uns.ac.rs

Ova se igra realizuje u uslovima kada igrači prilikom izbora bilo koje od strategija ne

znaju koju će strategiju izabrati protivnik. Igrač A želi da izabere strategiju koja će mu doneti

maksimalno mogući dobitak. Pri tome, svaki od igrača podrazumeva racionalno ponašanje svog

protivnika, tj. njegovo stremljenje da u uslovima igre definisanim datom matricom plaćanja

ostvari za sebe najpovoljniji rezultat.

Svaki od igrača, ne znajući izbor protivnika, vrši prethodnu analizu mogućih dobitaka,

odnosno gubitaka. Igrač A, zbog toga, za svaku čistu strategiju Ai (i=1,2,...,m) određuje

minimalan dobitak koji će ostvariti bez obzira na izbor strategije igrača B, tj. opredeljuje

minimalan elemenat svake od vrsta matrice plaćanja u obliku

αi = min aij i = 1,2,...,m j

Između svih ovako određenih minimalnih dobitaka za pojedine strategije, igrač A bira

maksimalni element u obliku

α = max ai = max min aij

i i j

koji predstavlja tzv. maksimin vrednost, odnosno donju granicu vrednosti igre, koja pokazuje

garantovani dobitak koji će igrač A ostvariti. Ova donja granica određuje i optimalnu strategiju

za igrača A , čijim izborom dobitak od α jedinica za njega ne može biti umanjen bez obzira na

izbor strategije od strane njegovog protivnika (igrača B).

Slična analiza izbora pojedinih strategija se može izvršiti i za igrača B, koji nastoji da odabere

takve strategije koje mu obezbeđuju ninimalizaciju gubitaka. Zbog toga on, za svaku od svojih

strategija koje su predstavljene kolonama matrice plaćanja, izračunava maksimalne gubitke, tj.

određuje vrednosti

βj = max aij j = 1,2,...,n

i

Minimalan od ovako određenih elemenata, odnosno vrednost:

β = min βj = min max aij

j

j i

predstavlja gornju granicu vrednosti igre, odnosno minimaks vrednost za igrača B. Kao

racionalan učesnik u igri, on će ovu vrednost smatrati optimalnom strategijom, jer mu ona

obezbeđuje poziciju u kojoj nikakav izbor strategije od strane igrača A ne može povećati njegov

gubitak iznad vrednosti β.

Izborom optimalnih strategija od strane oba igrača oni obezbeđuju najpovoljniji rezultat i

opredeljuju se za način igre u kome će rizik usled različitog broja strategija od strane protivnika

svesti na minimum.

Primer 1. Neka je igra predstavljena sledećom matricom plaćanja:

2 5 4 0

-3 2 6 1

P = 7 4 3 8

4 2 1 5

Na osnovu sledeće tabele:

Page 4: Teorija igara - tfzr.uns.ac.rs

B B1 B2 B3 B4 αi

A

A1 2 5 -4 0 -4

A2 -3 2 6 1 -3

A3 7 4 3 8 3

A4 4 2 1 5 1

βj 7 5 6 8

sledi da igrač A treba da odabere svoju treću strategiju kao optimalnu, jer mu ona obezbeđuje α

= max αi = max min aij = 3, dok je za drugog igrača optimalna njegova druga strategija za koju

se ostvaruje gornja granica vrednosti igre β = min βj = min max aij = 5.

Da izračunata vrednost minimalnih dobitaka za igrača A nije nikada veća od vrednosti

maksimalnih gubitaka za igrača B (kao što je to u ovom primeru) pokazuje i sledeće tvrđenje:

U matričnoj igri gornja granica vrednosti igre je uvek veća ili jednaka od donje

granice vrednosti igre, tj. β≥α .

Tačnost ovog tvrđenja sledi iz činjenice da je βj= max aij ≥ aij za svako

i

j = 1,2,..., n, dok je αi = min aij ≤ aij za i = 1,2,...,m.

j

Iz ove dve nejednakosti sledi da je βj = max aij ≥ aij ≥ min aij = αi

i j

odakle je βj ≥ αi . Kako navedeno važi za svako i i j može se zaključiti da je i β ≥α .

Ukoliko je u matričnoj igri donja granica vrednosti igre jednaka gornjoj granici, tj. α = β ,

takva igra je prosta matrična igra i zove se igra sa sedlastom tačkom , ili prosto igra sa

sedlom. Sedlasta tačka se nalazi na preseku optimalnih strategija igrača, i vrednost elementa

koji u matrici plaćanja odgovara sedlastoj tački pokazuje vrednost igre, odnosno dobitak za

igrača A i gubitak za igrača B koji iznosi v = α =β . Rešavanje proste matrične igre otuda

predstavlja postupak određivanja optimalnih čistih strategija igrača A i B, sedlaste tačke i

vrednosti igre.

Primer 2.

Neka je zadata sledeća matrica plaćanja:

4 5 3 4 6

P = 8 7 1 0 -2

-5 10 -1 -4 2

Iz sledeće tabele:

B B1 B2 B3 B4 B5 αi

A

A1 4 5 3 4 6 3 A2 8 7 1 0 -2 -2

A3 -5 10 -1 -4 2 -4

βj 8 10 3 4 6

se vidi da je za igrača A optimalno da igra svoju prvu strategiju, dok je za igrača B optimalna

njegova treća strategija. U ovom su slučaju maksimin i minimaks vrednosti izjednačene tako da

je vrednost igre određena vrednošću sedlaste tačke (1,3), tj. v = α = β = 3. Ovakvo rešenje igre,

Page 5: Teorija igara - tfzr.uns.ac.rs

tj. vrednost igre , pokazuje prosečan dobitak koji će u svakom od poteza ostvariti igrač A,

odnosno prosečan gubitak koji će ostvariti igrač B.

Zadaci

1.) Dva igrača A i B dele tržište istorodnih proizvoda pri čemu su u konkurentnim odnosima.

Tržišni uslovi diktiraju da su igrači (firme) u konfliktnoj situaciji.

Prvi igrač raspolaže sa dve strategije, dok srugi igrač ima na raspolaganju tri strategije. Svaki

od igrača teži da ostvari što bolje poslovne rezultate, koji, sa svoje strane, zavise od izabranih

strategija savakog od igrača. Mogući poslovni efekti zadati su matricom igre datom sledećom

tabelom:

B B1 B2 B3

A

A1 25 40 10

A2 30 35 20

Odrediti vrednost igre i optimalne strategije igrača.

Rešenje. Prvi igrač, nezavisno od izabrane strategije protivnika, primenom maksimin principa

obezbeđuje siguran rezultat igre, tj. donju granicu vrednosti igre α = max min aij = max ( 10,

20) = 20.

Igrač B, ne znajući koju će strategiju izabrati igrač A, primenom minimaks principa

obezbeđuje sebi povoljan rezultat igre, tj. određuje gornju granicu vrednosti igre β = min max aij

= min ( 30, 40, 20 ) = 20.

Kako je donja granica vrednosti igre jednaka gornjoj granici vrednosti igre može se reći

da zadata matrična igra ima sedlastu tačku (ravnotežni ishod) u čistim strategijama A2 i B3 , tj.

optimalna strategija za igrača A je čista strategija A2, dok je optimalna strategija za igrača B

čista strategija B3. Vrednost igre je α =β = v = 20 , pri čemu je to dobitak za igrača A, a gubitak

za igrača B. Svako odstupanje od optimalnih strategija dovodi do manjeg dobitka za igrača A i

većeg gubitka za igrača B.

2.) Pod uslovima iz prethodnog zadatka odrediti vrednost igre i optimalne strategije ako je data

matrica plaćanja

55 70 40

60 65 50

Odgovor. Vrednost igre je v = 20 i postiže se pri čistim strategijama A2, za igrača A i B3 za

igrača B.

3.) Dve firme A i B dele tržište konditorskih proizvoda što stvara konfliktnu situaciju. Obe firme

preduzimaju strategije kako bi ostvarile što bolje proizvodne efekte. Strategije firmi i efekti igre

u zavisnosti od preduzetih strategija dati su sledećom tabelom:

B B1 B2 B3

A

A1 6 4 -10

A2 -8 6 4

A3 6 8 6

Page 6: Teorija igara - tfzr.uns.ac.rs

Za firmu A je je gornja vrednost igre α = max (-10, -8, 6 ) = 6 pri izabranoj strategiji A3.

Za firmu B vrednost igre β = min ( 6,8,6 ) = 6 koja se ostvaruje uz dve čiste strategije B1 i B3.

Može se reći da postoje dve sedlaste tačke (u kojima je vrednost matrične igre ista, tj. 6 novčanih

jedinica) i to (A3 , B1) i (A3 , B3) .

4.) U matričnoj igri igrač A ima na raspolaganju tri strategije, dok igrač B raspolaže dvema

strategijama. Efekti igre, u zavisnosti od izabranih strategija dati su u tabeli:

B B1 B2

A

A1 -25 -20

A2 5 -10

A3 15 -15

Odrediti vrednost igre i optimalne strategije igrača.

Odgovor. Igrač A od minimalnih vrednosti bira maksimalnu, tj.

α = max ( -25, -10, -15 ) = -10 (gubitak);

a igrač B od maksimalnih vrednosti bira minimalnu, tj.

β = min ( 15, -10 ) = -10 (dobitak).

Kako je α = β = v = -10 to znači da igra ima ravnotežnu (sedlastu ) tačku. Optimalna čista

strategija za igrača A je strategija A2, jer uz pomoć nje on ostvaruje minimalni gubitak od 10

novčanih jedinica. Za igrača B je optimalna čista strategija B2, jer pomoću nje ostvaruje siguran

dobitak od 10 jedinica.

2. Matrične igre sa mešovitim strategijama

Ako u matričnoj igri postoji sedlasta tačka, vrednost igre je izvesna i ona odgovara

vrednosti sedlaste tačke. Tada svaki od igrača igra svoju optimalnu strategiju kao čistu- radi se,

dakle, o prostoj matričnoj igri. Međutim, ako je donja granica vrednosti igre manja od gornje

granice vrednosti igre, tj. α < β , tada se postavlja pitanje kako odrediti rešenje igre.

Racionalno se ponašajući, svaki od igrača , ne znajući kakvu će strategiju odabrati protivnik,

bira u nizu poteza ne jednu već više strategija koje su mu na raspolaganju. Lako se može videti iz

analize igre bez sedlaste tačke da igrač A naizmeničnim izborom različitih strategija može

ostvariti dobitak koji je veći od maksimin elementa, a isto tako i igrač B može, izborom različitih

strategija u uzastopnim potezima, umanjiti svoj gubitak u odnosu na njegovu minimaks vrednost.

Opredeljivanje za izbor različitih strategija od strane igrača realizuje se slučajnim izborom, ali sa

određenim verovatnoćama, pri čemu jedan slučajni izbor različitih strategija predstavlja tzv.

mešovitu strategiju, tj. kombinaciju raznih verovatnoća sa kojima će igrači u uzastopnom nizu

poteza birati pojedine strategije.

Ako je reč o igri sa dva lica sa nultom sumom definisanoj matricom plaćanja tipa mxn u kojoj

igrač A može izabrati bilo koju od m strategija, onda mešovita strategija igrača A može se

Page 7: Teorija igara - tfzr.uns.ac.rs

predstaviti u vidu vektora x = (x1,..., xm), čije komponente označavaju verovatnoće sa kojima

igrač bira pojedine strategije. Kako je reč o verovatnoćama, to mora biti

xi ≥ 0 , i = 1,2,...,m ,

m

i 1

xi = 1.

Isto tako, mešovitu strategiju igrača B moguće je zapisati u obliku vektora y = (y1,y2,..., yn),

čije komponente pokazuju verovatnoće s kojima taj igrač bira pojedine od svojih n strategija,

pri čemu je

yj ≥ 0 j = 1,2,..., n ,

n

i 1

yj = 1.

Igranje samo čistih strategija je specijalan slučaj mešovitih strategija i tada su

verovatnoće igranja svih ostalih (izuzev čistih) strategija jednake nuli, dok je za čistu strategiju

verovatnoća jednaka 1. Strategije igrača za koje su verovatnoće xi i yj veće od nule

predstavljaju aktivne strategije.

Ako igrači izaberu redom strategije Ai i Bj čije su verovatnoće xi i yj , tada se

verovatnoća istovremenog izbora te dve strategije, odnosno izbor para (Ai,Bj) određuje kao

proizvod verovatnoća xi i yj . Potencijalni dobitak za igrača A, odnosno gubitak za igrača B, pri

uzastopnim izborima koje određuju mešovite strategije, je slučajna veličina koja zavisi od

vektora x i y, kao i od matrice plaćanja. Vrednost igre se onda može predstaviti u vidu

očekivane (matematičkog očekivanja) srednje vrednosti u obliku

v = f(x , y) = ∑∑ aij xi yj ; i = 1,...m ; j = 1,...,n.

i j

ili u matričnom obliku

v = f(x , y) = x P yT

gde f(x , y) predstavlja funkciju plaćanja, x vektor mešovite strategije igrača A, yT transponat

vektora mešovite strategije igrača B, dok je P matrica plaćanja.

Primer 1. Neka su dati matrica plaćanja i mešovite strategije u obliku:

2 4 5 0

P = -2 6 -3 5 x = (0,45 0,20 0,35) ;

1 -4 7 3 y = (0,30 0,20 0,15 0,35)

To znači da igrač A od ukupnog broja poteza u 45 % slučajeva igra svoju prvu

strategiju, u 20 % slučajeva drugu, ..., ili da igrač B koristi svoje 4 strategije tako što u 30 %

slučajeva bira prvu od njih,..., u 35 % slučajeva četvrtu po redu.

Page 8: Teorija igara - tfzr.uns.ac.rs

Vrednost igre je

2 4 5 0 0,30

v = x P xT

= ( 0,45 0,20 0,35) -2 6 -3 5 0,20

1 -4 7 3 0,15

0,35

= (0,85 1,60 4,10 2,05) 0,30

0,20

0,15 = 1,9075

0,35

Dobijeni rezultat znači da će u svakom od poteza igrač A dobijati prosečno po 1,9075

novčanih jedinica, dok će toliko isto igrač B gubiti.

3. Rešavanje mešovitih matričnih igara

Na osnovu teoreme, koju ne navodimo, poznato je da svaka konačna igra ima jedno rešenje

na osnovu koga mogu biti opredeljene mešovite strategije. Do rešenja se, slično kao kod prostih

matričnih igara, dolazi na osnovu namere svakog od igrača da ostvare takvu mešovitu strategiju

koja će im obezbediti optimizaciju igre, tj. ostvarivanje najboljeg mogućeg rezultata.

Izbor optimalne mešovite strategije od strane igrača A , koju ćemo označiti sa x٭, njemu

obezbeđuje maksimizaciju očekivanog garantovanog (minimalnog) dobitka, tj. dobitak koji ne

može biti manji od vrednosti igre v, tj.

f(x٭, y) = ∑ xi aij ≥ v i = 1,2,...,m ; j = 1,...,n

i

gde veličina f(x٭,y) = max min f(x,y) =α predstavlja donju granicu vrednosti igre.

x y

Slično, izbor optimalne mešovite strategije y٭ za igrača B znači da njegov gubitak neće biti veći od vrednosti igre, odnosno

f(x, y٭) = ∑ aij yj ≤ v j = 1, ... , n ; i = 1, ... , m .

j

gde je f (x, y٭) = min max f(x, y) = β gornja granica vrednosti igre.

y x

Za izbor optimalnih mešovitih strategija od strane igrača A i B ostvaruje se jednakost donje i gornje granice vrednosti igre ako je

max min f (x, y) = min max f (x, y) = f (x٭, y٭ ) = v ; tj. α = β = v

x y y

x

odnosno ravnoteža igre se postiže kada vrednost igre v predstavlja prosečan dobitak za igrača A,

odnosno gubitak za igrača B.

Različite vrste mešovitih matričnih igara, zavisno od vrsta i dimenzija matrica plaćanja,

rešavaju se na različite načine. Igre sa matricama plaćanja reda 2 x n ili m x 2 se rešavaju

dosta jednostavno, grafički ili analitički. U slučaju kada je m > 2 i/ili n > 2, pokušavaju se na

Page 9: Teorija igara - tfzr.uns.ac.rs

neki način uprostiti odgovarajuće matrice, a ako takvo uprošćavanje nije moguće koriste se druge

metode (npr. linearnog programiranja).

Svakako da je najjednostavniji slučaj kada oba igrača imaju na raspolaganju samo po dve

strategije, a i matrica plaćanja je reda 2 x 2, zapisana u obliku:

P = a11 a12 a21 a22 čiji elementi pokazuju dobitke igrača A, odnosno gubitke igrača B, u slučaju izbora bilo koje od

4 moguće kombinacije njihovih strategija.

Pri rešavanju bilo koje igre prvo treba na več opisani način ispitati da li se mogu izborom

maksimin i minimaks vrednosti opredeliti optimalno čiste strategije i vrednost igre (provera da li

je reč o prostoj igri).

Ukoliko nije u pitanju takva igra pristupa se određivanju donje i gornje vrednosti igre i

njihovom izjednačavanju. U slučaju sa po dve strategije neophodna je pretpostavka da su sve

strategije aktivne što če se ispuniti da ako je

a11> a12 onda je a21< a22 i obrnuto. Ako je x = ( x1, x2 = 1 – x1) mešovita strategija igrača A,

odnosno y= (y1, y2 = 1 – y1) mešovita strategija igrača B tada se jednačine koje moraju biri

zadovoljene za optimalne mešovite strategije zapisuju u obliku:

Za igrača A :

a11 x1 + a21 x2 = v

a12 x1 + a22 x2 = v

x1 + x2 = 1

Prva i druga jednačina pokazuju moguće dobitke za igrača A koje će on ostvariti u slučaju izbora

prve, odnosno druge strategije od strane igrača B, respektivno, dok je treća jednačina posledica

raspodela verovatnoća po strategijama.

Očigledno je da se iz navedenog sistema jednačina dobija

a11 x1 + a21(1 - x1) = a12 x1 + a22(1 – x1 ) , a odavde je

x1 = ( a22 – a21) / (a11 – a12 – a21 + a22), a kako je x2 = 1 – x1 , to je i

x2 = ( a11 – a12) / (a11 – a12 – a21 + a22) pa je vrednost igre

v = ( a11 a22 – a21 a12) / (a11 – a12 – a21 + a22)

Isto tako, izračunavanjem gornje granice igre, koju će igrač B ostvariti u slučaju izbora

prve i druge strategije od strane igrača A, dobija se sistem jednačina

a11 y1 + a12 y2 = v

a21 y1 + a22 y2 = v

y1 + y2 = 1

odakle se dobijaju optimalne mešovite strategije za igrača B u obliku

y1 =(a22 – a12) /( a11 – a12 – a21 + a22) ; y2 =( a11 – a21)/( a11 – a12 – a21 + a22)

Zamenom ovih vrednosti u jednu od jednačina sistema za igrača B dobija se ista vrednost igre

kao što je bila i kod igrača A.

Do rešenja igre se može doći i grafičkim putem. Pretpostavimo da je igra definisana

predstavljenom gornjom matricom P reda 2 x 2 i da su strategije igrača dvodimenzionalni

vektori x = (x1 , x2) i y = (y1 , y2). Nakon nanošenja vertikalne linije u tački (1,0) apscise

(pomoćna ordinata), u cilju određivanja optimalne mešovite strategije za igrača A, na osnovnu i

pomoćnu ordinatu nanose se vrednosti dobitaka koje bi igrač A ostvario u slučaju izbora prve,

Page 10: Teorija igara - tfzr.uns.ac.rs

odnosno druge strategije od strane igrača B. Ordinate svih tačaka na duži MN i ispod nje na slici

predstavljaju moguće dobitke koje će igrač A ostvariti u slučaju izbora prve strategije od strane

njegovog protivnika. Slično, nanošenjem vrednosti potencijalnih dobitaka igrača A u slučaju

izbora druge strategije od strane igrača B (vrednosti a12 i a22 ) određena je duž PQ, kao i tačka

preseka duži MN i PQ označena sa Ω. Ordinate tačaka koje se nalaze na krivoj MΩQ i ispod nje

predstavljaju garantovane dobitke koje igrač A ostvaruje bez obzira na izbor strategija njegovog

protivnika. Tačka Ω predstavlja maximin vrednost za igrača A, a njena projekcija na apscisu Ω′

pokazuje relativan odnos prve i druge strategije igrača A, tj. deli duž (0,1) u razmeri x2: x1 .

Na sličan način se može grafički doći i do rešenja posmatranjem igrača B.

Primer 1. Matrica plaćanja igre je oblika P = 5 2

-1 4

Shodno ranijem dobija se da je α = max min aij = 2 i,j = 1,2

i j

β = min max aij = 4 i,j = 1,2 tj. α < β

j i

što znači da se ne mogu opredeliti optimalne čiste strategije igrača A i B. Primena analitičkog

postupka dovodi do sistema jednačina

5 x1 - x2 = v

2 x1 + 4 x2 = v

x1 + x2 = 1

odakle se dobija x1 = 5 / 8 = 0,625 ; x2 = 3 / 8 = 0, 375 i v = 2,75.

Istovetna vrednost igre se dobija i na osnovu sistema jednačina za igrača B, kao i na osnovu

grafičkog rešavanja (korišćenjem prve dve jednačine sistema kao jednačina pravih na kojima se

nalaze duži koje ograničavaju gornju granicu potencijalnih dobitaka za igrača A i dobijanjem

tačke Ω čija je ordinata v = 11/4, a projekcija Ω′ deli duž (0,1) u razmeri x1 = 5/8 i x2 = 3/8).

Page 11: Teorija igara - tfzr.uns.ac.rs

Vektor optimalne mešovite strategije igrača A je x٭= (0,625, o,375)

Ako je matrica plaćanja reda 2 x n ili m x 2 može se za rešavanje igara postupiti na sličan

način. Grafičkim predstavljanjem mogućih rezultata igre za igrača koji ima dve strategije

opredele se aktivne strategije njegovog protivnika, na osnovu kojih se izračunava vrednost igre i

određuju optimalne strategije.

Neka je igra definisana matricom plaćanja:

P = a11 a12 ... a1j ... a1n

a21 a22 ... a2j ... a2n

Takođe, pretpstavimo da je mešovita strategija prvog igrača određena vektorom x = ( x1 , x2

), a drugog vektorom y = (y1, ..., yj, ... yn ). Na grafikonu se predstavljaju potencijalni dobici

koje će igrač A ostvariti u slučaju izbora prve, druge, ..., j-te, ..., n-te strategije od strane igrača

B. Postupajući po principu maksmina opredeljuju se aktivne strategije igrača B, čime se ovakve

igre svode na igru 2 x 2.

Kao sto je to prikazano na slici spojene su tačke koje pokazuju potencijalne dobitke igrača A

u slučaju igranja prve i druge strategije za izbor različitih čistih strategija od strane igrača B.

Garantovani dobici za igrača A se nalaze na krivoj MNΩK i ispod nje. Tačka Ω predstavlja

maksmin vrednost, odnosno donju granicu vrednosti igre. Drugi igrač neće nikada birati one

strategije koje bi za njega prouzrokovale povećanje ostvarenog gubitka.

Kako se tačka Ω nalazi na preseku j- te i k-te strategije igrača B, to ove dve strategije

smatramo aktivnim i na osnovu toga se ova igra svodi na igru 2 x 2. Rešenje igre sa

optimizacijom izbora oba igrača sada se određuje na osnovu matrice plaćanja

P = a1j a1k

a2j a2k

Primer 2. Neka je matrica plaćanja

P = 2 3 -2

1 - 2 5

To znači da igrač A ima na raspolaganju dve strategije, a igrač B tri. Za određivanje aktivnih

strategija igrača B koristimo grafički metodi maksmin pristup. Očigledno je da se uslov

Page 12: Teorija igara - tfzr.uns.ac.rs

ravnoteže (donja granica vrednosti igre jednaka sa gornjom granicom) dostiže u preseku duži

CD i EF, koje su određene pod pretpostavkom da igrač B igra drugu, odnosno treću strategiju,

koje predstavljaju njegove aktivne strategije.

Aktivne strategije igrača B sa prvom i drugom stategijom igrača A formiraju matricu

P = 3 -2

-2 5

čijim rešavanjem ( prethodno opisanim analitičkim postupkom) , se dobija:

-optimalna mešovita strategija igrača A x = ( 7/12 , 5/12 )

-optimalna mešovita strategija igrača B y = ( 7/12 , 5/12 )

- vrednost igre v = 11/12

Da bi igrač A ostvario dobitak v = 11/12 potrebno je da 7/12 ( ≈ 58,3 %) puta primeni

svoju prvu strategiju, a 5/12 puta drugu. Za igrača B je njegova prva strategija neaktivna, jer bi s

njenom primenom ostvario veći gubitak. Isto tako, optimalno za igrača B je da 7/12 puta igra

drugu, a 5/12 puta svoju treću strategiju.

Sličan postupak rešavanja igre se primenjuje i u slučaju kada je zadata matrica plaćanja

reda m x 2. Polazi se od pretpostavke o racionalnom ponašanju igrača A i B, i određuju gornje

granice vrednosti igre, na osnovu kojih se opredeljuju aktivne strategije. Sada se grafički

predstavljaju potencijalni gubici igrača B za izbor različitih čistih strategija od strane igrača A

Page 13: Teorija igara - tfzr.uns.ac.rs

Tako se određuje donja granica gubitaka igrača B – kriva PRΩS na slici- na kojoj tačka

Ω predstavlja minimaks vrednost, odnosno gornju granicu igre. Zbog toga, strategije igrača A

koje opredeljuju ovu tačku (i-tu i m-tu) smatramo aktivnim strategijama, na osnovu kojih je

moguće odrediti optimalne mešovite strategije igrača A i B, kao i vrednost igre.

Page 14: Teorija igara - tfzr.uns.ac.rs

Primer 3. Neka je matrica plaćanja

2 -2

3 -1

P = -2 2

2 0

Ovde igrač A raspolaže sa 4 strategije, a igrač B sa dve. Za određivanje aktivnih strategija igrača

A koristimo grafički metod i minmaks pristup za igrača B.

Na osnovu toga se dobija matrica igre reda 2 x 2

P = -2 2

2 0

a na osnovu nje sledi:

- optimalna mešovita strategija igrača A je x = ( 1/3 , 2/3 )

- optimalna mešovita strategija igrača B je y = ( 1/3 , 2/3 )

- vrednost igre v = 2/3.

U slučaju kada je matrica plaćanja reda m x n pri čemu je m > 2 i n > 2 pokušava se na

neki način uprostiti ta matrica i svesti na jedan od prethodno predstavljenih oblika koji nam

omogućuju jednostavan grafički i analitički oblik rešavanja. Najčešće se koristi postupak

redukcije matrice plaćanja primenom tzv. pravila dominacije.

U matrici P reda m x n svaka vrsta reprezentuje po jednu od mogućih strategija igrača A.

Racionalno ponašanje igrača A znači da on nikada neće birati one strategije koje su “lošije” u

odnosu na bilo koju od preostalih strategija. Ukoliko u matrici plaćanja elementi neke k-te vrste

nisu manji od elemenata neke l-te vrste, tj. ako je akj ≥ alj (j = 1,2,...,n) to dobitak za igrača A

ne može biti manji (potencijalno samo veći) ako izabere strategiju Ak , a ne strategiju Al , bez

obzira koju će strategiju izabrati njegov ptotivnik. Strategija Ak je pogodnija za igrača A nego

strategija Al pa je smatamo dominantnom, a strategiju Al dominiranom. Vrstu matrice plaćanja

koja predstavlja dominiranu strategiju možemo eliminisati, bez bojazni da će se promeniti

vrednost igre, kao i optimalne mešovite strategije igrača. U slučaju da igrač A može da bira

između strategija čiji su “učinci” isti, može se isključiti bilo koja od dve odgovarajuće vrste u

matrici.

Takođe, za igrača B, ukoliko elementi r –te kolone nisu veći od elemenata s-te kolone, tj.

ako je air ≤ ais (i = 1,2,..., m) tada je za njega povoljnije da bira strategiju Br u odnosu na

strategiju Bs, pa se kolona Bs može, kao dominirana, eliminisati.

Uzastopnom eliminacijom dominiranih strategija prvog i drugog igrača, u mogućnosti smo

da smanjimo dimenzije polazne matrice plaćanja, odnosno da dođemo do matrice reda 2 x 2.

Primer.4. Data je matrica plaćanja

2 -2 0 3

3 -1 1 1

P = 2 2 0 2

-1 -2 1 2

Page 15: Teorija igara - tfzr.uns.ac.rs

Očigledno je da je četvrta kolona matrice P dominirina u odnosu na treću kolonu jer je ai4 ≥ ai3

za svako i = 1,2,3,4, što znači da ukoliko se racionalno ponaša igrač B nikada ne bi birao svoju

četvrtu po redu strategiju. Eliminisanjem četvrte kolone dobija se matrica reda 4 x 3

2 -2 0 3 -1 1 P4x3 = 2 2 0

-1 -2 1

Vidi se da je prva kolona ove matrice dominirana u odnosu na njenu drugu kolonu jer je ai1 ≥ ai2

za svako i = 1,2,3,4, pa se i prva kolona može eliminisati. U dobijenoj matrici

-2 0 P4x2 = -1 1

2 0 -2 1

je druga vrsta (druga strategija) dominantna nad prvom vrstom (prvom strategijom) jer je a1j ≤

a2j za j = 1,2 , pa se prva vrsta može isključiti. Dobijenu matricu

-1 1 P3x2 = 2 0 -2 1

redukujemo na matricu reda 2 x 2 tako što eliminišemo treću vrstu budući da su njeni elementi

manji ili jednaki od odgovarajućih elemenata prve vrste. Tako se dobija da su aktivne za igrača

A njegova druga i treća strategija, a isti je slučaj i sa igračem B. Primenom analitičkog metoda

za igru čija je matrica plaćanja

P2x2 = -1 1 2 0

dobija x = ( ½ , ½ ) ; y = ( ¾ , ¼ ) i v = ½ , odnosno posmatrajući početno definisanu

matricu plaćanja je x = ( 0, ½, ½, 0) i y = ( 0, ¾, ¼, 0).

Napomenimo da se, u slučaju da nije moguće primeniti upravo opisano pravilo

dominacije, koriste i druge metode kao što su metod linearne kombinacije mogućih strategija,

metod proseka, ili metode linearnog programiranja.