54
Peliteorian perusteita ja sovelluksia evoluutioekologiassa Maaria Kangasniemi Matematiikan Pro Gradu Jyväskylän yliopisto Matematiikan ja tilastotieteen laitos kesä 2022

Peliteorian perusteita ja sovelluksia evoluutioekologiassa - JYX

Embed Size (px)

Citation preview

Peliteorian perusteita ja sovelluksia evoluutioekologiassa

Maaria Kangasniemi

Matematiikan Pro Gradu

Jyväskylän yliopistoMatematiikan ja tilastotieteen laitos

kesä 2022

Tiivistelmä: Maaria Kangasniemi, Peliteorian perusteita ja sovelluksia evo-luutioekologiassa (engl. The basics of game theory and its applications on evo-lutionary ecology), matematiikan pro gradu -tutkielma, 54 sivua, Jyväskylänyliopisto, Matematiikan ja tilastotieteen laitos, kesä 2022.

Tämän tutkielman tarkoituksena on luoda yleiskatsaus peliteoriaan jasen soveltamiseen biologiassa. Tutkielmassa käsitellään aluksi sellaisia kah-den pelaajan pelejä, joissa toinen voittaa sen minkä toinen häviää. Tällai-sissa nollasummapeleiksi kutsutuissa peleissä pelaajien voitot summautuvatsiis nollaksi. Nollasummapelien yhteydessä määritellään molemmille pelaa-jille optimaaliset strategiat, jotka ovat parhaan mahdollisen voiton tuotta-via strategioita. Optimaalisten strategioiden etsimisen jälkeen esitellään VonNeumannin minimax-lause, jonka mukaan lopputuloksen kannalta ei ole vä-liä, kumpi pelaaja optimoi ensin strategiansa. Sama voitto saavutetaan mo-lemmissa tapauksissa, jolloin tätä kyseistä voittoa kutsutaan myös pelin ar-voksi.

Nollasummapeleistä siirrytään käsittelemään yleisiä summapelejä, joissapelaajien voitot eivät nollasummapelien tapaan summaudu nollaan. Yleis-ten summapelien käsittely aloitetaan kahden pelaajan tapauksilla, minkäjälkeen siirrytään useamman pelaajan peleihin. Sekä kahden pelaajan ettäuseamman pelaajan summapeleihin tutustutaan aluksi esimerkkien avulla,minkä jälkeen muotoillaan Nashin tasapaino ja todistetaan tähän liittyväNashin lause. Nashin tasapaino on sellainen pelaajien strategiayhdistelmä,josta yhdenkään pelaajan ei kannata yksipuolisesti poiketa. Tällainen tasa-paino löytyy Nashin lauseen mukaan jokaisesta vähintään kahden pelaajanpelistä.

Tutkielman viimeisessä luvussa palataan jälleen kahden pelaajan pelei-hin, joita tutkitaan biologisessa kontekstissa. Tällaisille peleille määritelläänevolutiivisesti tasapainoinen strategia, sekä tuodaan esille sen yhteys Nashintasapainoon. Apuna evolutiivisesti tasapainoisen strategian määritelmän kä-sittelyssä käytetään kahta yleistä pelityyppiä, joista esitellään myös esimerkitluonnonpopulaatioissa.

Sisällys1 Johdanto 4

2 Esitietoja 62.1 Peleihin liittyviä käsitteitä ja merkintöjä . . . . . . . . . . . . 62.2 Muita määritelmiä ja tuloksia . . . . . . . . . . . . . . . . . . 9

3 Kahden pelaajan nollasummapelit 133.1 Esitietoja minimax-lauseeseen . . . . . . . . . . . . . . . . . . 163.2 Von Neumannin minimax-lause . . . . . . . . . . . . . . . . . 20

4 Yleiset summapelit 244.1 Kahden pelaajan yleiset summapelit . . . . . . . . . . . . . . 25

4.1.1 Nashin tasapaino kahdelle pelaajalle . . . . . . . . . . 264.2 Useamman pelaajan summapelit . . . . . . . . . . . . . . . . . 33

4.2.1 Nashin tasapaino useammalle pelaajalle . . . . . . . . . 344.2.2 Nashin lause todistuksineen . . . . . . . . . . . . . . . 40

5 Evoluutioekologiaa ja peliteoriaa 445.1 Evolutiivisesti tasapainoinen strategia . . . . . . . . . . . . . . 455.2 Pelimallit luonnonpopulaatioissa . . . . . . . . . . . . . . . . . 52

5.2.1 Haukka-kyyhky . . . . . . . . . . . . . . . . . . . . . . 525.2.2 Kivi-paperi-sakset . . . . . . . . . . . . . . . . . . . . . 53

3

1 JohdantoTässä tutkielmassa perehdytään peliteoriaan ja sen soveltamiseen evoluutio-ekologiassa. Peliteoriassa käsitellään toistuvia päätöksentekotilanteita, jois-sa on tietyt ominaisuudet. Näitä toistuvia päätöksentekotilanteita kutsutaanpeleiksi ja pelien ominaisuuksia ovat pelaajat, pelaajien strategiat sekä pe-laajien saavuttamat voitot tietyillä strategiayhdistelmillä.

Luvussa 2 aloitetaan peliteoriaan tutustuminen yksinkertaisen esimerkinavulla, josta pelien perusominaisuudet käyvät selkeästi ilmi. Esimerkin jäl-keen määritellään muun muassa mitä peli, pelaajat ja pelaajien strategiatovat matemaattisessa kontekstissa. Luvussa 2 on koottuna myös muutamiayleisempiä matematiikan tuloksia, joita käytetään myöhemmin tutkielmassaapuna.

Luvussa 3 käsitellään kahden pelaajan nollasummapelejä. Nollasumma-peleissä toinen pelaaja voittaa sen, minkä toinen häviää, eli voitot summautu-vat nollaksi. Nollasummapeleille etsitään optimaalista strategiaa, jolla pelaa-ja saa pelikertojen toistuessa suurimman voiton. Nollasummapelien yhtey-dessä esitellään sekä todistetaan myös von Neumannin minimax-lause 3.3,jonka mukaan sama voitto saavutetaan riippumatta siitä, kumpi pelaaja op-timoi ensin strategiansa. Tätä saavutettua voittoa kutsutaan myös kyseisenpelin arvoksi. Todistuksessa käytetään apuna minimax-lemmaa 3.2, jonkamukaan maxx∈X miny∈Y f(x,y) ≤ miny∈Y maxx∈X f(x,y). Tästä saadaansuoraan toinen suunta yhtäsuuruutta varten, kun taas toisen suunnan osoit-taminen on haastavampaa. Tätä varten tehdään antiteesi, jonka vääräksiosoittamisessa käytetään apuna erotteleva hypertaso -lausetta 3.1.

Von Neumannin lauseen ideaa laajennetaan luvussa 4, jossa siirrytään kä-sittelemään kahden ja useamman pelaajan yleisiä summapelejä. Sekä kahdenettä useamman pelaajan yleisille summapeleille määritellään Nashin tasapai-no (määritelmät 4.3, 4.7, 4.9). Nashin tasapaino on sellainen strategiayhdis-telmä, josta yhdenkään pelaajan ei kannata yksinään poiketa. Yksikään pe-laaja ei siis saavuta voittoa vaihtamalla strategiaansa muiden strategioidenpysyessä samana. Nashin tasapainon määritelmää tarkennetaan vielä määri-telmässä 4.10 muotoilemalla symmetrinen Nashin tasapaino.

Kun tarkasti määriteltyä Nashin tasapainoa on tutkittu esimerkkien avul-la, muotoillaan ja todistetaan tutkielman päätuloksena Nashin lause 4.2. Nas-hin lauseen mukaan kaikista kahden tai useamman pelaajan yleisistä summa-peleistä löytyy aina Nashin tasapaino. Nashin lause todistetaan ensin kahdenpelaajan tapauksessa, minkä jälkeen todistus laajennetaan koskemaan myös

4

useamman pelaajan tilanteita. Todistuksessa etsitään Brouwerin kiintopiste-lauseen 4.1 avulla sellainen piste (strategiayhdistelmä), joka näytetään etsi-tyksi Nashin tasapainoksi.

Tutkielman viimeisessä luvussa käsitellään peliteorian soveltamista evo-luutioekologiassa. Evoluutiopeliteoreettisessa lähestymistavassa käsitelläänkahden pelaajan symmetrisiä pelejä, joten myös tämän tutkielman viimei-sessä osassa rajataan pelien käsittely tällaisiin peleihin. Heti aluksi määri-telmässä 5.1 esitellään evoluutiopeliteoriassa keskeinen käsite, evolutiivisestitasapainoinen strategia. Tämä strategia on sellainen, joka muuttumattomissaympäristöissä säilyy optimaalisena strategiana jokaiselle populaation jäsenel-le. Koska sekastrategian voi myös tulkita eri strategioiden lukumääräsuhteinapopulaatiossa, voi evolutiivisesti tasapainoisen strategian ajatella myös sel-laisena puhtaiden strategioiden jakaumana populaatiossa, joka pysyy tasa-painossa. Evolutiivisesti tasapainoisen strategian määritelmää tarkastellaankahden perinteisen pelimallin avulla, minkä lisäksi luodaan katsaus siihen,kuinka nämä teoreettiset mallit sopivat luonnonpopulaatioihin.

Peliteoria on melko uusi matematiikan osa-alue, vaikka ensimmäisiä merk-kejä peliteoriasta on havaittavissa jo 1800–luvulla. Varsinaisesti peliteoriankehittyminen alkoi kuitenkin vasta sen jälkeen, kun John von Neumann to-disti itsensä mukaan nimetyn von Neumannin minimax-lauseen vuonna 1928[7]. Peliteorian kehittymisen myötä myös sen soveltaminen eri aloilla alkoilisääntyä, tyypillisimpänä taloustiede. Taloustieteen sovelluksiin liittyy myöstässäkin tutkielmassa tutuksi tuleva John Nashin vuonna 1950 esittelemätasapainon käsite [6].

Jörgen W. Weibullin Teoksessa Evolutionary Game Theory [10] tuotiinesille, että jo John Nash huomautti, että hänen tasapainon käsitettään voisisoveltaa myös evoluutiobiologiassa, mutta siihen aikaan peliteoriassa keski-tyttiin tarkasti rationaalisten pelaajien peleihin. Ajateltiin, että rationaalis-ten pelaajien pelejä ei voi soveltaa tilanteisiin, joissa pelaajat eivät punnitsevaihtoehtojaan ja valitse ”järkevästi”. Tämän vuoksi peliteoriaa ei sovellettubiologiassa ennen kuin vasta 1980–luvulla ilmestynyt Maynard Smithin kirjaevoluutiosta ja peliteoriasta alkoi vähentää rationaalisten pelaajien painotus-ta. Tämän jälkeen 1990–luvulla peliteoria jatkui kehittymistään vapaammin.

Tässä työssä on käytetty pääasiallisena lähteena Yuval Peresin luentomo-nistetta Game Theory, Alive [8], minkä lisäksi erityisesti evoluutiopeliteoriaakoskevassa osuudessa on käytetty lähteenä myös teosta Evolutionary GameTheory [10].

5

2 EsitietojaTässä luvussa esitellään tutkielman kannalta oleellisia peliteoriaan liittyviäkäsitteitä sekä matemaattisia tuloksia. Aloitetaan esimerkillä, josta käy ilmityön kannalta keskeisimmät käsitteet peli, strategia ja voitto.

Esimerkki 2.1. Pelissä on kaksi pelaajaa, joista toisella on kaksi kolikkoa.Kutsutaan tätä pelaajaksi 2 ja toista pelaajaksi 1. Peliä pelataan vuoroissaja kullakin vuorolla pelaaja 2 piilottaa ensin joko molemmat kolikot oikeaankäteensä tai yhden kolikon vasempaan käteensä. Tämän jälkeen pelaaja 1valitsee joko oikean tai vasemman käden ja voittaa kädessä olevan kolikko-määrän. Listataan mahdolliset tilanteet seuraavaan taulukkoon:

pelaaja 2pelaaja 1 V O

V (1,−1) (0, 0)O (0, 0) (2,−2)

Taulukon riveillä ovat pelaajan 1 strategiat ja taulukon sarakkeilla ovatpelaajan 2 strategiat. Tässä pelissä kummallakin on kaksi strategiaa: valitavasen käsi (merkitään V ) tai valita oikea käsi (merkitään O). Pelaajan 1 an-saitsemaa voittoa merkitsee taulukossa olevan lukuparin ensimmäinen lukuja pelaajan 2 häviötä merkitsee lukuparin toinen luku. Esimerkiksi taulu-kon ensimmäisessä solussa on kuvattuna pelaajien saavuttamat voitot, kunmolemmat valitsevat vasemman käden.

2.1 Peleihin liittyviä käsitteitä ja merkintöjäMääritellään aluksi peliteorian keskeisiä käsitteitä sekä esitellään työssä käy-tettävät merkinnät. Seuraavien merkintöjen ja käsitteiden muotoilussa onkäytetty apuna teoksia Evolutionary Game Theory [10], An IntroductoryCourse on Mathematical Game Theory [2] ja Game Theory, Alive [8].

Pelaajia voi yleisessä pelissä olla useita, jolloin merkitään satunnaistapelaajaa j ∈ I, jossa I = {1, . . . , k} on kaikkien pelaajien muodostamajoukko. Määritellään pelaajan käyttämät strategiat matemaattisesti.

6

Määritelmä 2.1. Pelaajan j strategia on vektori x ∈ Rn, jolle päteen∑i=1

xi = 1.

Lisäksi jokainen xi ∈ [0, 1].

Määritelmässä vektorin jokainen komponentti kuvastaa yhdelle vaihtoeh-dolle määrättyä todennäköisyyttä. Näiden komponenttien mukaan strategiatvoidaan jakaa edelleen sekastrategioihin ja puhtaisiin strategioihin. Sekastra-tegiassa yhdenkään vaihtoehdon todennäköisyys ei ole 1, kun taas puhtaassastrategiassa yhden vaihtoehdon todennäköisyys on 1 ja muiden 0. Määritel-lään nämä vielä täsmällisesti.

Määritelmä 2.2. Pelaajan j sekastrategia on vektori x ∈ Rn, jolle päteen∑i=1

xi = 1.

Lisäksi jokainen xi ∈ [0, 1[.

Määritelmä 2.3. Pelaajan j puhdas strategia on sellainen vektori p ∈ Rn,jossa pi = 1 jollakin i ∈ {1, . . . , n} ja pk = 0 kaikilla k 6= i.

Jokaisella pelaajalla on oma strategioiden joukkonsa, johon kuuluvat kaik-ki pelaajan mahdolliset strategiat.

Määritelmä 2.4. Pelaajan j kaikkien strategioiden joukko on

∆n = {x ∈ Rn |n∑i=1

xi = 1, xi ≥ 0 kaikilla i ∈ {1, . . . , n}}.

Tässä tutkielmassa merkitään kahden pelaajan peleissä pelaajan 1 stra-tegioiden joukkoa ∆m ja pelaajan 2 strategioiden joukkoa ∆n, elleivät joukotole samat, jolloin molempia merkitään ∆n.

Pelien ominaisuuksiin kuuluu pelaajien strategioiden lisäksi myös strate-gioille määrätyt voitot. Määritellään seuraavaksi voittomatriisi, jota käyte-tään apuna voiton laskemisessa kahden pelaajan peleissä. Useamman pelaa-jan peleissä kyseessä on voittofunktio, johon palataan myöhemmin määritel-mässä 4.5.

7

Määritelmä 2.5. Olkoon voittomatriisi Am×n kahden pelaajan pelissä

Am×n =

a11 a12 . . . a1na21 a22 . . . a2n... ... . . . ...am1 am2 . . . amn

,

kun m on ensimmäisen pelaajan puhtaiden strategioiden lukumäärä ja ntoisen pelaajan strategioiden lukumäärä.

Voittomatriisin jokainen alkio aij kuvastaa ensimmäisen pelaajan puh-taalla strategialla pi saavuttamaa voittoa pelaajan 2 puhdasta strategiaa pjvastaan. Voittomatriisi voi olla molemmille pelaajille erilainen, sillä pelaajil-la voi olla erilaiset puhtaat strategiat tai niihin liitetyt voitot. Voittomatriisiriippuu siis siitä, kumman pelaajan näkökulmasta voittoja tarkastellaan, elikumpi on pelaaja 1 ja kumpi pelaaja 2. Mikäli molempien pelaajien puhtai-den strategioiden joukot ovat samat, kyseessä on n×n-matriisi. Tätä merki-tään jatkossa pelkästään kirjaimella A tai B jos kyseessä on toisen pelaajanmatriisi.

Määrätään kahden pelaajan pelissä odotettu voitto pelaajalle 1. Myösvoittoa laskiessa on tärkeä muistaa, kumman pelaajan näkökulmasta voit-toa laskee. Seuraavan määritelmän mukainen lauseke antaa voiton aina sillepelaajalle, kumman strategiavektori on lausekkeessa ensimmäisenä.

Määritelmä 2.6. Kahden pelaajan pelissä odotettu voitto pelaajalle 1 on

x>Ay,

missä A on pelin voittomatriisi pelaajalle 1, x ∈ ∆m ja y ∈ ∆n. Joukot ∆m

ja ∆n ovat vastaavasti pelaajien 1 ja 2 kaikkien strategioiden joukot.

Määritellään vielä voittovektorit molemmille pelaajille. Voittovektorit an-tavat odotetut voitot vektorimuodossa mitä tahansa toisen pelaajan strate-giaa vastaan.

Määritelmä 2.7. Pelaajan 1 voittovektori on vektori

Ay,

missä A on pelaajan 1 voittomatriisi ja y on pelaajan 2 mikä tahansa stra-tegia.

8

Määritelmä 2.8. Pelaajan 2 voittovektori on vektori

x>A,

missä A on pelaajan 1 voittomatriisi ja x on pelaajan 1 mikä tahansa stra-tegia.

2.2 Muita määritelmiä ja tuloksiaTähän lukuun on kerätty matemaattisia määritelmiä ja joitakin tiettyjä tu-loksia, jotka ovat oleellisia tutkielman aiheen käsittelyn kannalta. Tämänluvun lähteinä on käytetty pääasiassa Yuval Peresin luentomonistetta [8] jaTero Kilpeläisen Vektorianalyysi 1 -luentomonistetta [3].

Aloitetaan määrittelemällä muutama peruskäsite ja näihin liittyviä tu-loksia.

Määritelmä 2.9 (Rajoitettu). Joukko A ⊂ Rn on rajoitettu, jos on olemassaluku M ∈ R siten, että

‖x‖ ≤M kaikilla x ∈ A,

missä ‖x‖ =√x2

1 + x22 + · · ·+ x2

n eli pisteen x euklidinen normi.

Määritelmä 2.10. Joukko A ⊆ Rn on konveksi, jos mitä tahansa pisteitäa, b ∈ A yhdistävä suoran osa,

{pa+ (1− p)b | p ∈ [0, 1]},

kuuluu myös joukkoon A.

Konveksi joukko on siis sellainen joukko, jossa kahden pisteen välille saaaina janan siten, että jana kuuluu myös kyseiseen joukkoon. Joukossa ei siisole reikiä tai kuoppia, joissa osa janasta voisi päätyä joukon ulkopuolelle. To-distetaan sitten erilaisia ominaisuuksia suljetuille, rajoitetuille ja konvekseillejoukoille sekä strategioiden joukolle.

Lemma 2.1. Olkoot joukot A,B ⊆ Rn konvekseja. Tällöin myös A∩B sekäA×B ovat konvekseja joukkoja.

9

Todistus. Osoitetaan ensin, että A ∩ B on konveksi. Olkoot x,y ∈ A ∩ B.Koska joukot A ja B ovat konvekseja, niin molemmille pätee, että

{px + (1− p)y | p ∈ [0, 1]} ⊂ A

ja{px + (1− p)y | p ∈ [0, 1]} ⊂ B.

Näin ollen{px + (1− p)y | p ∈ [0, 1]} ⊂ A ∩B.

Osoitetaan sitten, että A×B on konveksi. Olkoot nyt x,x′ ∈ A ja y,y′ ∈B. Tällöin px+(1−p)x′ ∈ A ja qy+(1−q)y′ ∈ B kaikilla p, q ∈ [0, 1]. Olkoonr ∈ [0, 1], jolloin saadaan pisteiden (x,y) ja (x′,y′) välille jana r(x,y) + (1−r)(x′,y′). Tälle janalle pätee

r(x,y) + (1− r)(x′,y′) = (rx + (1− r)x′, ry + (1− r)y′),

ja koskarx + (1− r)x′ ∈ A sekä ry + (1− r)y′ ∈ B,

niin (rx + (1− r)x′, ry + (1− r)y′) ∈ A×B.

Osoitetaan seuraavaksi, että pelaajan strategioiden joukko on suljettu,rajoitettu sekä konveksi. Nämä ovat varsin oleellisia strategioiden joukonominaisuuksia.

Lemma 2.2. Strategioiden joukko

∆n = {x ∈ Rn |n∑i=1

xi = 1, xi ≥ 0 kaikilla i ∈ {1, . . . , n}}.

on suljettu, rajoitettu ja konveksi.

Todistus. Osoitetaan ensin, että strategioiden joukko ∆n on suljettu. Näyte-tään tämä kahden ulottuvuuden tapauksessa, eli joukolla ∆2 = {x ∈ R2 |x1, x2 ≥ 0, x1 + x2 = 1}. Tällöin joukon komplementtijoukko koostuu niis-tä pisteistä, joiden toinen tai molemmat koordinaatit ovat aidosti pienempiäkuin 0 sekä niistä pisteistä, joiden koordinaattien summa on erisuuri kuin 1.Kuvassa 1 näkyy pisteiden (0, 1) ja (1, 0) välisenä janana joukko ∆n ja erilai-sia tapoja, miten piste voi sijoittua komplementtijoukoon. Kirjoitetaan tämävielä matemaattisesti: ∆C

2 = X ∪ Y ∪ Z, missä

X = {x ∈ R2 | x1 < 0},

10

Y = {x ∈ R2 | x2 < 0} jaZ = {x ∈ R2 | x1 + x2 6= 1}.

Kuva 1: Pisteiden sijoittuminen joukon ∆2 komplementtijoukkoon.

Komplementtijoukon piste z voi siis sijoittua johonkin näistä kolmestajoukosta. Mikäli piste z kuuluu joko joukkoon X tai Y (tai molempiin), onhelppo näyttää, että piste z keskipisteenä saadaan aina avoin pallo B(z, r)siten, että B(z, r) ∩ ∆2 = ∅. Jos esimerkiksi z1 < 0 niin voidaan valitar = |z1|/2. Samoilla perusteilla voidaan valita r = |z2|/2 jos z2 < 0.

Jos z ∈ Z, niin z1+z2 6= 1. Koska joukko ∆2 on suoran osa, niin näytetään,että etäisyys komplementtijoukon pisteestä z suoraan x1 + x2 = 1 on aidostisuurempi kuin nolla. Pisteen z etäisyys suorasta x1 + x2 = 1 on

d = |z1 + z2 − 1|√2

.

Nyt z1 + z2 6= 1, joten z1 + z2 − 1 6= 0 ja tästä seuraa, että d > 0. Voidaansiis valita r = d/2, jolloin B(z, r) ∩∆2 = ∅.

Osoitetaan seuraavaksi, että strategioiden joukko ∆n on rajoitettu. Jou-kon määritelmän mukaan vektoreiden koordinaattien summa on 1, jolloinxi ≤ 1 kaikilla i = {1, . . . , n}. Tällöin ‖x‖ ≤

√n, eli joukko ∆n on rajoitet-

tu.Osoitetaan viimeiseksi, että strategioiden joukko ∆n on konveksi. Olkoot

x,y ∈ ∆n. Tarkistetaan, kuuluuko myös px + (1 − p)y joukkoon ∆n, kun

11

p ∈ [0, 1]. Sievennetään lauseke, jolloin saadaan

px + (1− p)y = (px1 + y1 − py1, . . . , pxn + yn − pyn).

Jokainen komponentti on nyt varmasti suurempaa tai yhtä suurta kuin 0,joten tarkistetaan summautuvatko komponentit ykköseksi. Komponenttiensummaksi saadaan

px1 + y1 − py1 + · · ·+ pxn + yn − pyn= p(x1 + · · ·+ xn)− p(y1 + · · ·+ yn) + y1 + · · ·+ yn

= p− p+ 1= 1,

joten px+(1−p)y ∈ ∆n, mistä seuraa, että strategioiden joukko on konveksi.

Määritellään mitä tarkoittaa, kun jokin vektori dominoi jotain toista vek-toria.

Määritelmä 2.11. Vektori x ∈ Rn dominoi toista vektoria y ∈ Rn, josxi ≥ yi kaikilla i = 1, . . . , n. Tällöin merkitään

x ≥ y.

Palautetaan vielä viimeiseksi mieleen ylä- ja alarajan sekä supremuminja infimumin määritelmät.

Määritelmä 2.12 (Yläraja). Olkoon A ⊂ Rn. Luku M ∈ R on funktionf : A→ R yläraja joukossa A, jos jokaiselle x ∈ A pätee, että

f(x) ≤M.

Määritelmä 2.13 (Supremum). Olkoon A ⊂ Rn. Luku S on funktionf : A→ R supremum eli pienin yläraja joukossa A, jos

1. se on funktion yläraja joukossa A ja

2. kaikille funktion ylärajoille M pätee, että S ≤M .

Tällöin merkitäänS = sup

x∈Af(x).

12

Määritelmä 2.14 (Alaraja). Olkoon A ⊂ Rn. Luku m ∈ R on funktionf : A→ R alaraja joukossa A, jos kaikille x ∈ A pätee, että

f(x) ≥ m.

Määritelmä 2.15 (Infimum). Olkoon A ⊂ Rn. Luku a ∈ R on funktionf : A→ R infimum eli suurin alaraja joukossa A, jos

1. se on funktion alaraja joukossa A ja

2. kaikille funktion alarajoille m pätee, että a ≥ m.

Tällöin merkitääna = inf

x∈Af(x).

3 Kahden pelaajan nollasummapelitTässä luvussa tutustutaan peliteoriaan kahden pelaajan nollasummapelienavulla. Kahden pelaajan nollasummapeleissä on kysymys sellaisista peleistä,joissa odotetut voitot summautuvat nollaan, eli toinen pelaaja voittaa senminkä toinen häviää. Tämän luvun lähteenä on pääasiallisesti käytetty YuvalPeresin luentomonistetta [8].

Aloitetaan laajentamalla ensimmäisenä esiteltyä johdatteluesimerkkiä. Täs-sä esimerkissä etsitään kummallekin pelaajalle niin sanottua optimaalistastrategiaa, jonka avulla voidaan laskea odotettu voitto pelikertojen toistues-sa.

Esimerkki 3.1. Pelissä on kaksi pelaajaa, joilla molemmilla on kaksi vaih-toehtoa; valita vasen tai oikea käsi. Näitä kutsutaan pelaajien puhtaiksi stra-tegioiksi, merkitään V (valitsee vasemman käden) ja O (valitsee oikean kä-den). Pelaaja 2 piilottaa joko kaksi kolikkoa oikeaan käteensä tai yhden koli-kon vasempaan käteensä ja pelaajan 1 tulee valita toinen käsistä, jolloin hänvoittaa kädessä olevan kolikkomäärän.

Tässä vielä muistutuksena ensimmäisessä esimerkissä esitetty taulukko,jossa on eri vaihtoehdot ja voitot listattuna:

pelaaja 2pelaaja 1 V O

V (1,−1) (0, 0)O (0, 0) (2,−2)

13

Voidaan ajatella pelaajan 2 näkökulmasta siten, että olisi järkevää piilot-taa vain toinen kolikoista vasempaan käteen, sillä tällöin mahdollinen häviöon enintään yhden kolikon. Pelaaja 1 voisi kuitenkin ajatella samoin kuin pe-laaja 2 ja sen vuoksi valita aina vasemman käden, jolloin hän voittaisi kolikonjokaisella pelikerralla.

Toisaalta voidaan ajatella pelaajan 1 näkökulmasta, että järkevintä olisivalita aina oikea käsi, koska mahdollinen voitto olisi tällöin kaksi kolikkoa elisuurin mahdollinen. Pelaaja 2 voi kuitenkin aavistaa pelaajan 1 ajattelun japiilottaa vain yhden kolikon vasempaan käteensä, jolloin pelaaja 2 ei voittaisimitään.

Kiinnostavaa onkin se, miten voi kiertää tämän ongelman. Miten löytääsellainen strategia, jota toinen pelaaja ei voisi suoraan arvata ja millä voivarmistaa itselleen parhaan mahdollisen voiton?

Tarkastellaan tilannetta ensin pelaajan 1 näkökulmasta ja merkitään kir-jaimella p todennäköisyyttä sille, että pelaaja 1 valitsee oikean käden. Tällöintodennäköisyys sille, että pelaaja 1 valitsee vasemman käden on 1 − p. Nytjos pelaaja 2 piilottaa oikeaan käteen kaksi kolikkoa, on hänen odotettu hä-viönsä 2p kolikkoa. Vastaavasti odotettu häviö on 1 − p, jos hän piilottaavasempaan käteensä yhden kolikon. Jos pelaaja 2 tietäisi, mikä p on, hän va-litsisi strategiansa siten, että hänen häviönsä on min(2p, 1−p). Pelaaja 1 osaaodottaa, että pelaaja 2 pyrkii aina minimoimaan häviönsä, joten hän valitseetodennäköisyyden p siten, että hän saa maksimoitua tämän minimin. Kuvas-sa 2 sinisellä on merkitty min(2p, 1 − p) ja tämän minimin maksimi löytyykohdasta p = 1

3 . Paras strategia pelaajalle 1 on siis valita todennäköisyydelläp = 1

3 oikea käsi ja muilla kerroilla vasen käsi, matemaattisesti kirjoitettunapelaajan strategia on (2

3 ,13). Pelaajan 1 voitto riippuu siitä, miten pelaaja 2

pelaa, joten hän saa tällöin pelikertojen toistuessa varmistettua voitokseen2p = 2 · 1

3 = 23 .

Mietitään sitten tilannetta pelaajan 2 näkökulmasta. Merkitään kirjai-mella q todennäköisyyttä, että pelaaja 2 päättää piilottaa kaksi kolikkoa oi-keaan käteensä. Tällöin todennäköisyys sille, että pelaaja 2 piilottaa yhdenkolikon vasempaan käteensä on 1 − q. Nyt pelaaja 1 pyrkii maksimoimaanmahdollisen voittonsa, joten hän valitsee strategiansa niin, että hänen voit-tonsa on max(2q, 1 − q). Pelaaja 2 ymmärtää, että pelaaja 1 yrittää maksi-moida voittonsa, joten hän sen sijaan minimoi tämän maksimin valitsemallaq = 1

3 . Tämä tilanne on kuvattuna kuvassa 2, jossa mustalla näkyy pelaajan1 maksimi, jota pelaaja 2 haluaa minimoida. Tällöin myös pelaajalle 2 parasstrategia olisi (2

3 ,13). Pelaajan 1 voitto on edelleen 2q = 2 · 1

3 = 23 . Pelin lop-

14

Kuva 2: Voittofunktioiden kuvaajat pelaajalle 1 puhtailla strategioilla V jaO.

putulos ei siis riipu siitä, kumman näkökulmasta peliä tarkastellaan, kutenlauseessa 3.3 tullaan toteamaan.Esimerkki 3.2. Sovelletaan nyt luvussa 2.1 esiteltyjä merkintöjä edeltä-vän esimerkin tapaukseen. Merkitään kahden pelaajan peleissä x ∈ ∆m jay ∈ ∆n, jolloin x on pelaajan 1 eräs strategia ja y on pelaajan 2 eräs strate-gia. Määritellään pelaajille 1 ja 2 voittomatriisit A ja B (vastaavasti), joidenalkiot kuvastavat tietyllä strategiayhdistelmällä saavutettua voittoa. Esimer-kin tapauksessa pelaajan 1 voittomatriisi on

A =[1 00 2

].

Pelaajalle 2 voittomatriisi on sen sijaan

B =[−1 00 −2

].

Matriisin alkiot vertautuvat suoraan taulukon soluihin. Myös matriisissariveillä ovat pelaajan 1 strategiat ja sarakkeilla pelaajan 2 strategiat. Jos esi-merkiksi pelaaja 2 päättää valita vasemman kätensä, johon piilottaa yhden

15

kolikon, matriisin ensimmäinen sarake kuvastaa pelaajan 1 voittomahdolli-suuksia eri strategioilla. Jos pelaaja 1 valitsee myös vasemman käden, hänenvoittonsa on 1. Vastaavasti pelaajan 2 voitto on -1.

Määritelmä 3.1. Strategia x ∈ ∆m on optimaalinen pelaajalle 1, jos

miny∈∆n

x>Ay = maxx∈∆m

miny∈∆n

x>Ay.

Vastaavasti strategia y ∈ ∆n on optimaalinen pelaajalle 2, jos

maxx∈∆m

x>Ay = miny∈∆n

maxx∈∆m

x>Ay.

Optimaalinen strategia on siis sellainen, joka tuottaa pelaajalleen suu-rimman mahdollisen voiton vastapuolen minimoitua häviönsä. Esimerkissä3.1 pelaajan 1 optimaaliseksi strategiaksi saatiin x = (2

3 ,13) ja pelaajan 2

optimaaliseksi strategiaksi saatiin myös y = (23 ,

13).

3.1 Esitietoja minimax-lauseeseenTässä luvussa esitellään muutamia tarvittavia esitietoja von Neumannin minimax-lauseen todistusta varten.

Kuva 3: Kuvassa näkyy lauseen 3.1 joukko K ja z>y.

16

Lause 3.1 (Erotteleva hypertaso). Olkoon joukko K ⊆ Rn suljettu ja kon-veksi. Jos 0 6∈ K, niin on olemassa z ∈ Rn ja c ∈ R siten, että

0 < c < z>v, kaikilla v ∈ K.

Todistus. Koska K on suljettu, niin löytyy piste z ∈ K siten, että

‖z‖ = infv∈K‖v‖.

Valitaan säde r > 0 siten, että avoin pallo B(0, r) leikkaa joukon K kanssa.Tällöin kuvaus v 7→ ‖v‖ : K ∩ {x ∈ Rn : ‖x‖ ≤ r} → [0,∞[ on jatkuva jalähtöjoukko on suljettu sekä rajoitettu. Jatkuva kuvaus saavuttaa pienimmänarvonsa suljetulla ja rajoitetulla välillä, jolloin pienin arvo on myös infimumtällä välillä ([3], lause 2.67). Näin ollen kuvaus saavuttaa infimuminsa jossainpisteessä z ∈ K.

Osoitetaan sitten, että 0 < c < z>v kaikilla v ∈ K ja jollakin c ∈ R.Valitaan nyt c = 1

2‖z‖2 > 0. Olkoon v ∈ K. Koska K on konveksi, tällöin

kaikille p ∈ [0, 1] pätee konveksisuuden määritelmän (2.10) nojalla, että

pv + (1− p)z ∈ K.

Koska ‖z‖ = infv∈K ‖v‖, niin tällöin

‖z‖2 ≤ ‖pv + (1− p)z‖2.

Laskemalla auki epäyhtälön molemmat puolet saadaan

z>z ≤ p2v>v + (1− p)2z>z + 2p(1− p)v>z,

jota edelleen sieventämällä saadaan

p(2v>z− v>v− z>z) ≤ 2(v>z− z>z).

Kun p→ 0, niinv>z− z>z ≥ 0.

Koska z>z = ‖z‖2, niinv>z ≥ ‖z‖2

ja koska ‖z‖2 = 2c, niin sijoittamalla tämä yhtälöön saadaan

v>z ≥ 2c.

17

Nyt z ∈ K, eli z 6= 0, joten c > 0, jolloin varmasti pätee

v>z > c.

Ollaan nyt näytetty, että on olemassa z ∈ Rn ja c ∈ R siten, että z>v > c > 0kaikilla v ∈ K.

Esitellään ja todistetaan seuraavaksi minimax-lemma, jota käytetään apu-na minimax-lauseen todistamisessa.

Lemma 3.2 (Minimax). Olkoot X, Y ⊂ R rajoitettuja ja suljettuja joukkoja.Olkoon lisäksi (x,y) ∈ X × Y ja funktio f : X × Y → R jatkuva molempienkoordinaattien suhteen. Tällöin

maxx∈X

miny∈Y

f(x,y) ≤ miny∈Y

maxx∈X

f(x,y).

Todistus. Koska joukot X ja Y ovat suljettuja ja rajoitettuja, niin myösjoukko X × Y on suljettu sekä rajoitettu. Perustellaan tämä lyhyesti.

Koska joukko X on rajoitettu, niin kaikille x ∈ X löytyy M ∈ R siten,että ‖x‖ ≤ M . Samasta syystä myös jokaiselle y ∈ Y löytyy N ∈ R siten,että ‖y‖ ≤ N . Pisteparille (x,y) ∈ X × Y pätee tällöin kolmioepäyhtälönnojalla

‖(x,y)‖ ≤ ‖(x, 0)‖+ ‖(0,y)‖ja tästä saadaan edelleen, että

‖(x, 0)‖+ ‖(0,y)‖ ≤M +N.

Näin ollen ollaan saatu, että ‖(x,y)‖ ≤M+N eli joukkoX×Y on rajoitettu.Koska joukot X ja Y ovat suljettuja, on tällöin niiden komplementit avoi-

mia joukkoja. Pistepari (x′,y′) ∈ (X × Y )C voi sijoittua komplementtijouk-koon jollakin seuraavista tavoista:

1. x′ ∈ XC ja y′ ∈ Y C

2. x′ ∈ XC ja y′ ∈ Y

3. x′ ∈ X ja y′ ∈ Y C

18

Kuva 4: Eri tavat, miten piste voi sijoittua joukon X×Y komplementtijouk-koon kahdessa ulottuvuudessa.

Kuvassa 4 on joukko X × Y , sen komplementtijoukko sekä yllä listatuttilanteet, kun X × Y ⊂ R2. Kaikissa tapauksissa komplementtijoukko onvarmasti avoin, sillä pistepari (x′,y′) keskipisteenä saadaan jollakin r > 0avoin pallo B((x′,y′), r) siten, että B((x′,y′), r)∩ (X × Y ) = ∅. Tämä siksi,että avoin pallo B((x′,y′), r) on mahdollista ottaa siten, että siellä ei oleyhtään joukon X pistettä tai joukon Y pistettä. Perustellaan tämä kuvan 4mukaisessa tilanteessa, jossa X = [a, b] ja Y = [c, d]. Jos nyt pistepari (x′, y′)on sijoittunut siten, että x′ < a, niin voidaan valita r = (a − x′)/2. Pistevoi olla sijoittunut myös siten, että x′ > b, y′ < c tai y′ > d. Kaikissa näissätilanteissa voidaan löytää sopiva säde samalla tavalla kuin tilanteessa, jossax′ < a.

Olkoon (x∗,y∗) ∈ X × Y . Jatkuva kuvaus f saavuttaa miniminsä jamaksiminsa suljetussa ja rajoitetussa joukossa X×Y ([3], lause 2.67). Lisäksitällöin minimi on kuvauksen f infimum ja maksimi on supremum kyseisessäjoukossa. Näin ollen

f(x∗,y∗) ≤ supx∈X

f(x,y∗)

jaf(x∗,y∗) ≥ inf

y∈Yf(x∗,y).

19

Näistä seuraa edelleen, että

infy∈Y

f(x∗,y) ≤ supx∈X

f(x,y∗). (1)

Koska tämä pitää paikkansa kaikille x∗ ∈ X ja kaikille y∗ ∈ Y , pätee semyös yhtälön (1) vasemman puolen supremumille ja oikean puolen infimu-mille. Tällöin

supx∈X

infy∈Y

f(x,y) ≤ infy∈Y

supx∈X

f(x,y).

Koska suljetussa ja rajoitetussa joukossa infimum on minimi ja supremumon maksimi, ollaan saatu

maxx∈X

miny∈Y

f(x,y) ≤ miny∈Y

maxx∈X

f(x,y),

kuten haluttiin.

3.2 Von Neumannin minimax-lauseKaikki tarvittavat esitiedot von Neumannin minimax-lauseen todistusta var-ten on käsitelty, joten se voidaan nyt muotoilla ja todistaa. Von Neumanninminimax-lauseen mukaan pelaajan saavuttama voitto on saman suuruinenriippumatta siitä, kumpi pelaaja optimoi strategiansa ensin.

Lause 3.3 (Von Neumannin minimax-lause). Olkoon Am×n kahden pelaajannollasummapelin voittomatriisi ja ∆m = {x ∈ Rm | x ≥ 0,∑xi = 1},∆n = {y ∈ Rn | y ≥ 0,∑ yj = 1} pelaajien strategioiden joukot. Tällöin

maxx∈∆m

miny∈∆n

x>Ay = miny∈∆n

maxx∈∆m

x>Ay.

Tätä kutsutaan kyseisen nollasummapelin arvoksi.

Todistus. Lemman 2.2 perusteella joukot ∆m ⊂ Rm ja ∆n ⊂ Rn ovat suljettu-ja ja rajoitettuja. Perustellaan nyt, että funktio f : ∆m×∆n → R, f(x,y) =x>Ay on jatkuva muuttujien x ja y suhteen.

Tarkastellaan funktiota f ensin muuttujan x suhteen ja pidetään y va-kiona. Olkoot ε, δ ∈ R. Jotta funktio fx(x) = x>Ay olisi jatkuva joukossa∆m ×∆n, jokaiselle ε > 0 pitää löytyä δ > 0 siten, että

|fx(x)− fx(x0)| < ε, kun ||x− x0|| < δ.

20

Nyt ‖Ay‖ 6= 0, sillä jos ‖Ay‖ = 0, niin ||x>Ay − x>0 Ay|| = 0 ja tällöinvarmasti pienempi kuin mikä tahansa nollaa suurempi ε. Voidaan tällöinvalita δ = ε

‖Ay‖ . Lasketaan sitten lauseke |fx(x)− fx(x0)|, jolloin saadaan

|fx(x)− fx(x0)| = ||x>Ay− x>0 Ay||= ||(x− x0)>Ay||≤ ||(x− x0)>|| · ||Ay||.

Koska ‖x− x0‖ < δ ja δ = ε‖Ay‖ , niin

|fx(x)− fx(x0)| < ε

||Ay||· ||Ay||,

joka laskemalla saadaan

|fx(x)− fx(x0)| < ε,

joten funktio fx on jatkuva pisteessä x0 ∈ ∆m. Sama päättely voidaan toistaamyös funktiolle fy pisteessä y0 ∈ ∆n, jolloin myös se saadaan osoitettuajatkuvaksi joukossa ∆n.

Funktion f jatkuvuudesta ja joukkojen ∆m ja ∆n ominaisuuksista johtuensuunta

maxx∈∆m

miny∈∆m

x>Ay ≤ miny∈∆n

maxx∈∆m

x>Ay

seuraa suoraan lemmasta 3.2.Näytetään seuraavaksi, että

maxx∈∆m

miny∈∆m

x>Ay ≥ miny∈∆n

maxx∈∆m

x>Ay.

Tämän todistamiseksi tehdään vastaoletus

maxx∈∆m

miny∈∆n

x>Ay < λ < miny∈∆n

maxx∈∆m

x>Ay.

Määritellään uusi peli, jossa voittomatriisin A alkioille pätee, että aij = aij−λ. Tällöin vastaoletuksen perusteella saadaan

maxx∈∆m

miny∈∆n

x>Ay < 0 < miny∈∆n

maxx∈∆m

x>Ay. (2)

21

Jokainen toisen pelaajan strategia y ∈ ∆n antaa voittovektorin Ay ∈ Rm.Olkoon K sellainen joukko vektoreita u, joille on olemassa voittovektori Aysiten, että u dominoi vektoria Ay. Siis

K = {u = Ay + v | y ∈ ∆n,v ∈ Rm,v ≥ 0}.

Osoitetaan seuraavaksi, että muodostettu joukko K on konveksi. Joukon Kkonveksisuuden osoittamiseksi selvitetään kuuluuko pu1 +(1−p)u2 joukkoonK, kun u1,u2 ∈ K ja p ∈ [0, 1]. Tätä varten tutkitaan lauseketta pu1 + (1−p)u2, joka auki laskemalla saadaan

pu1 + (1− p)u2 = p(Ay1 + v1) + (1− p)(Ay2 + v2)= pAy1 + pv1 + Ay2 + v2 − pAy2 − pv2

= Apy1 + A(1− p)y2 + pv1 + (1− p)v2

= A(py1 + (1− p)y2) + pv1 + (1− p)v2.

Koska ∆n on konveksi, niin py1 + (1 − p)y2 ∈ ∆n. Lisäksi koska p ∈ [0, 1],niin pv1 + (1 − p)v2 ≥ 0 ja kuuluu myös joukkoon Rm. Näin ollen ollaansaatu

pu1 + (1− p)u2 = Ay + v,

eli joukon K määritelmän mukaan pu1 +(1−p)u2 ∈ K, jolloin K on konveksijoukko.

Osoitetaan vielä, että joukko K on suljettu. Tiedetään, että joukko ∆n

on suljettu ja rajoitettu joukko. Nyt kuvaus y 7→ Ay + v on lineaarikuvauk-sena jatkuva kuvaus. Jatkuva kuvaus kuvaa suljetun ja rajoitetun joukonsuljetuksi ja rajoitetuksi joukoksi ([3], lause 2.66).

Lisäksi 0 6∈ K, sillä jos 0 ∈ K, olisi jokin strategia y ∈ ∆n siten, ettäAy ≤ 0, jolloin mille tahansa x ∈ ∆m pätee x>Ay ≤ 0, joka on ristiriidassayhtälön (2) oikean puolen kanssa.

Näin ollen joukko K täyttää lauseen 3.1 ehdot, jolloin saadaan z ∈ Rm

ja c > 0 siten, että 0 < c < z>w kaikille w ∈ K. Tällöin

z>(Ay + v) > c > 0 kaikille y ∈ ∆n, v ≥ 0. (3)

Jos zj < 0 jollain j, niin voitaisiin valita y ∈ ∆n siten, että z>Ay + ∑i zivi

olisi negatiivinen, joka olisi ristiriidassa yhtälön (3) kanssa. Näin ollen pitääolla zj ≥ 0 kaikilla j.

22

Saman ehdon mukaan kaikki koordinaatit zi eivät voi olla nollia. Tämätarkoittaa sitä, että

s =m∑i=1

zi > 0,

joten merkitään nyt

x = 1s

(z1, . . . , zm) = 1s

z ∈ ∆m.

Koskaz>(Ay + v) > c > 0 kaikille y ∈ ∆n,v ≥ 0,

niin tämä pätee myös silloin, kun v = 0. Näin ollen

z>Ay > c > 0

ja sijoittamalla z = sx yhtälöön ja jakamalla sitten luvulla s saadaan

x>Ay >c

s> 0.

Tämä on kuitenkin ristiriidassa yhtälön (2) kanssa, sillä sen mukaan pelaaja1 saisi parhaimmillaan negatiivisen voiton. Näin ollen vastaoletus

maxx∈∆m

miny∈∆n

x>y < λ < miny∈∆n

maxx∈∆m

x>y

ei voi pitää paikkaansa, mistä seuraa, että

maxx∈∆m

miny∈∆n

x>Ay = miny∈∆n

maxx∈∆m

x>Ay.

Havainnollistetaan sitten minimax-lausetta esimerkin avulla.

Esimerkki 3.3. Palataan esimerkkiin 3.1, jossa pelaajan 1 optimaaliseksistrategiaksi selvitettiin x = (2

3 ,13) ja pelaajan 2 optimaaliseksi strategiaksi

selvitettiin y = (23 ,

13). Merkitään tämän esimerkin ja kaikkien tulevien esi-

merkkien laskuissa strategioita pystyvektoreilla, jotta niitä on helppo käyttäälaskuissa matriisien kanssa. Von Neumannin minimax-lauseen mukaan pelaa-jan 1 odotettu voitto on yhtäsuuri kuin pelaajan 2 odotettu häviö. Voitto-matriisi pelaajalle 1 on tässä pelissä

A =[1 00 2

].

23

Selvitetään pelaajan 1 odotettu voitto optimaalisella strategialla x = (23 ,

13),

joka on

x>Ay =[

23

13

[1 00 2

[y1y2

]

=[

23

23

[y1y2

]

= 23(y1 + y2)

= 23 .

Pelaajan 2 strategiasta riippumatta pelaaja 1 saavuttaa optimaalisella strate-giallaan odotetun voiton 2

3 . Lasketaan seuraavaksi pelaajan 2 odotettu voittooptimaalisella strategialla y = (2

3 ,13), jolloin

y>Bx =[

23

13

[−1 00 −2

[x1x2

]

=[−2

3 −23

] [x1x2

]

= −23(x1 + x2)

= −23 .

Saadaan pelaajan 2 odotetuksi voitoksi optimaalisella strategialla −23 . Nyt

pelaajien odotetut voitot summautuvat nollaksi, niin kuin nollasummapelissäkuuluukin. Lukua 2

3 kutsutaan tämän kyseisen nollasummapelin arvoksi.

4 Yleiset summapelitKaikissa summapeleissä pelaajien voitot eivät kuitenkaan summaudu nollak-si. Tällaisissa yleisissä summapeleissä voitot voivat sen sijaan olla esimerkiksiyhtä suuret molemmille pelaajille.

Tässä luvussa aloitetaan yleisten summapelien käsittely kahden pelaa-jan tapauksilla. Aluksi esitellään peliteoriassa tunnettu esimerkki haukka-kyyhky -tyyppisestä pelistä. Kun yleisten summapelien idea on käynyt esi-merkistä ilmi, muotoillaan Nashin tasapainon määritelmä kahdelle pelaajal-

24

le. Nashin tasapainon määritelmän yhteydessä esitellään lisää esimerkkejäkahden pelaajan summapeleistä, joista etsitään Nashin tasapainoa.

Kahden pelaajan pelien jälkeen käsitellään useamman pelaajan yleisiäsummapelejä, joille määritellään myös Nashin tasapaino. Lopuksi tässä lu-vussa esitellään ja todistetaan Nashin lause, jonka mukaan kaikissa vähintäänkahden pelaajan peleissä on Nashin tasapaino.

Tässä luvussa käytetään pääasiallisena lähteenä Yuval Peresin luentomo-nistetta Game Theory, Alive [8].

4.1 Kahden pelaajan yleiset summapelitTässä luvussa käsitellään yksinkertaisia kahden pelaajan yleisiä summapele-jä, joiden avulla on helppo perehtyä yleisiin summapeleihin. Aloitetaan esit-telemällä haukka-kyyhky -peli, jota käytetään jatkossa useissa esimerkeissä.Yuval Peresin luentomonisteen lisäksi tämän pelin määrittelyssä ja esimerk-kien muotoilussa on käytetty apuna Jörgen Weibullin teosta EvolutionaryGame Theory [10] sekä lukua Evolutionary Game Theory kirjasta Social Be-haviour: Genes, Ecology and Evolution [5].

Esimerkki 4.1 (Haukka-kyyhky). Haukka-kyyhky -tyyppisessä pelissä kum-mallakin yksilöllä on kaksi erilaista puhdasta strategiaa, jotka kuvastavatkäyttäytymisen tyyppiä. Haukka-tyypin käyttäytyminen on aggressiivisem-pi kuin kyyhky-tyypin käyttäytyminen. Oletetaan nyt, että pelissä on kysekilpailutilanteesta, jossa kilpailun kohteena on arvoltaan V oleva resurssi,joka voi olla esimerkiksi ravintoa tai pesintäpaikka. Mikäli kaksi haukkaataistelevat toisiaan vastaan, toinen voittaa ja saa käyttöönsä koko resurssin.Molemmilla yksilöillä on yhtä suuri todennäköisyys voittaa kilpailu, jolloinkummallekin odotettu voitto on V/2 − C, missä C on taistelun aiheuttamahaitta. Haukan ja kyyhkyn välisessä vuorovaikutuksessa haukka saa käyt-töönsä koko resurssin, sillä kyyhky luovuttaa automaattisesti. Kyyhky ei siissaa voittoa resurssista, mutta sille ei aiheudu myöskään haittaa kilpailus-ta. Kahden kyyhkyn välisessä vuorovaikutuksessa yksilöt puolestaan jakavatresurssin ilman taistelua, jolloin odotettu voitto kummallekin on V/2.

Muodostetaan näiden tietojen avulla pelin voittomatriisiksi

A =[V/2− C V

0 V/2

].

25

Tulevissa haukka-kyyhky -tyyppisissä esimerkeissä matriisiksi otetaan

A =[−1 40 2

],

jossa V = 4 ja C = 3. Haukka-kyyhky -pelissä matriisi on sama molemmillepelaajille, jolloin kyseessä on niin sanottu symmetrinen peli, joka määritel-lään seuraavaksi kahden pelaajan peleille.

Määritelmä 4.1. Kahden pelaajan yleinen summapeli on symmetrinen, josm = n ja voittomatriiseille pätee

Aij = Bji kaikilla i, j ∈ {1, 2, . . . , n}.

Symmetrisessä pelissä molempien pelaajien vaihtoehtojen määrä on yhtä-suuri ja molemmat pelaajat saavat samanlaisella strategiayhdistelmällä yh-täsuuren voiton. Myös strategiapari voi olla symmetrinen, jolloin molempienpelaajien käyttämät strategiat ovat samat.

Määritelmä 4.2. Olkoon x ∈ ∆m, y ∈ ∆n ja m = n. Strategiapari (x,y)on symmetrinen jos xi = yi kaikille i = 1, . . . , n.

4.1.1 Nashin tasapaino kahdelle pelaajalle

Tässä luvussa määritellään ensin Nashin tasapaino yleisesti kahdelle pelaa-jalle, minkä jälkeen määritellään erikoistapaus, puhdas Nashin tasapaino.Määritelmien jälkeen esitellään useita symmetristen pelien esimerkkejä, jois-sa käsitellään Nashin tasapainoa.

Määritelmä 4.3 (Nashin tasapaino). Pistepari (x, y), jossa x ∈ ∆m jay ∈ ∆n, määrää Nashin tasapainon, jos kumpikaan pelaaja ei saavuta voittoapoikkeamalla siitä yksipuolisesti. Siis

x>Ay ≥ x>Ay

kaikille x ∈ ∆m jay>Bx ≥ y>Bx

kaikille y ∈ ∆n. A ∈ Rm×n ja B ∈ Rn×m ovat tässä pelaajien 1 ja 2 voitto-matriisit.

26

Yllä olevassa määritelmässä sallitaan strategioiden olevan sekä puhtaitastrategioita että sekastrategioita, mutta Nashin tasapaino voidaan määritellämyös pelkästään puhtaille strategioille:

Määritelmä 4.4. Puhtaaksi Nashin tasapainoksi kutsutaan Nashin tasapai-noa, jonka jokaiselle strategialle x pätee, että xi = 1 jollakin i = 1, . . . , n jaxj = 0 kaikilla j 6= i.

Esitellään seuraavaksi kaksi esimerkkiä siitä, kuinka symmetrisissä kah-den pelaajan peleissä voidaan etsiä Nashin tasapainoa. Näissä kahdessa esi-merkissä löytyvät sekä puhtaat että yleiset Nashin tasapainot, mutta kaikis-ta peleistä ei välttämättä löydy puhdasta Nashin tasapainoa. Tällaisestakinpelistä on esimerkki viimeiseksi.

Esimerkki 4.2 (Haukka-kyyhky). Palataan esimerkissä 4.1 esiteltyyn haukka-kyyhky -peliin. Tässä pelissä voittomatriisiksi oli määritelty

A =[−1 40 2

].

Tästä nähdään helposti, että kaksi haukka-strategiaa käyttävää yksilöäaiheuttavat haittaa toisilleen (negatiivinen voitto). Haukka-strategiaa käyt-tävä sen sijaan saavuttaa voiton pelatessaan kyyhky-strategiaa käyttäväävastaan (matriisin alkio a12 = 4). Kyyhky-strategiaa käyttävä puolestaanei voita eikä häviä haukkaa vastaan pelatessaan (matriisin alkio a21 = 0).Lopuksi matriisin alkiosta a22 = 2 nähdään, että molemmat yksilöt saavatvoittoa, kun ne käyttävät kyyhky-strategiaa.

Merkitään puhdasta strategiaa (1, 0) kirjaimella h (yksilö pelaa haukka-strategiaa) ja puhdasta strategiaa (0, 1) kirjaimella k (yksilö pelaa kyyhky-strategiaa). Selvitetään löytyykö pelistä puhdasta Nashin tasapainoa jollakinstrategiayhdistelmällä. Alla on taulukoituna strategiayhdistelmät ja vastaa-vat odotetut voitot.

(h,h) (−1,−1)(k,h) (0, 4)(h,k) (4, 0)(k,k) (2, 2)

27

Taulukosta on nähtävissä, että yhdistelmässä (k,h) strategialla h pelaa-van ei kannata vaihtaa strategiaansa, sillä odotettu voitto pienenisi tällöin.Myöskään strategiaa k pelaavan ei kannata vaihtaa strategiaansa, sillä voittopienenisi myös tällöin. Samat perustelut pätevät myös strategiayhdistelmälle(h,k), joten haukka-kyyhky -pelissä on kaksi puhdasta Nashin tasapainoa;(k,h) ja (h,k).

Puhtaiden Nashin tasapainojen lisäksi pelistä löytyy myös yleinen (sym-metrinen) Nashin tasapaino, jota etsitään seuraavaksi. Merkitään nyt toi-sen yksilön strategiaa x = (p, 1 − p), jossa p on todennäköisyys, että yksilökäyttää haukka-strategiaa. Lasketaan odotetut voitot ensimmäiselle yksilöl-le molemmilla puhtailla strategioilla. Strategiaa h käyttäen odotettu voittoensimmäiselle yksilölle on

h>Ax =[1 0

] [−1 40 2

] [p

1− p

]

=[−1 4

] [p

1− p

]= −5p+ 4.

Ja strategiaa k käyttäen odotettu voitto yksilölle 1 on

k>Ax =[0 1

] [−1 40 2

] [p

1− p

]

=[0 2

] [p

1− p

]= 2− 2p.

Kuvassa 5 näkyy suorina yksilön 1 saavuttama voitto pelatessa haukka-tai kyyhkystrategialla yleistä strategiaa x käyttävää yksilöä 2 vastaan. Näi-den suorien leikkauspisteestä löytyy se luvun p arvo, jolla saavutetaan Nas-hin tasapaino. Lukua 2

3 suuremmilla p:n arvoilla pelaajan 1 kannattaa käyt-tää haukka-strategiaa ja pienemmillä arvoilla taas kyyhky-strategiaa. Lukup = 2

3 on siis tasapainokohta, joka antaa yhtäsuuren voiton kummallakin stra-tegialla. Nashin tasapainon strategiaksi saadaan siten x = (2

3 ,13). Nyt millä

tahansa strategialla saa tätä strategiaa vastaan voiton 23 , mutta molempien

yksilöiden pitää käyttää strategiaa x, jotta tasapaino säilyy. Jos toinen yk-silö käyttäisi esimerkiksi pelkkää kyyhky-strategiaa, strategiaa x käyttävänyksilön kannattaisi muuttaa strategiaansa kohti haukka-strategiaa. Tällöin

28

Kuva 5: Yksilön 1 ansaitsema voitto pelatessa haukka- tai kyyhkytaktiikallayleistä strategiaa (p, 1− p) käyttävää yksilöä 2 vastaan.

kyseessä ei olisi enää Nashin tasapaino. Näin ollen yleinen Nashin tasapainolöytyy strategiayhdistelmällä (x,x).

Esimerkki 4.3. Kaksi gepardia jahtaa kahta erikokoista antilooppia. Suu-rempi on kooltaan l ja pienempi on kooltaan s. Jos gepardit valitsevat samanantiloopin, ne joutuvat jakamaan saaliinsa. Voitot kummallekin gepardillekaikissa tilanteissa on esitelty alla olevassa taulukossa.

yksilö 2yksilö 1 l s

l ( l2 ,l2) (l, s)

s (s, l) ( s2 ,s2)

Jos suurempi antilooppi on ainakin kaksi kertaa pienemmän antiloopinkokoinen eli l ≥ 2s, niin kannattaa aina valita suurempi antilooppi. Tut-kitaan siksi vain tilannetta, jolloin s < l < 2s. Tällöin on kaksi puhdasta

29

Nashin tasapainoa (l, s) ja (s, l), joissa l = (1, 0) ja s = (0, 1). Strategias-sa l yksilö valitsee varmasti suuremman antiloopin ja strategiassa s yksilövalitsee varmasti pienemmän antiloopin. Strategiayhdistelmässä (l, s) ensim-mäinen gepardi valitsee varmasti suuremman antiloopin ja toinen gepardivalitsee varmasti pienemmän antiloopin. Strategiayhdistelmässä (s, l) ensim-mäinen gepardi valitsee varmasti pienemmän antiloopin ja toinen gepardivalitsee varmasti suuremman antiloopin. Kummassakin tilanteessa kumman-kaan gepardin ei kannata poiketa strategiasta ja valita toista antilooppia,sillä tällöin gepardit joutuisivat jakamaan antiloopin, jolloin voittoa tuleemaksimissaan l

2 , mikä on vähemmän kuin pienemmästä antiloopista saatavavoitto s.

Lasketaan sitten strategiayhdistelmällä (l, s) saatava voitto ensimmäisellegepardille. Tällöin ensimmäisen gepardin strategia l = (1, 0), toisen gepardinstrategia s = (0, 1) ja ensimmäisen gepardin maksumatriisi A on

A =[l2 ls s

2

].

Tarkastellaan voiton määrittävää lauseketta

l>As.

Sijoitetaan strategioiden paikalle vastaavat vektorit ja käytetään matriisinaensimmäisen gepardin voittomatriisia. Tällöin lausekkeesta saadaan

[1 0

] [l2 ls s

2

] [01

]= l.

Nyt l on suuremman antiloopin koko ja siten suurin mahdollinen voitto. Mi-kään toinen ensimmäisen gepardin puhdas strategia ei voi tuottaa suurempaavoittoa. Samaan tulokseen päädytään, jos tarkastellaan samaa strategiayh-distelmää toiselle gepardille tai strategiayhdistelmää (s, l) kummalle tahansagepardeista.

Strategiaa s käyttävälle voitto saadaan puolestaan laskettua kaavalla

sAl =[0 1

] [l2 ls s

2

] [10

],

josta voitoksi saadaan s. Mikäli strategiaa s käyttävä gepardi vaihtaisi stra-tegiaan l, saisi hän voitokseen vain l

2 , joka on aidosti pienempää kuin s. Näin

30

ollen myöskään strategiaa s käyttävän ei kannata vaihtaa toiseen puhtaaseenstrategiaan.

Miten tilanne muuttuu, kun jokin tietty osa populaatiosta jahtaa var-masti suurempaa antilooppia ja loput pienempää? Olkoon nyt p se osa po-pulaatiosta, joka jahtaa suurempaa antilooppia. Tämä luku on samalla myöstodennäköisyys sille, että satunnainen yksilö populaatiosta jahtaa suurem-paa antilooppia. Jos ensimmäinen gepardi jahtaa suurempaa antilooppia to-dennäköisyydellä p, toisen gepardin odotettu voitto suurempaa antilooppiajahtaamalla on

l

2p+ (1− p)l.

Pienempää antilooppia jahtaamalla toisen gepardin odotettu voitto puo-lestaan on

ps+ (1− p)s2 .

Yleinen Nashin tasapaino löytyy tilanteesta, jolloin nämä odotetut voitotovat yhtäsuuret, kuten edellisessäkin esimerkissä. Kun odotetut puhtaidenstrategioiden l ja s odotetut voitot l

2p+ (1− p)l sekä ps+ (1− p) s2 asetetaanyhtäsuuriksi, niin saadaan ratkaistua

p = 2l − sl + s

.

Koska p on todennäköisyys sille, että ensimmäiden gepardi jahtaa suurempaaantilooppia, saadaan ensimmäisen gepardin strategiaksi x = (2l−s

l+s , 1−2l−sl+s ).

Löydettiin siis Nashin tasapaino sekä puhtailla strategioilla että sekastra-tegioilla. Puhtaiden Nashin tasapainojen strategiayhdistelmät ovat (l, s) ja(s, l). Yleinen tasapaino löytyy strategiayhdistelmällä, jossa molemmat ge-pardit käyttävät strategiaa x = (2l−s

l+s , 1−2l−sl+s ).

Aina pelissä ei kuitenkaan ole puhdasta Nashin tasapainoa. Tunnettukivi-sakset-paperi -peli on hyvä esimerkki tämäntyyppisestä pelistä.

Esimerkki 4.4. Käytetään esimerkkinä kahden pelaajan kivi-sakset-paperi-peliä. Tässä pelissä ei ole puhdasta Nashin tasapainoa, minkä näkee helpostikäsittelemällä kaikki tilanteet läpi:

• kivi-kivi: jomman kumman pelaajan kannattaa pelata ennemmin pa-peri

• kivi-paperi: ensimmäisen pelaajan kannattaa pelata sakset tai paperi

31

• kivi-sakset: toisen pelaajan kannattaa pelata paperi tai kivi

• paperi-paperi: jomman kumman pelaajan kannattaa pelata sakset

• paperi-sakset: ensimmäisen pelaajan kannattaa pelata kivi tai sakset

• sakset-sakset: jomman kumman pelaajan kannattaa pelata kivi

Vaikka puhdasta Nashin tasapainoa ei löydykään, on tässä pelissä siltiyleinen Nashin tasapaino. Olkoon nyt voittomatriisi pelaajalle 1

A =

0 −1 11 0 −1−1 1 0

.Merkitään todennäköisyyksiä, että pelaaja 2 pelaa kiven, paperin tai sak-

set kirjaimilla p1, p2, p3. Tällöin p1+p2+p3 = 1, sillä yhteenlasketun todennä-köisyyden tulee olla 1. Lasketaan sitten odotetut voitot puhtaita strategioitakäyttävälle pelaajalle 1 kuten aikaisemmissakin esimerkeissä. Kiveä pelates-saan pelaajan 1 odotettu voitto on

−p2 + p3. (4)

Paperia pelatessaan pelaajan 1 odotettu voitto on

p1 − p3 (5)

ja saksia pelatessaan pelaajan 1 odotettu voitto on

−p1 + p2. (6)

Yleinen Nashin tasapaino löytyy aikaisempien esimerkkien tavoin tilan-teesta, jossa nämä kaikki kolme odotettua voittoa ovat yhtäsuuret. Asetta-malla siis esimerkiksi lausekkeet (6) ja (5) yhtäsuuriksi ja sijoittamalla yh-tälöstä p1 + p2 + p3 = 1 saatu p2 tähän yhtälöön, saadaan p1 = 1

3 . Kuntämä sijoitetaan yhtälöön, joka saadaan asettamalla lauseke (4) ja (5) yhtä-suuriksi, saadaan p2 = 1

3 . Koska p1 + p2 + p3 = 1, niin saadaan että myösp3 = 1

3 .Sopivaksi strategiaksi saadaan siis x = (1

3 ,13 ,

13). Kuten aikaisemmissakin

esimerkeissä, Nashin tasapaino on se strategiayhdistelmä, jossa molemmatpelaajat käyttävät strategiaa x.

32

4.2 Useamman pelaajan summapelitTässä luvussa laajennetaan yleisten summapelien käsittely useamman pelaa-jan tapauksiin. Aloitetaan tutustuminen useamman pelaajan peleihin esimer-kin avulla, minkä jälkeen määritellään Nashin tasapaino useamman pelaajanpeleille. Tässä luvussa esitellään ja todistetaan myös tutkielman päätulos,Nashin lause.

Otetaan tässä luvussa käyttöön merkintä x(i) pelaajan i strategialle javastaavasti ∆(i)

n(i) pelaajan i kaikkien strategioiden joukolle. Tässä merkin-nässä n(i) kuvastaa pelaajan i eri vaihtoehtojen määrää eli strategiavektorindimensiota. Lisäksi merkitään pelaajan i puhtaiden strategioiden joukkoaPi. Määritellään myös pelaajakohtaiset voittofunktiot, jotka antavat odote-tun voiton pelaajalle useamman pelaajan peleissä.

Määritelmä 4.5. Pelaajan i voittofunktio puhtailla strategioilla on funktiofi : P1 × · · · × Pk → R, joka määrittelee jokaiselle mahdolliselle puhtaidenstrategioiden yhdistelmälle pelaajan i odotetun voiton.

Määritellään vielä toinen voittofunktio, joka antaa odotetun voiton jokai-selle strategiayhdistelmälle. Seuraavassa määritelmässä strategiat voivat siismyös olla sekastrategioita.

Määritelmä 4.6. Pelaajan i voittofunktio kaikilla strategioilla on funktioFi : ∆(1)

n(1) × · · · ×∆(k)n(k) → R, siten että

Fi(x(1), . . . ,x(k)) =∑

p(1)∈P1,...,p(k)∈Pk

(x(1) · p(1)) . . . (x(k) · p(k))fi(p(1), . . . ,p(k))

Esitellään nyt esimerkki useamman pelaajan pelistä. Tätä samaa peli-tyyppiä käytetään myöhemmin Nashin tasapainon määritelmän käsittelyssä.

Esimerkki 4.5. Kuvitteellisen lajin osapopulaation koko on k yksilöä. Osa-populaation yksilöt elävät yhteisössä, jossa aina osa yksilöistä vartioi kerättyäravintoa. Vartioinnista koituu vartioiville yksilöille hieman ylimääräistä hait-taa, mutta jos vähintään puolet yksilöistä ei vartioi, kaikille yksilöille koituusuurempaa haittaa.

Tässä esimerkissä puhutaan myös yksilön saavuttamista voitoista, vaikkakyseessä ei varsinaisesti ole voitto, vaan haitta. Tällainen haitta merkitäänkuitenkin negatiivisena voittona. Listataan mahdollisia tilanteita ja määrä-tään voitot:

33

• vartioinnista saatava voitto on -1

• jos yksilö ei itse vartioi, mutta vartioivia yksilöitä on riittävästi, tämänyksilön saavuttama voitto on 0

• jos liian vähän yksilöitä vartioi, voitto kaikille on -5

• jos tasan k/2 yksilöä vartioi, yhdenkään vartioivan ei kannata olla var-tioimatta, sillä voitoksi tulee tällöin −5

• jos vähintään k/2 yksilöä vartioi, yhdenkään ei-vartioivan ei kannataalkaa vartioimaan, sillä voitoksi tälle yksilölle tulee silloin −1

• jos vartioivia yksilöitä on enintään k/2− 2, kenenkään ei-vartioivan eikannata alkaa vartioimaan, sillä voitoksi tulee tällöin −6

• jos vartioivia yksilöitä on k/2− 1, yhden ei-vartioivan kannattaa alkaavartioimaan, jolloin voitoksi tulee −1

Tällaisessa tilanteessa voidaan löytää puhtaat Nashin tasapainot sellaisis-sa tilanteissa, jossa täsmälleen puolet yksilöistä toimii vartiossa tai kukaanei vartioi, sillä tällaisissa tilanteissa yhdenkään yksilön ei kannata muuttaastrategiaansa. Tätä pelimallia käytetään myöhemmin kolmen pelaajan esi-merkeissä.

4.2.1 Nashin tasapaino useammalle pelaajalle

Edellisessä luvussa käsiteltiin Nashin tasapainoa kahden pelaajan peleissä.Nashin tasapaino löytyy kuitenkin myös useamman pelaajan peleissä, mihinperehdytään tässä luvussa tarkemmin. Aloitetaan määrittelemällä puhdasNashin tasapaino.

Määritelmä 4.7. Olkoon Pi pelaajan i puhtaiden strategioiden joukko jai ∈ {1, . . . , k}. Puhdas Nashin tasapaino pelissä, jossa on k pelaajaa, onsellainen pelaajien puhtaiden strategioiden yhdistelmä

(p(1), . . . ,p(k)) ∈ P1 × · · · × Pk,

että jokaiselle i ∈ {1, . . . , k} ja p(i) ∈ Pi pätee

fi(p(1), . . . ,p(i−1), p(i),p(i+1), . . . ,p(k)) ≤ fi(p(1), . . . ,p(i−1),p(i),p(i+1), . . . ,p(k)).

34

Havainnollistetaan seuraavaksi puhtaan Nashin tasapainon määritelmääuseammalle pelaajalle esimerkin avulla.

Esimerkki 4.6. Laajennetaan hieman esimerkkiä 4.5. Olkoon meillä esi-merkkinä lauma, jossa on 3 yksilöä. Merkitään pelaajien joukkoa nyt {1, 2, 3}.Esimerkin 4.5 mukaan vähintään kahden yksilön on nyt vartioitava ruokaa,jotta lauma ei menettäisi sitä. Puhdas Nashin tasapaino löytyy siis tilanteis-sa, joissa kukaan ei vahdi ravintoa, merkitään (E,E,E) ja tilanteissa, joissakaksi yksilöä vahtii ravintoa, merkitään (V,V,E), (V,E,V) ja (E,V,V).

Oletetaan ensin, että kolmas yksilö ei vartioi ravintoa. Tällöin odotetuistamaksuista saadaan seuraavanlainen taulukko.

yksilö 2yksilö 1 V E

V (−1,−1, 0) (−6,−5,−5)E (−5,−6,−5) (−5,−5,−5)

Taulukosta nähdään kaikkien yksilöiden odotetut voitot yksilön 3 käyt-täessä puhdasta strategiaa E. Yksilön 1 voittomatriisi A1 on

A1 =[−1 −6−5 −5

],

yksilön 2 voittomatriisi A2 on

A2 =[−1 −5−6 −5

]

ja yksilön 3 voittomatriisi A3 on

A3 =[

0 −5−5 −5

].

Tarkistetaan, onko strategioiden joukko (E,E,E) todella Nashin tasapaino.Odotettu voitto yksilölle 1 tällä strategialla on

f1(E,E,E) =[0 1

] [−1 −6−5 −5

] [01

]= −5.

35

Odotettu voitto yksilölle 1 strategialla (V,E,E) puolestaan on

f1(V,E,E) =[1 0

] [−1 −6−5 −5

] [01

]= −6.

Tästä nähdään, että f1(E,E,E) > f1(V,E,E). Myös yksilölle 2 lasketutodotetut voitot ovat f2(E,E,E) = −5 > −6 = f2(E,V,E). Yksilölle 3voidaan laskea odotetut voitot samalla tavalla pitämällä jonkin toisen yksilönstrategia vakiona. Myös tällöin saataisiin odotetuiksi voitoiksi−5 ja−6, jotenyksilön 3 ei kannata vaihtaa strategiaansa.

Edellisessä esimerkissä laskettuja voittoja tutkiessa huomaa, että yksilötsaivat samanlaisella strategiayhdistelmällä yhtäsuuren voiton. Tällöin on ky-se jo tutusta symmetrisestä pelistä, joka määritellään nyt myös useammanpelaajan tapauksessa.

Määritelmä 4.8 (Symmetrinen peli). Olkoon i ∈ {1, . . . , k} ja p(i) ∈ Pi.Peli on symmetrinen jos jokaiselle i0, j0 ∈ {1, . . . , k} on olemassa joukon{1, . . . , k} permutaatio π siten, että π(i0) = j0 ja

fπ(i)(pπ(1), . . . ,pπ(k)) = fi(p(1), . . . ,p(k)).

Esimerkki 4.7. Tarkastellaan symmetrisen pelin määritelmää tarkemminkolmen pelaajan tapauksessa. Käytetään jälleen esimerkissä 4.5 esiteltyä pe-liä.

Pelaajien joukko on nyt {1, 2, 3} ja symmetrisen pelin määritelmän mu-kaan pitäisi löytyä jokaiselle sopiva permutaatio π. Olkoon meillä nyt per-mutaatio π, joka järjestää pelaajien joukon uudelleen seuraavasti:

• π(1) = 2

• π(2) = 3

• π(3) = 1.

Tällöin uudelleenjärjestetyksi pelaajien joukoksi saadaan {2, 3, 1}. Vali-taan nyt puhtaiksi strategioiksi p(1) = (1, 0), p(2) = (0, 1) ja p(3) = (1, 0),jolloin ensimmäinen yksilö vartioi, toinen ei ja kolmas vartioi. Symmetrisenpelin määritelmän mukaan tulisi nyt olla, että

fπ(1)(pπ(1),pπ(2),pπ(3)) = f1(p(1),p(2),p(3)). (7)

36

Nyt

fπ(1)(pπ(1),pπ(2),pπ(3)) = f2(p(2),p(3),p(1))

=[0 1

] [−1 −5−6 −5

] [10

]= −6.

Lisäksi

f1(p(1),p(2),p(3)) =[1 0

] [−1 −6−5 −5

] [01

]= −6.

Näin ollen määritelmän mukainen yhtälö (7) pitää paikkansa. Jotta pe-lin symmetrisyyden voisi varmasti todeta, pitäisi jokaisen pelaajan tilannetarkistaa erikseen. Laskut näissä tapauksissa menisivät vastaavasti. Tämänkyseisen pelin ominaisuuksia tutkiessa huomataan kuitenkin helposti, että jo-kainen pelaaja saa samanlaisella strategiakokoonpanolla yhtäsuuren voiton.Tällöin on kyse symmetrisestä pelistä.

Määritellään sitten yleinen Nashin tasapaino useammalle pelaajalle. Ylei-nen Nashin tasapaino eroaa puhtaasta Nashin tasapainosta siten, että ylei-sessä Nashin tasapainossa strategiat voivat olla myös sekastrategioita.

Määritelmä 4.9. Yleinen Nashin tasapaino pelissä, jossa on k pelaajaa, onsellainen strategiayhdistelmä

(x(1), . . . ,x(i−1),x(i),x(i+1), . . . ,x(k)) ∈ ∆(1)n(1) × · · · ×∆(k)

n(k),

että jokaiselle i ∈ {1, . . . , k} ja x(i) 6= x(i) pätee

Fi(x(1), . . . ,x(i−1), x(i),x(i+1), . . . ,x(k)) ≤ Fi(x(1), . . . ,x(i−1),x(i),x(i+1), . . . ,x(k)).

Määritellään lisäksi symmetrinen Nashin tasapaino, jossa jokaisen pelaa-jan käyttämä strategia on sama.

Määritelmä 4.10 (Symmetrinen Nashin tasapaino). Symmetrinen Nashintasapaino on sellainen strategiayhdistelmä

(x, . . . ,x) ∈ ∆(1)n × · · · ×∆(k)

n ,

37

että jokaiselle i ∈ {1, . . . , k} pätee

Fi(x, . . . , x, . . . ,x) ≤ Fi(x, . . . ,x),

kun x 6= x on pelaajan i strategia.

Käytetään jälleen esimerkissä 4.5 esiteltyä pelityyppiä. Aikaisemmin tällepelille etsittiin puhtaat Nashin tasapainot, etsitään sille nyt yleinen Nashintasapaino.

Esimerkki 4.8. Kyseessä on jälleen kolmesta yksilöstä koostuva lauma, jos-sa jokainen yksilö voi joko vartioida ruokavarastoja tai olla vartioimatta. Ol-koon nyt p1 todennäköisyys sille, että yksilö 1 vartioi ruokavarastoja, p2 jap3 vastaavasti yksilöiden 2 ja 3 vartioimiskäyttäytymisen todennäköisyyksiä

Oletetaan, että yksilö 3 vartioi ruokavarastoja. Tällöin tämän yksilönodotettu voitto on

F3 =[p1 1− p1

] [−1 −1−1 −6

] [p2

1− p2

]= −5p1p2 + 5p1 + 5p2 − 6.

Oletetaan sitten, että yksilö 3 ei vartioi ruokavarastoja. Tällöin yksilön 3odotettu voitto on

F3 =[p1 1− p1

] [0 −5−5 −5

] [p2

1− p2

]= 5p1p2 − 5.

Oletetaan sitten, että 0 < p3 < 1, koska etsitään tasapainoa sekastrategioilla.Asetetaan odotettujen voittojen lausekkeet yhtäsuuriksi, jolloin saadaan

−5p1p2 + 5p1 + 5p2 − 6 = 5p1p2 − 5

ja tätä edelleen sieventämällä

10p1p2 − 5p1 − 5p2 + 1 = 0.

Olettamalla myös, että 0 < p1 < 1 ja 0 < p2 < 1, saadaan laskettua odotetutmaksut myös yksilöille 1 ja 2 samaan tapaan kuin yksilölle 3. Kun selvitetään,milloin maksut ovat kummankin yksilön tapauksessa yhtäsuuret, saadaanyhtälöt

10p2p3 − 5p2 − 5p3 + 1 = 0

38

ja10p1p3 − 5p1 − 5p3 + 1 = 0.

Näistä kolmesta yhtälöstä saadaan yhtälöryhmä10p1p2 − 5p1 − 5p2 + 1 = 010p2p3 − 5p2 − 5p3 + 1 = 010p1p3 − 5p1 − 5p3 + 1 = 0

,

joka sievenee muotoon 5(p1 + p2 − 2p1p2) = 15(p2 + p3 − 2p2p3) = 15(p1 + p3 − 2p1p3) = 1

.

Tästä yhtälöryhmästä ratkaistaan todennäköisyydet p1, p2, p3. Vähentä-mällä kolmas yhtälö ensimmäisestä saadaan

5(p2 − p3)(1− 2p1) = 0,

jolloin on kaksi mahdollista ratkaisua. Joko p2 = p3 tai p1 = 12 . Jos p1 = 1

2 ,ensimmäisestä yhtälöstä saataisiin, että −3

2 +1 = 0, mikä ei pidä paikkaansa.Etsitään siis ratkaisua silloin, kun p2 = p3.

Toiseen yhtälöön sijoittamalla saadaan tällöin

10p22 − 10p2 + 1 = 0,

joka ratkaisemalla saadaan p2 = 12 ±

√15

10 . Molemmat vaihtoehdot olevatvälillä ]0, 1[. Sijoittamalla nämä joko ensimmäiseen tai kolmanteen yhtälöönsaadaan, että

p1 = 12 ±√

1510 .

Näin ollen ollaan löydetty tasapaino, kun p1 = p2 = p3. Aikaisemmin löy-dettyjen puhtaiden Nashin tasapainojen lisäksi löytyy siis yleinen Nashin ta-sapaino, kun kaikkien pelaajien strategiat ovat samoja. Tällöin kyseessä onmääritelmässä 4.10 määritelty symmetrinen Nashin tasapaino.

39

4.2.2 Nashin lause todistuksineen

Tässä luvussa muotoillaan ja todistetaan Nashin lause. Esitellään ensin Nas-hin lauseen todistamisessa tarvittava Brouwerin lause ja todistetaan se yhdes-sä ulottuvuudessa. Sekä Nashin lauseen että Brouwerin lauseen todistuksetseuraavat Yuval Peresin luentomonistetta [8].

Lause 4.1 (Brouwerin lause). Jos S ⊆ Rn on suljettu, konveksi ja rajoitettuja T : S → S on jatkuva, niin on olemassa x ∈ S siten, että T (x) = x.

Kuva 6: Brouwerin lause tapauksessa n = 1.

Todistus. Tapauksessa n = 1:Yksiulotteisessa tapauksessa joukko S on suljettu väli [a, b]. Nyt T : S →

S eli jatkuva kuvaus T kuvaa suljetun välin [a, b] suljetuksi väliksi [a, b].Näin ollen T (a) ≥ a ja T (b) ≤ b. Määritellään uusi kuvaus f : S → R,f(x) = T (x)− x. Nyt välin päätepisteissä pätee

f(a) = T (a)− a≥ 0

40

ja

f(b) = T (b)− b≤ 0.

Bolzanon lauseen nojalla tällöin on olemassa piste x ∈ S siten, että f(x) = 0,mistä seuraa, että T (x)− x = 0, eli T (x) = x.

Useammassa ulottuvuudessa lause on todistettu esimerkiksi Peresin luen-tomonisteessa ([8], s. 92).

Lause 4.2 (Nashin lause). Jokaisessa vähintään kahden pelaajan yleisessäsummapelissä on Nashin tasapaino.

Todistus. Todistetaan ensin kahden pelaajan tapauksessa, jossa on kaksivoittomatriisia Am×n sekä Bn×m. Matriisit on tässä todistuksessa lyhennettymuotoon A ja B.

Määritellään kuvaus F : S → S, missä S = ∆m × ∆n. Joukko ∆m onensimmäisen pelaajan strategioiden joukko ja joukko ∆n on toisen pelaa-jan strategioiden joukko. Tällöin S on lemman 2.1 sekä minimax-lemman3.2 yhteydessä todistettujen tulosten mukaan konveksi, suljettu ja rajoitet-tu joukko, sillä joukot ∆n ja ∆m ovat konvekseja, suljettuja ja rajoitettuja.Määritellään nyt

ci = ci(x,y) = max{A(i)y− x>Ay, 0},

missä x ∈ ∆m, y ∈ ∆n ja A(i) on matriisin A i:s rivi. Lisäksi

dj = dj(x,y) = max{x>B(j) − x>By, 0},

missä x,y ovat kuten edellä ja B(j) on matriisin B j:s sarake. Tässä ci ku-vastaa ensimmäisen pelaajan saavuttamaa voittoa pelatessaan strategian xsijaan puhtaan strategian i, mikäli tämä voitto on suurempaa kuin 0. Vas-taavasti dj kuvastaa toisen pelaajan saavuttamaa voittoa hänen pelatessaanstrategian y sijaan puhtaan strategian j, mikäli voitto on suurempaa kuin 0.

Olkoon nyt kuvaus F (x,y) = (x, y), jossa

xi = xi + ci1 + ∑m

k=1 ck, i ∈ {1, . . . ,m}

jayj = yj + dj

1 + ∑nk=1 dk

, j ∈ {1, . . . , n}.

41

Tällöin F (x,y) ∈ S, silläm∑i=1

xi =m∑i=1

xi + ci1 + ∑m

k=1 ck

=∑mi=1 xi + ∑m

i=1 ci1 + ∑m

k=1 ck

= 1.

Jokainen koordinaatti xi on varmasti myös suurempaa tai yhtäsuurta kuin0, sillä xi ≥ 0 sekä ci ≥ 0 kaikilla i. Sama pätee myös koordinaateille y.

Koska ci ja dj ovat jatkuvia koordinaattiensa x ja y suhteen, niin myöskuvaus F on koordinaattiensa x ja y suhteen jatkuva. Tällöin Brouwerinlauseen oletukset ovat voimassa, jolloin löytyy piste (x,y) ∈ S siten, että(x,y) = (x, y). Näille x ja y pätee, että ci = 0 kaikilla i ∈ {1, . . . ,m} jadj = 0 kaikilla j ∈ {1, . . . , n}. Osoitetaan väite ci = 0 kaikilla i ∈ {1, . . . ,m}vastaoletuksen c1 > 0 avulla. Tämän oletuksen nojalla A(1)y − x>Ay > 0,mistä seuraa, että A(1)y > x>Ay. Tämänhetkinen voitto pelaajalle 1 on

m∑i=1

xiA(i)y = x1A(1)y + · · ·+ xmA(m)y.

Koska A(1)y > x>Ay, niin on oltava jokin l ∈ {1, . . . ,m} siten, että xl > 0ja x>Ay ≥ A(l)y. Mikäli näin ei olisi, saataisiin

m∑i=1

xiA(i)y > x>Ay,

mikä ei pidä paikkaansa. Tällainen l pitää siis löytyä, jolloin cl = 0 luvun clmääritelmän mukaan. Näin ollen

xl = xl1 + ∑m

k=1 ck< xl,

mikä on ristiriita, sillä pisteiden (x,y) ja (x, y) piti olla samat. Sama perus-telu voidaan toistaa kaikille ci ja dj.

Koska ci = 0 kaikilla i = 1, . . . ,m ja ci = max{A(i)y− x>Ay, 0}, niin

A(i)y− x>Ay ≤ 0 kaikilla i.

Lisäämällä yhtälön molemmille puolille x>Ay saadaan

A(i)y ≤ x>Ay.

42

Nyt koska A(i)y kuvastaa ensimmäisen pelaajan saavuttamaa voittoa puh-taalla strategialla pi strategiaa y vastaan, niin

p>i Ay ≤ x>Ay kaikilla pi ∈ P1.

Samoilla perusteluilla voidaan näyttää myös, että

p>j Bx ≤ y>Bx kaikilla pj ∈ Pn.

Pisteparilla (x,y) saadaan siis paras mahdollinen voitto, joten kyseessä onNashin tasapaino.

Useamman kuin kahden pelaajan pelin todistus etenee idealtaan samallatavalla. Olkoon nyt i, j = 1, . . . , k, missä k on pelaajien lukumäärä. Merki-tään nyt, että c(j)

i (x(1), . . . ,x(k)) on pelaajan j saavuttama voitto vaihtamallastrategiasta x(j) puhtaaseen strategiaan i, mikäli tämä voitto on positiivinen.Lisäksi x(j) on pelaajan j strategia kyseisessä strategiayhdistelmässä. Määri-tellään lisäksi kuvaus F : S → S, missä S = ∆(1)

n(1)×· · ·×∆(k)n(k) ja kuvauksen

lausekkeeksi määrätään

F (x(1), . . . ,x(k)) = (x(1), . . . , x(k)), missä

x(j)i = x

(j)i + c

(j)i

1 + ∑n(j)k=1 c

(j)k

.

Koska S on suljettu, rajoitettu ja konveksi sekä kuvaus F on jatku-va samoin perustein, kuin kahdenkin pelaajan tapauksessa, niin Brouwe-rin lauseen oletukset ovat voimassa. Tällöin löytyy (x(1), . . . ,x(k)) siten, et-tä (x(1), . . . ,x(k)) = (x(1), . . . , x(k)). Tälle strategiayhdistelmälle pätee, ettäc

(j)i = 0 kaikilla j ∈ {1, . . . , k} ja i ∈ {1, . . . , n(j)}.

Kuten kahden pelaajan tapauksessa, tehdään myös nyt vastaoletus, ettäc

(j)1 > 0. Tämä tarkoittaa siis sitä, että pelaaja j saavuttaa suuremman voitonvaihtamalla yleisestä strategiasta x(j) puhtaaseen strategiaan (1, 0, . . . , 0).Matemaattisesti merkittynä tämä tarkoittaisi, että

Fj(x(1), . . . , (1, . . . , 0), . . . ,x(k)) > Fj(x(1), . . . ,x(j), . . . ,x(k)).

Huomataan myös, että pelaajan j saavuttama voitto kyseisellä strategiayh-distelmällä Fj(x(1), . . . ,x(j), . . . ,x(k)) voidaan kirjoittaa seuraavasti:

Fj(x(1), . . . ,x(j), . . . ,x(k))= Fj(x(1), . . . , (x(j)

1 , 0, . . . , 0), . . . ,x(k)) + · · ·+Fj(x(1), . . . , (0, . . . , 0, x(j)

n(j)), . . . ,x(k)).

43

On siis oltava jokin l ∈ {1, . . . , n(j)} siten, että x(j)l > 0 ja

Fj(x(1), . . . , (0, . . . , x(j)l , . . . , 0), . . . ,x(k))− Fj(x(1), . . . ,x(j), . . . ,x(k)) ≤ 0.

Luvun c(j)l määritelmän mukaan tulee olla c(j)

l = 0. Tästä seuraa, että

x(j)l = x

(j)l + c

(j)l

1 + ∑n(j)k=1 c

(j)k

= x(j)l

1 + ∑n(j)k=1 c

(j)k

< x(j)l ,

sillä c(j)1 > 0. Koska piste on valittu Brouwerin lauseen mukaan, pitäisi kui-

tenkin olla x(j)l = x

(j)l , joten vastaoletus c(j)

1 > 0 johtaa ristiriitaan. Tämäpäättely voidaan edelleen toistaa myös muille mahdollisille poikkeamille.

Näin ollen ollaan saatu, että c(j)i = 0 kaikille i ∈ Sj (pelaajan j puhtaiden

strategioiden joukko) ja j ∈ {1, . . . , k}. Tästä seuraa, että strategiayhdistel-mä (x(1), . . . ,x(k)) on etsitty Nashin tasapaino.Seuraus 4.3. Symmetrisessä pelissä on symmetrinen Nashin tasapaino.

Tätä seurauslausetta ei todisteta perusteellisesti, mutta esitellään lyhyes-ti todistuksen idea. Symmetrisen pelin tapauksessa todistus etenee kutenyleisessä tapauksessa, mutta kuvaus F : ∆(1)

n × · · ·×∆(k)n → ∆(1)

n × · · ·×∆(k)n

voidaan rajoittaa pelaajien kaikkien strategioiden joukon sijaan diagonaaliin

D = {(x(1), . . . ,x(k)) ∈ ∆(1)n ×· · ·×∆(k)

n | x(i) = x(j) kaikilla i, j ∈ {1, . . . , k}},

sillä symmetriseen tasapainoon vaaditaan, että kaikkien pelaajien käyttämätstrategiat ovat samoja.

Nashin lauseen todistusta seuraten Brouwerin lause antaa pisteen y jou-kossa D, joka on haettu symmetrinen Nashin tasapaino. Yksityiskohtia to-distuksen ideaan löytyy Yuval Peresin luentomonisteesta s. 87 [8].

5 Evoluutioekologiaa ja peliteoriaaPeliteoriaa sovelletaan myös muualla kuin matematiikassa. Tässä luvussa kes-kitytäänkin esittelemään, kuinka peliteoriaa voi soveltaa biologiassa ja erityi-sesti evoluutioekologiassa. Peliteoriaa on käytetty selittämään erilaisia vuo-rovaikutuksia eliöiden välillä ja sitä, kuinka nämä vuorovaikutukset voivat

44

muuttua ja kehittyä ajan saatossa. Esimerkiksi erilaisten lisääntymisstrate-gioiden mallintamiseen ja poikkeavien sukupuolijakaumien selittämiseen voikäyttää peliteoreettisia malleja [5, 10]. Populaatioiden dynamiikka riippuupopulaatioiden sekä ympäristön ominaisuuksista, esimerkiksi populaation ti-heydestä ja saatavilla olevien resurssien määrästä. Tässä työssä keskitytäänsiihen, kuinka muiden yksilöiden käyttämät strategiat vaikuttavat siihen, mi-kä on järkevä strategia yksittäisen yksilön kannalta ja millainen on ylipää-tään järkevä strategia evolutiivisessa kontekstissa.

Evoluutiopeliteorian käsittely aloitetaan tässä luvussa määrittelemälläevolutiivisesti tasapainoinen strategia, joka vakaissa olosuhteissa on parasmahdollinen strategia yksilölle. Tätä evolutiivisesti tasapainoisen strategianmääritelmää apuna käyttäen etsitään evolutiivisesti tasapainoista strategiaakahdesta eri pelimallista.

Tässä luvussa käsitellään vain kahden pelaajan symmetrisiä pelejä, jol-laisia pelit biologisessa kontekstissa usein ovat. Pelitilanne on tällöin useinjokin kilpailutilanne, jossa kaksi saman tai eri populaation yksilöä kohtaa-vat. Symmetrisissä peleissä voittomatriisit ovat molemmille pelaajille samatja käytetyissä esimerkeissä myös pelaajien puhtaat strategiat ovat samat. Pe-laajilla voi olla useita puhtaita strategioita, mutta tässä luvussa käytetyissäesimerkeissä niitä on vain kaksi tai kolme.

Pääasiallisina lähteinä tässä luvussa on käytetty teoksia Evolutionary Ga-me Theory [10], Game Theory, Alive [8] sekä lukua Evolutionary Game Theo-ry kirjasta Social Behaviour - Genes, Ecology and Evolution [5].

5.1 Evolutiivisesti tasapainoinen strategiaAloitetaan palauttamalla haukka-kyyhky -tyypin peli mieleen ja käytetääntätä pelityyppiä johdantona evolutiivisesti tasapainoiseen strategiaan.

Esimerkki 5.1 (Haukka-kyyhky). Aiemmin esitelty haukka-kyyhky -mallion klassinen esimerkki peliteorian soveltamisesta biologian alalla. Kirjallisuu-dessa tyypillisesti esiintyvä muoto matriisille määriteltiin jo esimerkissä 4.1,jossa se oli

A =[V/2− C V

0 V/2

],

missä V on kulloinkin kilpailtavana olevasta resurssista saatava hyöty ja Con kilpailusta aiheutuva haitta. Olkoon nyt p todennäköisyys sille, että yksilö

45

pelaa haukka-strategialla. Tällöin arvoista V ja C riippuu, mikä p on opti-maalisin. Jos V/2 ≥ C eli haukkaa vastaan kilpaillessa mahdollinen hyötyon suurempaa tai yhtä suurta kuin haitta, yksilön kannattaa aina kilpailla,jolloin p = 1.

Yksilölle optimaaliseen strategiaan vaikuttaa myös strategioiden jakau-ma populaatiossa. Oletetaan nyt, että V/2 < C. Jos kaikki populaatiossakäyttävät haukka-strategiaa, tunkeilevan yksilön kannattaa käyttää kyyhky-strategiaa, sillä voitoksi tulee tällöin automaattisesti 0 eikä V/2 − C. Jostaas populaatiossa vallalla on kyyhky-strategia, tunkeilijan kannattaa käyt-tää haukka-strategiaa, sillä tällöin tunkeilija voittaa aina kilpailun kohtee-na olevan resurssin. Millaisella strategiakoostumuksella voidaan sitten löytäätasapainokohta, jossa kumpikaan strategia ei ole oleellisesti toista parempi?

Kuva 7: Optimaalisen strategian muutos populaation strategiakoostumuksenmuuttuessa.

Tasapainokohta tilanteessa V/2 < C löytyy silloin, kun p = V2C . Aikaisem-

46

massa esimerkissä 4.2 havaittiinkin, että optimaalinen strategia oli juurikinmuotoa ( V

2C , 1 −V2C ) eli (2

3 ,13). Optimaalinen strategia riippuu siis oleelli-

sesti voittomatriisista, eikä kaikilla haukka-kyyhky -tyyppisillä peleillä olesiten samaa optimaalista strategiaa. Tämän voi huomata myös vertaamallakuvia 5 ja 7, joissa näkyvät odotettujen voittojen suorat erilaisilla matrii-seilla. Kuvassa 7 näkyy haukka- ja kyyhkystrategioilla saavutettavat voitotmitä tahansa strategiaa x vastaan, kun x = (p, 1 − p). Sininen jana kuvas-taa sitä, milloin haukka-strategialla saa suuremman voiton ja punainen sitä,milloin kyyhky-strategialla saa suuremman voiton. Paras ratkaisu on siis va-lita näiden suorien leikkauspiste, jolloin kummalla tahansa strategialla saayhtäsuuren voiton.

Määritellään sitten evolutiivisesti tasapainoinen strategia.

Määritelmä 5.1. [Evolutiivisesti tasapainoinen strategia, ESS] Strategiax ∈ ∆n on evolutiivisesti tasapainoinen strategia, jos mille tahansa siitäeroavalle puhtaalle strategialle z pätee

1. z>Ax ≤ x>Ax ja

2. jos z>Ax = x>Ax, niin z>Az < x>Az.

Määritelmän mukaan strategian x tulee olla symmetrisen Nashin tasa-painon strategia, jotta se voi olla evolutiivisesti tasapainoinen. Mikäli strate-giayhdistelmä (x,x) on Nashin tasapaino, kumpikaan pelaaja ei voi saavut-taa suurempaa voittoa poikkeamalla siitä, jolloin x>Ax ≥ z>Ax kun z onjokin poikkeava (puhdas) strategia.

Lisäksi määritelmä kertoo, että jos voitot strategiayhdistelmillä (x,x) ja(z,x) ovat samat, tällöin strategiayhdistelmä (x, z) antaa aidosti suuremmanvoiton kuin strategiayhdistelmä (z, z). Myös tällöin strategialla x on selvähyöty.

Tämän määritelmän mukaan poikkeavan strategian z sallitaan olevanvain puhdas strategia, minkä lisäksi strategiaa x verrataan vain yksittäi-seen poikkeavaan strategiaan z. Voisi kuitenkin ajatella, että populaatioonilmestyy pieni joukko poikkeavaa strategiaa käyttäviä yksilöitä, jolloin satun-naisella populaation jäsenellä on tietyt todennäköisyydet käyttää vallitsevaatai poikkeavaa strategiaa. Muotoillaan sitten seuraava propositio, jossa x onpopulaatiossa vallalla oleva strategia, z poikkeava strategia ja poikkeavaastrategiaa käyttävien yksilöiden osuus populaatiosta on ε.

47

Propositio 5.1. Olkoon x, z ∈ ∆n. Jos strategia x on evolutiivisesti tasa-painoinen, niin on olemassa ε ∈ [0, 1] siten, että

z>A(εz + (1− ε)x) < x>A(εz + (1− ε)x),

kaikilla ε ∈]0, ε[.

Todistus. Tällä strategiakokoonpanolla strategiaa x käyttävälle yksilölle odo-tettu voitto on

x>A(εz + (1− ε)x) = εx>Az + (1− ε)x>Ax. (8)

Strategiaa z käyttävälle yksilölle odotettu voitto on

z>A(εz + (1− ε)x) = εz>Az + (1− ε)z>Ax. (9)

Jos x on evolutiivisesti tasapainoinen strategia, niin z>Ax ≤ x>Ax. Tar-kastellaan seuraavaksi yhtäsuuruus ja aito epäyhtälö erikseen.

Jos z>Ax = x>Ax, niin tällöin määritelmän 5.1 mukaan z>Az < x>Az.Tästä seuraa, että strategialla x saavutettava voitto (8) on aidosti suurempaakuin strategialla z saavutettava voitto (9):

εz>Az + (1− ε)z>Ax− (εx>Az + (1− ε)x>Ax)= ε(z>Az− x>Az) + (1− ε)(z>Ax− x>Ax)= ε(z>Az− x>Az) + z>Ax− x>Ax− ε(z>Ax− x>Ax)< ε · 0 + 0− ε · 0= 0.

Sama erisuuruus saadaan tietyin ehdoin myös, jos z>Ax < x>Ax. Mää-ritellään funktio f : ]0, ε[ → R, jonka lauseke saadaan odotettujen voittojen(9) ja (8) erotuksena:

f(ε) = εz>Az + (1− ε)z>Ax− (εx>Az + (1− ε)x>Ax)= ε(z>Az− x>Az) + (1− ε)(z>Ax− x>Ax)= ε(z>Az− x>Az) + z>Ax− x>Ax− ε(z>Ax− x>Ax)= ε(z>Az− x>Az− z>Ax + x>Ax) + z>Ax− x>Ax.

48

Nyt termi z>Ax−x>Ax on aidosti negatiivinen ja kuvastaa pistettä, jos-sa funktion f kuvaaja leikkaa y-akselin. Muuttujan ε kertoimesta riippuenkuvaaja voi olla nouseva suora, laskeva suora tai vakio. Kaikissa tapauksissafunktio saa kuitenkin negatiivisia arvoja ainakin tiettyä arvoa pienemmil-lä muuttujan ε arvoilla. Tämä tarkoittaa sitä, että z>A(εz + (1 − ε)x) <x>A(εz + (1− ε)x) ainakin joillain luvun ε arvoilla.

Tämän proposition mukaan populaatioon voi ilmestyä pieni joukko poik-keavaa strategiaa käyttäviä yksilöitä, mutta jos vallalla oleva strategia onevolutiivisesti tasapainoinen, poikkeava ei voi syrjäyttää sitä, kunhan poik-keavaa strategiaa käyttävien yksilöiden osuus pysyy riittävän pienenä.

Esimerkiksi teoksessa Evolutionary Game Theory [10] tämä propositiossaesitelty lauseke on otettu evolutiivisesti tasapainoisen strategian määritelmänlähtökohdaksi ja määritelmä 5.1 on esitelty lauseena.

Esimerkki 5.2. Tarkastellaan evolutiivisesti tasapainoisen strategian mää-ritelmää haukka-kyyhky -esimerkin avulla.

Kuten esimerkissä 4.2 nähtiin, tässä pelissä on symmetrinen Nashin tasa-paino (x,x), missä x = (2

3 ,13). Koska evolutiivisesti tasapainoisen strategian

tulee muodostaa itsensä kanssa symmetrinen Nashin tasapaino, on järkeväätutkia onko tämä strategia evolutiivisesti tasapainoinen.

Tarkastellaan täyttääkö strategia x = (23 ,

13) evolutiivisesti tasapainoisen

strategian määritelmän ehdot. Yksilön 1 saavuttama voitto strategialla xstrategiaa x vastaan on

[23

13

] [−1 40 2

] [2313

]= 2

3 .

Nyt mitä tahansa puhdasta strategiaa y tutkiessa huomataan, että

[y1 y2

] [−1 40 2

] [2313

]= 2

3 .

Tällöin poikkeava strategia y saavuttaa strategiaa x vastaan pelattuna yhtä-suuren voiton kuin strategia x. Näin ollen pitää tarkistaa, pitääkö epäyhtälö

y>Ay < x>Ay

paikkansa.

49

Määritelmässä 5.1 sallittiin poikkeavan strategian olevan vain puhdasstrategia, joita tässä pelissä on kahta erilaista. Merkitään h = (1, 0) jak = (0, 1). Tarkistetaan nyt epäyhtälön

h>Ah < x>Ah

paikkansapitävyys. Sijoitetaan strategiat ja matriisi oikeille paikoilleen, jol-loin saadaan

[1 0

] [−1 40 2

] [10

]<

[23

13

] [−1 40 2

] [10

]ja tämä auki laskettuna on

−1 < −23 .

Tämän mukaan siis ainakaan strategia h = (1, 0) ei ole itseään vastaankäytettynä parempi vaihtoehto kuin strategia x. Selvitetään sitten, kuinkahyvin strategia k pärjää tarkistamalla epäyhtälö

k>Ak < x>Ak.

Sijoitetaan strategiat ja matriisi oikeille paikoilleen, jolloin saadaan

[0 1

] [−1 40 2

] [01

]<

[23

13

] [−1 40 2

] [01

]

ja tämä jälleen auki laskemalla saadaan

2 < 103 .

Strategia x on siis parempi vaihtoehto kumpaakin puhdasta strategiaavastaan, jolloin kyseessä on evolutiivisesti tasapainoinen strategia.

Vaikka kaikissa summapeleissä on Nashin tasapaino ja symmetrisissäsummapeleissä se on vielä symmetrinen Nashin tasapaino, ei tällaisen Nashintasapainon strategia ole kuitenkaan välttämättä evolutiivisesti tasapainoinenstrategia. Esitellään tällaisesta tilanteesta seuraavaksi esimerkki kivi-paperi-sakset -tyyppisen pelin avulla.

50

Esimerkki 5.3 (Kivi-sakset-paperi). Tämäntyyppinen peli esiteltiin jo ai-kaisemmin esimerkissä 4.4, jossa voittomatriisiksi määriteltiin

A =

0 −1 11 0 −1−1 1 0

.Tällöin myös löydettiin symmetrinen Nashin tasapaino strategialla x = (1

3 ,13 ,

13).

Tämä ei kuitenkaan ole evolutiivisesti tasapainoinen strategia, mikä näyte-tään seuraavaksi. Strategialla x saavutettava voitto itseään vastaan käytet-tynä on

x>Ax =[

13

13

13

] 0 −1 11 0 −1−1 1 0

131313

= 0.

Kaikilla kolmella puhtaalla strategialla saavutetaan yhtäsuuri odotettuvoitto strategiaa x vastaan pelattuna. Esimerkiksi kivi-strategialla saavutet-tu odotettu voitto on

[1 0 0

] 0 −1 11 0 −1−1 1 0

131313

= 0.

Tämä on nyt yhtäsuuri kuin odotettu voitto strategialla x itseään vas-taan. Tällöin evolutiivisesti tasapainoisen strategian määritelmän mukaanpitäisi olla

z>Az < x>Az,

kun z on poikkeava strategia, tässä tapauksessa kivi-strategia. Selvitetäänpitääkö epäyhtälö paikkansa. Strategialla z strategiaa z vastaan saavutettavavoitto on

z>Az =[1 0 0

] 0 −1 11 0 −1−1 1 0

1

00

= 0

.

51

Myös strategialla x saavutettava voitto strategiaa z vastaan on 0, jotenepäyhtälö z>Az < x>Az ei pidä paikkaansa. Sama tulos saadaan samallatavalla laskettuna myös muilla puhtailla strategioilla, joten strategia x ei oleevolutiivisesti tasapainoinen. Mikäli populaatiossa vallalla oleva strategia eiole evolutiivisesti tasapainoinen, joku muu strategia voi pärjätä paremmin jasiten syrjäyttää vallalla olevan strategian.

5.2 Pelimallit luonnonpopulaatioissaEsitellään vielä luonnonpopulaatioista löytyviä esimerkkejä haukka-kyyhky-tyypin ja kivi-paperi-sakset -tyypin peleistä.

5.2.1 Haukka-kyyhky

Vaikka haukka-kyyhky -mallia onkin käytetty tyypillisenä teoreettisena mal-lina biologisissa systeemeissä, on se monesti ollut liian yksinkertainen. Ar-tikkelissa The hawk – dove game in a sexually reproducing species explains acolourful polymorphism of an endangered bird [4] kuvaillaan kuitenkin yhtäesimerkkiä luonnonpopulaatiossa. Harlekiinipeipon (Chloebia gouldiae) eri-laisten värimuunnosten väliltä on löydetty haukka-kyyhky -tyyppinen dy-namiikka. Artikkelin tutkimuksessa harlekiinipeippokoiraat luokiteltiin kah-teen värimuotoon, punapäisiin ja mustapäisiin yksilöihin. Harlekiinipeippojaon myös keltapäisiä yksilöitä, mutta ne ovat hyvin harvinaisia eivätkä sitenole oleellisia populaatiodynamiikan kannalta.

Punapäiset ovat aggressiivisempia, jolloin niillä on helpompi saatavuuspesintäpaikkoihin. Nämä ovat haukka-strategiaa käyttäviä yksilöitä. Musta-päiset puolestaan ovat rauhallisempia ja kuvastavat kyyhky-strategiaa käyt-täviä yksilöitä. Näiden eri värimuotojen välinen dynamiikka toimii kutenhaukka-kyyhky -tyyppisessä pelissä ja eri värimuotojen jakauma riippuu ti-heydestä. Jos punapäisiä yksilöitä on paljon, niiden lisääntymismenestys las-kee, mutta harvinaisena punapäiset yksilöt pärjäävät paremmin kuin musta-päiset yksilöt.

Tutkimuksessa rakennetun mallin mukaan harlekiinipeipoilla esiintyvävalikoiva parinmuodostus ylläpitää polymorfismia. Lintunaaraat suosivat li-sääntymiskumppaneinaan samanvärisiä yksilöitä ja onkin havaittu, että se-kapariskunnalla on huonompi pesintämenestys. Mallin mukaan valikoivan li-sääntymisen puuttuessa musta värimuoto pärjää paremmin ja yleistyy syr-jäyttäen punaisen värimuodon. Tällöin populaatiokoko pääsee myös suurem-

52

maksi, kuin silloin jos populaatiossa on myös haukka-yksilöitä. Samankaltai-sia tuloksia on havaittu esimerkiksi kissoille rakennetussa mallissa [1], jon-ka mukaan tiheissä kissapopulaatioissa parhaiten pärjää kyyhky-tyyppisestikäyttäytyvä yksilö.

5.2.2 Kivi-paperi-sakset

Artikkelissa The rock–paper–scissors game and the evolution of alternativemale strategies [9] kuvaillaan eräältä liskolajilta (Uta stansburiana) löytynei-tä väritykseen liittyviä käyttäytymistyyppejä ja niiden välistä dynamiikkaa.Koiraat, joilla on oranssi kurkku, ovat hyvin dominantteja ja näillä on yleises-ti suurempi reviiri. Sinikurkkuiset koiraat eivät ole yhtä aggressiivisia ja niilläon pienemmät reviirit. Keltakurkkuiset koiraat puolestaan muistuttavat ul-komuotonsa perusteella naaraita, jolloin ne ovat niin sanottuja hiiviskelijöitä,eli hiippailevat salaa reviirille lisääntymään.

Erilaisten tyyppien keskinäiset suhteet toimivat kuten kivi-paperi-sakset-pelissä. Oranssit dominoivina voittavat siniset kilpailussa lisääntymiskump-paneista, keltaiset hiiviskelijät pärjäävät kuitenkin oransseja vastaan, silläoranssit eivät kykene kunnolla vahtimaan kaikkia naaraita. Siniset puoles-taan voittavat kilpailussa keltaisia vastaan, sillä ne pystyvät pienemmälläreviirillään vahtimaan paremmin naaraita.

Tutkimuksessa havaittiin, että näiden erilaisten tyyppien jakauma vaih-teli populaatiossa, eikä mikään tietty jakauma osoittautunut tasapainoiseksi.Esimerkiksi oranssien osuuden ollessa suuri, keltaisille koiraille tilanteista olihyötyä ja niiden lisääntymismenestys kasvoi. Erilaisten tyyppien suhteellisetosuudet siis vaihtelivat, eikä evolutiivisesti tasapainoista strategiaa löytynyt.Tämä ilmeni myös esimerkissä 5.3, jossa havaittiin, että kivi-paperi-sakset-tyyppisessä pelissä ei ole evolutiivisesti tasapainoista strategiaa.

53

Viitteet[1] Pierre Auger ja Dominique Pontier. ”Fast game theory coupled to slow

population dynamics: the case of domestic cat populations”. Mathema-tical Biosciences 148 (1998), s. 65–82.

[2] Julio Gonzáles-Díaz, Ignacio García-Jurado ja M. Gloria Fiestras-Janeiro.An Introductory Course on Mathematical Game Theory. American Mat-hematical Society, 2010.

[3] Tero Kilpeläinen. Vektorianalyysi. Jyväskylän yliopiston matematiikanja tilastotieteen laitoksen luentomoniste, 2019.

[4] Hanna Kokko, Simon C. Griffith ja Sarah R. Pryke. ”The hawk – do-ve game in a sexually reproducing species explains a colourful poly-morphism of an endangered bird”. Proceedings of the Royal Society281 (2014).

[5] John M. McNamara ja Frank J. Weissing. ”Evolutionary Game Theo-ry”. Teoksessa: Social Behaviour: Genes, Ecology and Evolution. Toim.Tamás Székely, Allen J. Moore ja Jan Komdeur. Cambridge UniversityPress, 2010. Luku 4, s. 109–133.

[6] John F. Nash. ”Equilibrium points in n-person games”. Proceedings ofthe National Academy of Sciences 36.1 (1950), s. 48–49.

[7] John von Neumann. ”Zur Theorie der Gesellschaftsspiele”. Mathema-tische Annalen 100 (1928), s. 295–320.

[8] Yuval Peres. Game Theory, Alive. Versio 7.9.2020.[9] Barry Sinervo ja Curt M. Bauer. ”The rock–paper–scissors game and

the evolution of alternative male strategies”. Nature 380 (1996), s. 240–243.

[10] Jörgen W. Weibull. Evolutionary Game Theory. Massachusetts Insti-tute of Technology, 1995.

54