Equilíbrio de Nash Versus Óptimo de Pareto - recipp.ipp.ptrecipp.ipp.pt/bitstream/10400.22/7283/1/ART_FernandaAFerreira_2008... · muito utilizado ems Teoria dos Jogos: Equilíbrio

  • Upload
    vanphuc

  • View
    218

  • Download
    0

Embed Size (px)

Citation preview

  • Equilbrio de Nash Versus ptimo de Pareto (Racionalidade Individualista Versus Racionalidade Altrusta) O equilbrio de Nash, utilizado muitas vezes para soluo de um jogo, no necessariamente a "melhor soluo" ou a que fornece o "melhor resultado". Em muitas situaes, todos os jogadores melhorariam os seus resultados caso pudessem, de alguma forma, acordar estratgias diferentes das do equilbrio de Mash 1. Introduo

    Podemos definir a Teoria dos Jogos como a anlise matemtica formal de situaes (jogos) que envolvem conflitos de interesses. Para o estudo desses jogos, recorre-se a modelos matemticos que descrevem interaces competitivas sujeitas a um conjunto de regras, onde o objectivo principal encontrar as estratgias1 racionais ptimas em situaes onde os resultados dependem tambm das estratgias escolhidas pelos outros jogadores.

    Nos ltimos vinte anos assistimos a um desenvolvimento significativo da Teoria dos Jogos em trs importantes aspectos: (t) a investigao cientfica tem levado a um grande aumento de aplicaes em imensas reas do saber, com os resultados publicados tanto em revistas especializadas como em livros; (ti) o ensino da Teoria dos Jogos passou a integrar-se nos curricula de vrios cursos de Licenciatura, de Mestrado e de Doutoramento; (iii) junto da opinio pblica, a divulgao da Teoria dos Jogos surgiu com a atribuio do Prmio Nobel da Economia, em 1994, a trs dos seus principais criadores (John Nash, Reinhard Selten e John Harsanyi) e, especialmente, atravs da publicao em filme, em 2001, da biografia de Nash, Uma Mente Brilhante.

    Neste trabalho, pretendemos fazer uma reflexo sobre a diferena entre dois instrumentos de anlise muito utilizados em Teoria dos Jogos: Equilbrio de Nash e ptimo de Pareto. So instrumentos que se tm

    revelado muito teis na anlise de comportamentos e resultados a esperar em situaes de interaco entre dois ou mais agentes, situaes particularmente muito frequentes em Economia e nas Cincias Sociais em geral. O entendimento destes conceitos leva-nos compreenso das diferenas entre resultados obtidos quando impera o individualismo e os resultados obtidos quando impera o colectivismo. O jogo do Dilema do Prisioneiro ser utilizado para melhor compreenso dos conceitos supra referidos.

    2. Comentrio histrico sobre Teoria dos Jogos

    Podemos dizer que a Teoria dos Jogos enquanto cincia nasceu em 1944, com o livro Game Theory and Economic Behaviour de John Von Neumann (matemtico) e Oskar Morgenstern (economista) [1]. A estabeleceram as bases do que hoje se designa por Teoria dos Jogos Clssica. H, no entanto, alguns antecessores que nos finais do sc. XIX e princpios do sc. XX tinham j produzido algumas ideias chave na Teoria dos Jogos; por exemplo, os matemticos Borel e Zermelo e os economistas Cournot e Edgeworth. Na criao da Teoria dos Jogos moderna, nos anos 50 e 60, destacam-se trs nomes: John Nash, que introduziu os conceitos de equilbrio (de Nash) para jogos no-cooperativos e soluo de negociao em monoplio bilateral; John Harsanyi, que efectuou uma anlise das situaes com informao incompleta atravs da noo de jogos bayesianos; e Reinhard Selten, que

    Flano de aces que especfica, para um determinado jogador, que aco tomar em todos os momentos em que tenha de decidir o que fazer.

    C a d e r n o _ 1 _ A F z

    ter a-feira, 5 de Agos to de 2008 11:45:22

  • [Equilbrio de Nash Versus ptimo de Pareto]

    introduziu o conceito de equilbrio de Nash perfeito em jogos sequenciais.

    A Teoria dos Jogos tornou-se uma ferramenta poderosssima para o estudo de vrios problemas em Economia e, posteriormente, noutras cincias, levando a um crescimento exponencial de trabalhos de investigao na rea desde essas dcadas at ao presente. Como reconhecimento da importncia dos resultados obtidos com as investigaes realizadas, Nash, Selten e Harsanyi foram galardoados com o Prmio Nobel da Economia em 1994. Posteriormente, em 2001, receberam o Prmio Nobel da Economia os economistas J. Stiglitz, M . Spence e G. Akerlof pelos resultados obtidos com aplicaes da Teoria dos Jogos chamada Economia da Informao, isto , anlise dos mercados com informao assimtrica.

    3.0 que um jogo?

    U m jogo uma qualquer situao na qual se verifica o seguinte:

    i) Existem pelo menos dois jogadores. U m jogador pode ser um indivduo, uma empresa, um pas, ou mesmo um ser biolgico.

    ii) Cada jogador possui um conjunto de estratgias.

    iii) As estratgias escolhidas por cada jogador determinam o resultado do jogo.

    iv) A cada resultado do jogo est associada uma coleco numrica de lucros, um para cada jogador. Estes lucros representam o valor do resultado para os diferentes jogadores.

    A Teoria dos Jogos analisa a forma como os jogadores devem, agindo racionalmente, tomar as suas decises. Cada jogador encara o jogo de forma a que este termine num resultado que lhe proporcione o melhor lucro possvel. O controlo que cada jogador tem sobre o resultado final est no facto de este ser influenciado pela estratgia que escolher. No entanto, o resultado final no depende apenas da sua escolha, mas tambm das escolhas dos restantes jogadores.

    4. Classificao dos jogos

    Uma primeira classificao de jogos consiste na distino entre jogos cooperativos e jogos no-cooperativos. A caracterstica cooperativa de um jogo prende-se com a anlise das possibilidades de que

    alguns ou todos os jogadores acordem entre si as decises que cada um deve tomar; o objectivo caracterizar estruturas de coligaes com boas propriedades de eficincia e de estabilidade. A caracterstica no-cooperativa de um jogo consiste na anlise das decises possveis para cada jogador, sem qualquer acordo prvio; procura-se uma combinao de estratgias, uma para cada jogador, que possua algum tipo de estabilidade - equilbrio.

    Os jogos no-cooperativos classificam-se em;'ogos estticos, onde cada jogador escolhe a sua estratgia desconhecendo as estratgias adoptadas pelos restantes jogadores; e jogos dinmicos ou sequenciais, onde, em cada momento de deciso, cada jogador conhece as estratgias adoptadas pelos restantes jogadores nos momentos anteriores.

    Os jogos cuja teoria tem tido mais aplicaes e impacto na Economia, e nas Cincias Sociais em geral, so os no-cooperativos.

    Uma outra classificao consiste na distino entre jogos com informao completa, onde todos os jogadores conhecem as consequncias, para si e para os outros, de cada combinao possvel de estratgias; e jogos com informao incompleta, onde pelo menos um jogador desconhece alguma dessas consequncias.

    5. Um exemplo: O Dilema do Prisioneiro

    As investigaes realizadas por Melvin Dresher e Merril Flood na companhia R A N D levaram descoberta, em 1950, do jogo conhecido hoje por Dilema do Prisioneiro. A famosa histria associada a este jogo deve-se a A . W. Tucker e foi publicada, posteriormente, em 1980, por Philip Straffin [2]. E o exemplo mais exaustivamente estudado e utilizado em Cincias Sociais, por ilustrar de forma muito clara o seguinte paradoxo: a procura do melhor por parte de cada jogador conduz a um resultado no-ptimo sob o ponto de vista do colectivo de jogadores.

    O problema consiste no seguinte: Dois suspeitos (Prisioneiro A e Prisioneiro B) de

    um crime foram presos pela polcia. Para efeitos de investigao, cada um deles vai ser interrogado. Os suspeitos aguardam esse interrogatrio em celas separadas, no sendo permit ida qualquer comunicao entre si. Cada um deles tem duas estratgias possveis: denunciar ou no denunciar o

    5

    C a d e r n o _ 1 _ A F z

    ter a-feira, 5 de Agos to de 2008 11:45:27

  • [Equilbrio de Nash Versus ptimo de Pareto]

    colega; e so-lhes explicadas as consequncias derivadas das decises que tomarem: se ambos denunciarem, so condenados a seis meses de priso; se nenhum denunciar, ambos sero condenados a trs meses de priso, por um delito menor; se apenas um deles denunciar, cumprir apenas um ms, e o outro ser condenado a nove meses de priso.

    As diversas hipteses e os resultados do jogo esto ilustrados na tabela seguinte:

    Prisioneiro B

    Denunciar No Denunciar

    Pris

    ione

    iro A

    Denunciar (6,6) (1,9)

    Pris

    ione

    iro A

    No Denunciar (9,1) (3,3)

    Que estratgia tomar? Observemos primeiro o ponto de vista do

    Prisioneiro A: "Suponhamos que B no me denuncia. Se eu o no denunciar, a minha pena ser de trs meses; e se eu o denunciar, a minha pena ser de um ms. Logo, o melhor denunci-lo. Suponhamos agora que B me denuncia. Se eu o no denunciar, a minha pena ser de nove meses; e se eu o denunciar, a minha pena ser de seis meses. Logo, o melhor denunci-lo". Em ambos os casos, a melhor deciso a ser tomada pelo Prisioneiro A denunciar (Dado os resultados proporcionados por esta estratgia serem melhores para o jogador, independentemente das aces tomadas pelo(s) outro(s) jogador(es), ela designada dominante).

    Analogamente, o Prisioneiro B tambm dever denunciar.

    Assim, ambos sero condenados a uma pena de seis meses de priso. Este resultado surpreendente, dado que se ambos no denunciassem, a pena seria apenas de trs meses para cada um.

    6. Equilbrio de Nash

    John Nash, matemtico norte-americano, baseou-se no teorema do ponto fixo de Kakutani para

    2As estratgias puras de um jogador so as diferentes decises que pode tomar.

    formular, em 1950, o que ficou conhecido como equilbrio de Nash; este corresponde ao conceito de equilbrio standard em Economia, e por isso considerado, em geral, como a soluo de um jogo. O equilbrio de Nash consiste numa combinao de estratgias, uma para cada jogador, tal que nenhum jogador melhora o seu lucro se alterar a sua estratgia e os restantes jogadores mantiverem as suas inalteradas. Desta definio, deduzimos que um equilbrio de Nash uma combinao de estratgias da qual nenhum jogador tem incentivo para se desviar unilateralmente, ou seja, nenhum jogador se arrepende da deciso tomada, dadas as estratgias escolhidas pelos restantes jogadores. U m equilbrio de Nash , assim, constitudo por estratgias que so ptimas para cada jogador, dadas as estratgias dos restantes. Notemos, contudo, que tal no significa que num equilbrio de Nash cada jogador obtenha o melhor lucro possvel, mas sim o melhor lucro condicionado ao facto dos restantes jogadores escolherem as estratgias indicadas para eles nessa combinao.

    U m jogo, tal como aqui apresentado (em estratgias puras2), pode possuir zero, um ou mltiplos equilbrios de Nash.

    Para encontrar o(s) equilbrio(s) de Nash, procedemos da seguinte forma: para cada combinao de estratgias, testamos se a estratgia de cada jogador a melhor escolha para as estratgias adoptadas pelos outros jogadores. H uma outra maneira eficaz e mais simples de visualizar, na prpria representao tabular do jogo, a procura e obteno dos equilbrios de Nash. Consiste em comparar, para cada combinao de estratgias dos seus adversrios, os lucros que um jogador obteria em cada uma das suas possveis estratgias, e sublinhar o(s) melhor(es) desses lucros. Uma combinao de estratgias ser um equilbrio de Nash, se todos os lucros correspondentes estiverem sublinhados.

    Para uma melhor compreenso deste ltimo procedimento, vamos exemplificar com o Dilema do Prisioneiro. Se o Prisioneiro B escolher "denunciar", comparamos os lucros 6 e 9 do Prisioneiro A, e sublinhamos o melhor, que 6 (6 meses de priso melhor do que 9); se o Prisioneiro B escolher "no denunciar", comparamos os lucros 1 e 3 do Prisioneiro A, e sublinhamos o melhor, que 1. Procedendo de maneira anloga com os lucros do

    o de 2008 11:45:32

  • [Equilbrio de Nash Versus ptimo de Pareto]

    Prisioneiro B, obtemos a tabela com o aspecto abaixo.

    Prisioneiro B

    Denunciar No Denunciar

    Pris

    ione

    iro A

    Denunciar (6,6) (1,9)

    Pris

    ione

    iro A

    No Denunciar (9,1) (3,3)

    O Dilema do Prisioneiro tem, assim, um nico equilbrio de Nash: (Denunciar, Denunciar).

    7. ptimo de Pareto

    No Dilema do Prisioneiro analisado, vimos que a soluo (equilbrio) no eficiente sob o ponto de vista de Pareto. Porque optam os jogadores por (Denunciar, Denunciar), como indica o equilbrio de Nash, se optando por (No denunciar, No denunciar) conseguiriam um resultado melhor? Este aparente paradoxo explicado pela compreenso de que a opo (No denunciar, No denunciar) a indicada sob o ponto de vista social (colectivo de jogadores), enquanto que a opo (Denunciar, Denunciar) a indicada sob o ponto de vista individual. Este jogo ilustra que, de facto, existe uma contradio entre a procura do bem individual e a procura do bem colectivo.

    8. Concluso

    Observemos que, no Dilema do Prisioneiro, a combinao de estratgias (Denunciar, Denunciar), que constitui o equilbrio de Nash, no parece proporcionar um resultado muito satisfatrio. De facto, tanto o Prisioneiro A como o Prisioneiro B lucrariam mais se escolhessem (No denunciar, No denunciar), o que lhes proporcionaria apenas 3 meses de priso em vez de 6. Dizemos, ento, que (Denunciar, Denunciar) no ptimo de Pareto. Uma combinao de estratgias ptimo de Pareto, se no se puder passar para uma outra de modo que nenhum jogador fique prejudicado e pelo menos um fique beneficiado. Trata-se de um conceito que analisa a eficincia social, relevante para o grupo de jogadores como um colectivo, enquanto que o equilbrio de Nash um conceito que analisa a eficincia individual, relevante para cada um dos jogadores como agente individual.

    Vimos, atravs do Dilema do Prisioneiro, que um equilbrio de Nash no garante necessariamente o mximo de bem-estar. De facto, a escolha "no denunciar" por ambos os jogadores aquela que traria o mximo de bem-estar; porm ambos escolhem "denunciar".

    O Dilema do Prisioneiro leva-nos a algumas reflexes teis para o trabalho em equipa: As equipas no devem actuar isoladamente; errado pensar que cada um se deve preocupar com o seu prprio territrio - estes podem ser, e muitas vezes so, sobrepostos; o futuro de uma equipa pode estar associado ao de outra! A cooperao levar a um ganho final positivo em relao a outras possveis alternativas de aco. E3

    Referncias

    [1] Von Neumann, J., & Morgenstern, O. (1944). Theory of Games and Economic Behaviour. Princeton: Princeton University Press.

    [2] Straffin,P. (1980). "The Prisoner's Dilemma". UMAP Journal, 1,101-103.

    Bibliografia

    Friedman, J.W. (1990). Game Theory with Applications to Economics. New York: Oxford University Press.

    Gibbons, R. (1992). A Primer in Game Theory. New York: Harvester and Wheatsheaf.

    Straf fin, P. (1993). Game Theory and Strategy. Washington: The Mathematical Association of America.

    10|

    C a d e r n o _ 1 _ A F z

    ter a-feira, 5 de Agos to de 2008 11:45:36