244
Davi Romero de Vasconcelos Lógica Modal de Primeira-ordem para Raciocinar sobre Jogos Tese de Doutorado Tese apresentada ao Programa de Informática do Departamento de Informática da PUC–Rio como requisito parcial para obtenção do título de Doutor em Informática. Orientador: Prof. Edward Hermann Haeusler Rio de Janeiro Abril de 2007

Davi Romero de V asconcelos L gica Mo dal de Primeira-o ...livros01.livrosgratis.com.br/cp040031.pdf · Davi Romero de V asconcelos ... A o professor Marcelo Jos Braga do departamen

  • Upload
    vuduong

  • View
    212

  • Download
    0

Embed Size (px)

Citation preview

Davi Romero de Vasconcelos

Lógica Modal de Primeira-ordem paraRaciocinar sobre Jogos

Tese de Doutorado

Tese apresentada ao Programa de Informática do Departamentode Informática da PUC–Rio como requisito parcial para obtençãodo título de Doutor em Informática.

Orientador: Prof. Edward Hermann Haeusler

Rio de JaneiroAbril de 2007

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Livros Grátis

http://www.livrosgratis.com.br

Milhares de livros grátis para download.

Davi Romero de Vasconcelos

Lógica Modal de Primeira-ordem paraRaciocinar sobre Jogos

Tese apresentada ao Programa de Informática do Departamentode Informática do Centro Técnico Científico da PUC–Rio comorequisito parcial para obtenção do título de Doutor em Infor-mática. Aprovada pela Comissão Examinadora abaixo assinada.

Prof. Edward Hermann HaeuslerOrientador

Departamento de Informática — PUC–Rio

Prof. Eduardo Sany LaberPUC-Rio

Prof. Paulo Blauth MenezesUFRGS

Prof. Mario R. Folhadela BenevidesUFRJ

Prof. Paulo Augusto VelosoUFRJ

Prof. Marcelo da Silva CorrêaUFF

Prof. Geiza M. Hamazaki da SilvaPUC-Rio

Prof. José Eugenio LealCoordenador Setorial do Centro Técnico Científico — PUC–Rio

Rio de Janeiro, 02 de Abril de 2007

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Todos os direitos reservados. É proibida a reprodução totalou parcial do trabalho sem autorização da universidade, doautor e do orientador.

Davi Romero de Vasconcelos

Graduou–se em Ciência da Computação pela UniversidadeFederal do Ceará. Obteve título de Mestre em Informáticapela Pontifícia Universidade Católica do Rio de Janeiro.

Ficha CatalográficaVasconcelos, Davi Romero de

Lógica Modal de Primeira-ordem para Raciocinar sobreJogos / Davi Romero de Vasconcelos; orientador: EdwardHermann Haeusler. — 2007.

241 f. ; 30 cm

1. Tese (Doutorado em Informática) - Pontifícia Univer-sidade Católica do Rio de Janeiro, Rio de Janeiro, 2007.

Inclui bibliografia.

1. Informática – Teses. 2. Ciência da Computação. 3.Lógica Modal de Primeira-Ordem. 4. Teoria dos Jogos. 5.Lógica para Jogos. 6. Sistemas Multi-Agentes. 7. Verificaçãode Modelos. I. Haeusler, Edward Hermann. II. PontifíciaUniversidade Católica do Rio de Janeiro. Departamento deInformática. III. Título.

CDD: 004

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Agradecimentos

À minha mãe, Nadja Rodrigues Romero, ao meu pai, Luis Cruz deVasconcelos Junior, à minha irmã, Marina Romero de Vasconcelos, e ao meuirmão, Eneas Romero de Vasconcelos, pelo eterno apoio, carinho e amor quesempre me dedicaram.

À minha namorada Cilana Rabelo pelo apoio, carinho, amor e por terme ajudado na revisão do texto desta tese.

Ao Hermann pela amizade, orientação e oportunidade de realizar estágiona Alemanha.

Ao professor Mario Benevides por participar no desenvolvimento destetrabalho em diversas oportunidades.

À Geiza pela amizade e carinho durante todo este período aqui no Riode Janeiro.

Ao Marcelo Corrêa pela amizade, carinho e convivência durante o períodoem que estive na Alemanha.

Ao Christian Rentería pela amizade, conselhos e ajuda durante a minhapermanência na Alemanha.

Ao professor Peter Schroeder-Heister por ter me orientado na Alemanha.Ao Thomas Piecha pela amizade e por todo o auxilio durante o período

na Alemanha.Aos professores Paulo Veloso, Paulo Blauth e Laber por terem participado

da banca de defesa desta tese.Aos meus amigos do TecMF: Bazilio, Vaston, Christiano e Alexandre.Ao Alexandre Pigatti pela amizade e apoio durante todo este período

aqui no Rio de Janeiro.Aos meus amigos de convívio durante o doutorado: Frederico Guth,

Alessandro Garcia, João, Amanda, Karina, Juliana e Rodnei.Aos professores da Pontifícia Universidade Católica do Rio de Janeiro

por terem me dado a base necessária para o desenvolvimento do meu trabalho.Em especial, aos professores Luiz Carlos e Poggi.

Ao professor Marcelo José Braga do departamento de Economia Rural daUniversidade Federal de Viçosa por diversas conversas sobre economia, meioacadêmico, entre outros assuntos.

À CAPES e ao CNPq pelo apoio financeiro.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Resumo

Vasconcelos, Davi Romero de; Haeusler, Edward Hermann. LógicaModal de Primeira-ordem para Raciocinar sobre Jogos. Riode Janeiro, 2007. 241p. Tese de Doutorado — Departamento deInformática, Pontifícia Universidade Católica do Rio de Janeiro.O termo jogo tem sido utilizado como uma metáfora, em várias áreas

do conhecimento, para modelar e analisar situações onde agentes (jogadores)interagem em ambientes compartilhados para a realização de seus objetivossejam eles individuais ou coletivos. Existem diversos modelos propostospara jogos por diferentes áreas do conhecimento, tais como matemática,ciência da computação, ciência política e social, entre outras. Dentre asdiversas formas de modelar jogos examinamos a Teoria dos Jogos e aslógicas para jogos. Neste trabalho apresentamos uma lógica modal deprimeira-ordem baseada na lógica CTL, chamada de Game Analysis Logic,para raciocinar sobre jogos. Relacionamos os principais modelos da Teoriados Jogos (jogo estratégico, extensivo, e de coalizão) e seus principaisconceitos de soluções (equilíbrio de Nash, equilíbrio de subjogo perfeito,e core) aos modelos de GAL e às fórmulas de GAL, respectivamente.Além disso, estudamos as alternativas de quantificação De Re e De Dictono contexto dos jogos extensivos, caracterizando o conceito de equilíbriode Nash e equilíbrio de subjogo perfeito de acordo com as alternativasde quantificação. Relacionamos as lógicas Alternating-time Temporal Logic(ATL) e Coalitional Game Logic (CGL) com a lógica GAL, demonstrandoque ambas as lógicas são fragmentos da lógica GAL. Outro resultadodeste trabalho é caracterizar uma classe de sistemas multi-agentes, que ébaseada na arquitetura de agentes Belief-Desire-Intention (BDI), para aqual existem jogos extensivos e vice-versa. Como conseqüência, os critériosde racionalidade da Teoria dos Jogos podem ser aplicados diretamente paraagentes BDI e vice-versa. Assim, a abordagem deste trabalho pode serutilizada para analisar sistemas multi-agentes. Do ponto de vista prático,apresentamos um verificador de modelos para a lógica GAL. Diversosestudos de casos são realizados utilizando o verificador de modelos.

Palavras–chaveCiência da Computação. Lógica Modal de Primeira-Ordem. Teoria

dos Jogos. Lógica para Jogos. Sistemas Multi-Agentes. Verificação deModelos.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Abstract

Vasconcelos, Davi Romero de; Haeusler, Edward Hermann. First-Order Modal Logic for Reasoning about Games. Rio deJaneiro, 2007. 241p. PhD Thesis — Department of Informática,Pontifícia Universidade Católica do Rio de Janeiro.

Games are abstract models of decision-making in which decision-makers (players) interact in a shared environment to accomplish theirgoals. Several models have been proposed to analyze a wide variety ofapplications in many disciplines such as mathematics, computer scienceand even political and social sciences among others. In this work, we focuson Game Theory and Game Logics. We present a first-order modal logicbased on CTL, namely Game Analysis Logic (GAL), to model and reasonabout games. The standard models of Game Theory (strategic games,extensive games and coalition games) as well as their solution concepts(Nash equilibrium, subgame perfect equilibrium and core), respectively, areexpress as models of GAL and formulas of GAL. Moreover, we study thealternatives of De Re and De Dicto quantification in the context of extensivegames. We also show that two of the most representative game logics,namely Alternating-time Temporal Logic (ATL) and Coalitional Game Logic(CGL), are fragments of GAL. We also characterize a class of multi-agentsystems, which is based on the architecture Belief-Desire-Intention (BDI),for which there is a somehow equivalent class of games and vice-versa. Asa consequence, criteria of rationality for agents can be directly applied toplayers and vice-versa. Game analysis formal tools can be applied to MAS aswell. From a practical point of view, we provide and develop a model-checkerfor GAL. In addition, we perform case studies using our prototype.

KeywordsComputer Science. First-Order Modal Logic. Game Theory. Game

Logics. Multi-Agent Systems. Model Checking.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Sumário

1 Introdução 111.1 Por quê CTL de primeira-ordem? 161.2 Organização da Tese 21

2 Teoria dos Jogos 232.1 Jogo Estratégico 262.2 Jogo Extensivo com Informação Perfeita 332.3 Jogo Extensivo com Informação Quase Perfeita 392.4 Jogo Extensivo com Informação Imperfeita 402.5 Jogo Extensivo Reduzido e Informação Imperfeita Equivalente 472.6 Jogo de Coalizão com Utilidades Transferíveis 532.7 Jogo de Coalizão sem Utilidades Transferíveis 55

3 Lógicas Temporais para a Validação de Sistemas 573.1 Lógicas Temporais 593.2 Verificação de Modelos em CTL 69

4 Lógicas para Jogos 794.1 Alternating-temporal logic (ATL) 794.2 Coalitional Game Logic (CGL) 87

5 Game Analysis Logic (GAL) 905.1 Propriedades de GAL 985.2 Propriedades de alguns tipos de jogos 1045.3 Verificação de Modelos em GAL 105

6 Teoria dos Jogos em GAL 1106.1 Jogo Estratégico em GAL 1116.2 Jogo Extensivo com Informação Perfeita em GAL 1186.3 Jogo Extensivo com Informação Quase Perfeita em GAL 1416.4 Jogo Extensivo com Informação Imperfeita em GAL 1446.5 Jogo de Coalizão com Utilidades Transferíveis em GAL 1486.6 Jogo Evolutivo de Coalizão com Utilidades Transferíveis 1496.7 Jogo Extensivo de Coalizão com Utilidades Transferíveis 1506.8 Jogo de Coalizão sem Utilidades Transferíveis em GAL 151

7 GAL versus Lógicas para Jogos 1547.1 GAL versus ATL 1547.2 GAL versus CGL 172

8 Experimentos 1768.1 Teoria dos Jogos no GALV 1768.2 SMV vs. GALV 1778.3 Jogos em computação no GALV 1798.4 Leilão no GALV 181

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

9 Conclusão 183

A Provas das Interações entre Quantificação De Re e De Dicto 197

B Provas dos Teoremas de Teoria dos Jogos em GAL 204B.1 Jogo Estratégico 204B.2 Jogo Extensivo na Versão Matricial 207B.3 Jogo Extensivo Versão Extensiva 210B.4 Quantificando em Jogos Extensivos 214B.5 Jogo Extensivo com Informação Imperfeita 220B.6 Jogo de Coalizão Com Utilidades Transferíveis 222B.7 Jogo de Coalizão Sem Utilidades Transferíveis 222

C Defining Agents via Strategies:Towards a view of MASs as Games 225

C.1 Introduction 225C.2 The background theories: BDI and Game Theory 229C.3 Agents as Players 236C.4 Players as Agents 239C.5 Conclusion 241

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Lista de figuras

1.1 Relacionamento entre a Teoria dos Jogos e GAL. 141.2 Relacionamento entre LORA, Teoria dos Jogos e GAL. 16

2.1 Uma rede de computadores com custos compartilhados. 262.2 Jogo estratégico com dois jogadores. 272.3 Duas representações do jogo estratégico Batalha dos Sexos. 282.4 Duas representações do jogo estratégico Dilema do Prisioneiro. 292.5 Uma representação do jogo estratégico Matching Pennies. 292.6 Jogo Extensivo na versão matricial e extensiva do exemplo 2.10. 342.7 Dilema do Prisioneiro na versão extensiva. 382.8 Exemplo de uma instância do jogo Centipede. 392.9 Versão do Dilema do Prisioneiro em Jogo de Informação Quase

Perfeita. 402.10 Jogo Extensivo com informação imperfeita (Exemplo 2.16). 422.11 Jogo Extensivo com informação imperfeita (Selten’s Horse). 442.12 Representação matricial do jogo Selten’s Horse. 442.13 Jogo Extensivo com informação imperfeita e lembrança imperfeita. 472.14 Representação do jogo 2.19. 482.15 Representação do jogo 2.22. 50

3.1 Estrutura de Kripke. 603.2 Árvore de Computação Infinita. 613.3 Operadores temporais X, F,G e U . 623.4 Operadores de CTL. 663.5 Complexidade de CTL*, LTL e CTL. 693.6 Árvore de decisão binária da fórmula (a1 ! b1) " (a2 ! b2). 763.7 OBDD da fórmula (a1 ! b1) " (a2 ! b2). 763.8 Exclusão mútua na linguagem do SMV. 78

4.1 Estrutura de jogo concorrente do exemplo 4.7. 834.2 Representações do jogo estratégico Batalha dos Sexos. 85

5.1 Estrutura de GAL para o jogo do casamento. 945.2 Conectivos modais de GAL. 975.3 Estruturas de GAL 1025.4 Relação entre De Re e De Dicto em GAL 1035.5 Tela principal do GALV com o exemplo do jogo da velha. 109

6.1 Jogo estratégico Batalha dos Sexos. 1136.2 Jogo extensivo do exemplo 2.10 1206.3 Exemplo 2.10. 1246.4 Exemplo de um jogo extensivo. 1286.5 Exemplo de um jogo extensivo de soma zero. 1296.6 Dilema do Prisioneiro na versão extensiva com informação perfeita. 1346.7 Exemplo de um jogo extensivo. 1376.8 Exemplos de um jogo extensivo com diferentes utilidades. 137

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Lista de figuras 10

6.9 Tabela das soluções (estratégias) do exemplo 6.8. 1396.10 Dilema do Prisioneiro como Jogo Extensivo com Informação Quase

Perfeita. 1426.11 Dilema do Prisioneiro como Jogo Extensivos com Informação Im-

perfeita. 144

7.1 Estrutura de GAL para o jogo do casamento. 1557.2 Estrutura de ATL para o jogo do casamento. 1557.3 Jogo Concorrente vs. Estrutura de GAL para o exemplo 4.7. 159

8.1 Jogos estratégicos com dois jogadores. 1778.2 Solução core para o exemplo 2.27. 1788.3 Tela para cadastrar o planejamento dos agentes. 182

C.1 Extensive Games 235C.2 Example of the transformation of SITM(Plana) in a tree without

simultaneous moves 238C.3 The Prisoner’s Dilemma 241

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

1Introdução

A percepção humana, em geral, parece se dar através da observação domundo e da geração de abstrações do mesmo. O que se busca fazer é construirmodelos, sejam eles modelos mentais ou definidos através de algum tipo delinguagem, para representar e analisar os problemas. Linguagens naturais,tais como português e inglês, podem ser utilizadas neste intuito, contudopelo seu caráter às vezes ambíguo ou impreciso podem tornar as observaçõesinadequadas ou errôneas. Na tentativa de evitar estes tipos de problemasprocura-se utilizar algum tipo de formalismo que seja mais simples e claroo suficiente para representar o problema. Uma das abordagens utilizadas éa construção de modelos matemáticos onde se procura ter um rigor formalmaior. Assim, os problemas são definidos e interpretados à ótica de uma maiorprecisão semântica.

O termo jogo tem sido utilizado como uma metáfora em diversas áreasdo conhecimento para modelar situações onde agentes (jogadores) interagemem ambientes compartilhados para a realização de seus objetivos sejam elesindividuais ou coletivos. Diversos modelos para jogos têm sido propostospor diferentes áreas do conhecimento, tais como matemática, ciência dacomputação, ciência política e social, entre outras. Dentre as diversas formasde modelar jogos, neste trabalho apresentamos algumas abordagens: a Teoriados Jogos; as lógicas para Jogos; e seus algoritmos em computação.

A Teoria dos Jogos (OR94) tem como marco principal a publicação dolivro de von Neumann e Morgenstern, Theory of Games and Economic Be-havior(1944) (NM44), onde buscou-se utilizar o rigor matemático para esta-belecer critérios de racionalidade aos agentes que interagem em um ambientecomum na busca por certos objetivos individuais ou coletivos.

Naquela época a utilização da matemática não era amplamente aceita naeconomia, e, na verdade, era muita controversa. Nesta publicação, discutiu-see comparou-se a economia a outras ciências com respeito à utilização da ma-temática. Para von Neumann e Morgenstern tais ciências jamais teriam obtidoo grau de desenvolvimento à época sem o uso da matemática, ressaltando queesta evolução se deu de forma lenta e gradual através da contribuição de vários

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 1. Introdução 12

trabalhos ao longo dos anos. Assim, para os autores o mesmo poderia ser reali-zado para a economia levando-se em consideração o sucesso das outras ciênciase ressaltando-se, também, que não existiria um motivo para crer que haveriaum caminho mais curto ao desenvolvimento da Teoria dos Jogos. Este processodeveria ser feito de forma evolutiva, onde os modelos seriam descritos e aper-feiçoados durante o passar dos anos. O que se pretendia, aparentemente, nestapublicação era iniciar uma Teoria dos Jogos, sem necessariamente ter objeti-vos imediatos de modelar e interpretar o comportamento humano e econômicocomo um todo.

O que von Neumann e Morgenstern pareciam acreditar na época, defato, vem se comprovando. A Teoria dos Jogos evoluiu e a cada passo foramcriados novos conceitos que a tornaram mais próxima dos problemas reais. Estaabordagem obteve relativo sucesso e tem sido empregada em diversas áreas doconhecimento, a exemplo de economia, relações internacionais e até mesmo debiologia. O prêmio Nobel de economia já foi concedido em duas oportunidadesaos pesquisadores da área de Teoria dos Jogos: John C. Harsanyi, John F. NashJr. e Reinhard Selten em 1994; Robert J. Aumann e Thomas C. Schelling em2005.

Esta área procura utilizar-se do rigor matemático na descrição dosseus problemas e na forma de interpretar o comportamento de seus agentes,partindo do princípio que os jogadores são racionais, na medida em que, aotomarem suas decisões eles estão tentando maximizar seus objetivos levandoem consideração que os outros jogadores também estão. A partir desta óticasão criados modelos matemáticos que tentam abstrair características comuns adeterminados tipos de interações entre os agentes, tais como jogos estratégicos,extensivos e coalizões. Criando-se conceitos e provas matemáticas do queseriam as análises, ou seja, o que se está interessado em observar de cadatipo de problema, tais como os conceitos de equilíbrio de Nash, de subjogoperfeito e core.

Por outro lado, recentemente, diversas linguagens lógicas têm sido utili-zadas para descrever e analisar jogos de uma forma qualitativa ao invés de umaanálise basicamente quantitativa, como no caso da Teoria dos Jogos. Como éde se esperar, estas lógicas tem uma forte relação com a Teoria dos Jogos.

Como crenças e conhecimentos acerca do comportamento dos jogadoressão aspectos fundamentais da Teoria dos Jogos, lógicas epistêmicas foram asprimeiras a serem utilizadas (BK01, BA95).

Lógicas temporais também são utilizadas, como em (Bon01), onde oconceito de equilíbrio de subjogo perfeito é descrito como um caso particularda definição de prediction.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 1. Introdução 13

Em (vB03), o resultado de que todo jogo extensivo finito entre doisjogadores possui uma estratégia ganhadora para um dos jogadores (Zer13)é definido como uma fórmula em µ! calculus.

Coalition Logic (CL) (Pau01) é uma lógica para raciocinar sobre gruposde agentes. O operador modal [C]! formaliza a idéia de que um grupo deagentes C toma decisões tal que ! vale independente das decisões dos outrosagentes. Basicamente os modelos de CL são, essencialmente, jogos extensivoscom informação quase perfeita, onde cada perfil de ações é associado a umnovo estado, o resultado do jogo.

Assim como CL, Alternating-time Temporal Logic (ATL) (AHK02) é umalógica para raciocinar sobre grupos de agentes. A lógica ATL é uma extensão dalógica temporal de tempo ramificado Computation Tree Logic (CTL) (CE81),cujos os operadores temporais são parametrizados por um conjunto de agentes.Em (Gor01), é demonstrado que a lógica CL é um fragmento de ATL. Umaextensão com operadores epistêmicos da lógica ATL é apresentado em ATEL(vdHW03).

Counterfactual ATL (CATL) (vdHJW05) é uma outra extensão da lógicaATL que possui operadores modais Ci(",!) que podem ser lidos como se fosse ocaso do jogador i escolher a estratégia ", então ! valerá. Para exemplificar esteoperador, considere o exemplo “se Napoleão tivesse ganho a guerra, então todosnós falaríamos francês”. Com estes operadores é demonstrado como representaro conceito de equilíbrio de Nash.

Em (HvdHMW00, HMvdHW03), a lógica Propositional Dynamic Logic(PDL) é utilizada para representar jogos extensivos com informação perfeita etambém caracterizar os conceitos de soluções de equilíbrio de Nash e equilíbriode subjogo perfeito através de fórmulas de PDL.

A lógica Coalitional Game Logic (CGL) (ÅWvdH06) utiliza operadorespara representar as relações de preferências dos jogadores, assim como opera-dores para raciocinar sobre grupos de agentes, onde os modelos são jogos decoalizão sem utilidades transferíveis. Os conceitos de soluções core, stable setse bargaining set são definidos em CGL. Em (ÅWvdH06) é demonstrado quenão existe uma forma direta de mapear os modelos de CGL aos modelos deATL, preservando a relação de satisfação.

Para uma boa referência sobre lógica modal e Teoria dos Jogos veja(Bon02). Para mais detalhes sobre problemas em abertos entre lógicas e jogosveja (vB05). Contudo, uma observação se faz necessária: existem diversaslógicas cujas semânticas são apresentadas através de jogos, todavia, estaabordagem foge ao escopo desta tese.

Do ponto de vista prático costuma-se abordar lógicas a partir de duas

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 1. Introdução 14

técnicas: a verificação de modelos (model checking) (CGP99); e provas au-tomáticas de teoremas (automated theorem proving) (Fit96). Neste trabalhotratamos apenas de verificação de modelos.

A técnica de verificação de modelos (model checking) (CGP99) é freqüen-temente aplicada na ciência da computação para a validação de software e hard-ware (BCL91). Esta técnica consiste na verificação (automática) de proprie-dades acerca do comportamento de sistemas. Diversas implementações estãodisponíveis na literatura, tais como o Symbolic Model Verifier (SMV) (McM93)e o SPIN (Hol97). Alguns outros também incluem características especifi-cas na sua modelagem: UPPAAL (BLL+95) trata de tempo-real; HYTECH(HHWT95) de autômatos híbridos; e o PRISM (Par02) de autômatos estocás-ticos. Recentemente, a verificação de modelos vem sendo empregada na verifica-ção de propriedades de jogos (Vas03, BSWZ01, vOvdHW04, vdHW02, KP04).

O propósito deste trabalho é propor uma lógica modal de primeira-ordembaseada na lógica CTL, chamada Game Analysis Logic (GAL), para raciocinarsobre jogos. Esta lógica modal de tempo ramificado difere das lógicas citadasacima por apresentar características de primeira-ordem podendo representar,assim, diversos tipos de funções e predicados, tais como as funções de utilidadese as relações de preferências, que são aspectos importantes em Teoria dos Jogoscom análise quantitativa.

Em (VHPB04, VHB05), ilustramos nossa abordagem mostrando queGAL é capaz de expressar os modelos cooperativos e não-cooperativos daTeoria dos Jogos, assim como os seus principais conceitos de soluções. Pre-cisamente, especificamos jogos estratégicos, jogos extensivos com informaçãoperfeita, e jogo de coalizão com utilidades transferíveis como estruturas deGAL. Também expressamos os seus principais conceitos de soluções, que sãoequilíbrio de Nash, equilíbrio de subjogo perfeito e core, respectivamente, comofórmulas de GAL. A figura 1.1 abaixo resume o relacionamento entre a Teoriados Jogos e a lógica GAL.

Conceito de Solução Fórmula de GAL="

Jogo Modelo de GAL="

Figura 1.1: Relacionamento entre a Teoria dos Jogos e GAL.

Afirmamos que GAL pode definir jogos de uma maneira mais fácil e

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 1. Introdução 15

intuitiva. Para ilustrar isto, consideramos soluções alternativas para jogosextensivos e jogos de coalizão. Representamos também outros tipos de jogosde coalizão, quando consideramos uma seqüência ou uma árvore de jogos decoalizão.

Os operadores modais de ATL e GAL são semelhantes, pois ambas aslógicas são baseadas na lógica CTL. Contudo, os operadores de ATL sãoparametrizados por um conjunto de jogadores. Na seção 7.1, demonstramos queesta parametrização pode ser embutida em GAL utilizando as característicasde primeira-ordem de GAL.

Neste trabalho, apresentamos um algoritmo para verificação de mode-los de GAL com a finalidade de demonstrar como GAL pode ser utilizadana prática para analisar jogos de forma automática. Contudo, para a verifi-cação de modelos de GAL as seguintes restrições são feitas: os jogos são dedomínio finito; e as funções e os predicados utilizados nos jogos são decidíveis.Um protótipo, chamado de Game Analysis Logic Verifier (GALV), desenvol-vido como um framework em Java foi implementado e pode ser encontradoem www.tecmf.inf.puc-rio.br/DaviRomero. Todos os jogos apresentados nestetrabalho estão ou serão implementados no verificador de modelos.

Em (Vas03, VH03) é proposta uma linguagem para descrever jogos,chamada de RollGame, assim como uma tradução para a linguagem doverificador de modelos SMV. A partir daí, o SMV pode ser utilizado parademonstrar propriedades de jogos. O exemplo do jogo da velha é utilizadopara ilustrar como as ações de um dos jogadores que segue certa estratégiaconsegue garantir que ele nunca perderá. O outro jogador não possui estratégia,desta forma todas as possibilidades para ele são levadas em consideração. Naseção 8.2, modelamos este mesmo jogo no verificador de modelos no GALV ecomparamos as duas abordagens.

É sabido que os jogos acompanham a ciência da computação desde o seuinício (RN02). Apesar de não haver uma definição formal única do que seria umjogo, diversos algoritmos foram propostos para solucionarem jogos. Boa partedeles se baseiam na idéia do algoritmo minimax. De forma geral, veremos naseção 8.3 como a abordagem aqui proposta pode ser utilizada para verificarpropriedades de jogadores que se baseiam em algoritmos clássicos da ciênciada computação para resolver jogos, a exemplo do minimax.

Na seção 8.4, exemplificamos como um jogo de leilão, que mais se parececom um mercado de ações, pode ser definido e analisado. Neste exemplo, osagentes poderão definir suas estratégias através de um planejamento de ofertasde vendas e compras de ações. Este planejamento pode se dar de forma não-determinística, i.e., a cada momento eles podem ter possibilidades alternativas

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 1. Introdução 16

para as vendas e compras. Neste caso, o que estamos interessados em analisarsão propriedades semelhantes a: quanto de uma ação um agente pode garantirlevando em consideração todas as possibilidades de interações; ou ainda todosos jogadores obtêm um número mínimo de ofertas atendidas sejam elas decompra ou venda.

Na década de 90, as representações formais de ambientes com diver-sos agentes (jogadores) interagindo se deram através das estruturas cognitivasdos agentes, tais como crenças (beliefs), desejos (desires), intenções (inten-tions), entre outras. Assim, uma família de linguagens lógicas baseadas emBelief-Desire-Intention (BDI) (RG95) foi desenvolvida para tal propósito. Osmodelos BDI são fundamentados na teoria do raciocínio prático em humanos,desenvolvida pelo filósofo Michael Bratman (Bra87). A arquitetura de agentesBDI tornou-se muito popular na área de sistemas multi-agentes (Woo02).

Em particular, a lógica Logic Of Rational Agent (LORA) (Woo00) foiutilizada para caracterizar diversas noções sobre a racionalidade dos agentesde forma individual ou coletiva.

Outro resultado deste trabalho é caracterizar uma classe de sistemasmulti-agentes (Woo02), os modelos de LORA, para a qual existem jogosextensivos e vice-versa. Como conseqüência, os critérios de racionalidade daTeoria dos Jogos (equilíbrio de Nash, de subjogo perfeito, etc) podem seraplicadas diretamente para os sistema multi-agentes baseados na arquiteturaBDI e vice-versa. Por outro lado, relacionamos os jogos extensivos aos modelosde GAL. Desta forma, podemos utilizar a abordagem deste trabalho para ossistema multi-agentes via o relacionamento com os jogos. A figura 1.2 abaixoresume o relacionamento entre LORA, Teoria dos Jogos e GAL.

Fórmula de LORA Conceito de Solução Fórmula de GAL#= ="

Modelo de LORA Jogo Extensivo Modelo de GAL="#= ="

Figura 1.2: Relacionamento entre LORA, Teoria dos Jogos e GAL.

1.1Por quê CTL de primeira-ordem?

Como iremos ver ao longo deste trabalho a utilização de uma linguagemde primeira-ordem é predominante na definição e interpretação de jogos. Em

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 1. Introdução 17

geral, cada jogador possui um conjunto de ações disponíveis para ele, bemcomo uma relação de preferência sobres os possíveis resultados do jogo. Estasdefinições são facilmente modeladas através de uma linguagem de primeira-ordem. Além disso, os conceitos de soluções que são apresentados acabampor referirem-se a esta linguagem através de quantificações sobre as ações dosjogadores e das relações de preferências. Também veremos que diversos tiposde interações possuem aspectos seqüenciais, como no caso de jogos extensivos,onde as ações dos jogadores são dadas através da evolução de cada instante dojogo. Com isto, aspectos de linguagens modais também são utilizados quandonos referimos a estes jogos, a exemplo do conceito de solução de equilíbrio desubjogo perfeito.

Por este motivo, vemos como parte essencial deste trabalho a utilizaçãode uma linguagem de primeira-ordem com operadores modais. Todavia, ló-gicas modais de primeira-ordem não são apenas lógicas modais que possuemuma aparato de primeira-ordem. Diversos problemas surgem quando estes doiscomponentes são colocados em uma mesma linguagem. Neste trabalho, estu-daremos a inter-relação entre os quantificadores e os operadores modais nocontexto de jogos. Em particular, estaremos interessados em estudar as alter-nativas de quantificação De Re e De Dicto no contexto dos jogos extensivos.

Possivelmente, pelas dificuldades encontradas nas lógicas modais deprimeira-ordem, é que as lógicas para jogos são lógicas modais proposicionais,que embutem as características de primeira-ordem dos jogos em suas estru-turas, utilizando operadores modais para representá-las. Desta forma, cadatipo de interação acaba por ser embutido na estrutura da lógica, tornando-adependente do tipo de interação. Como exemplo disso, temos as lógicas ATL(AHK02) e Coalition Logic (Pau01) que são interpretadas através de jogos ex-tensivos, enquanto que a lógica Coalitional Game Logic (ÅWvdH06) consideraas relações de preferências em sua linguagem, e sua estrutura é basicamente umjogo de coalizão sem utilidades transferíveis. Estas lógicas apresentam carac-terísticas importantes do ponto de vista lógico, como a existência de sistemascorretos e completos, além de decidibilidade, enquanto que lógicas de primeira-ordem, em geral, são indecidíveis.

Apesar disso, consideramos que a distinção entre os aspectos de primeira-ordem e modal dos jogos é de fundamental importância para um melhorentendimento dos jogos e de seus conceitos de soluções. Esperamos demonstraristo durante o desenvolver deste trabalho.

Apenas para motivar o leitor que já tenha algum conhecimento sobre osconceitos de equilíbrio de Nash e de equilíbrio de subjogo perfeito para jogosextensivos com informação perfeita, gostaríamos que observasse as definições

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 1. Introdução 18

1.1 e 1.2, e tentasse deduzir se as mesmas são equivalentes. Note o enfoqueem negrito dado a quantificação das estratégias. De forma semelhante para asdefinições 1.3 e 1.4. Como iremos constatar no desenvolvimento deste trabalho,estas definições envolvem quantificação sobre a estrutura seqüencial do jogo,e desta forma pode-se obter definições errôneas. As respostas serão dadas aolongo deste trabalho, especificamente na seção 6.2.7.

Definição 1.1 Um equilíbrio de subjogo perfeito para um jogo extensivocom informação perfeita $N, H, P, (ui)% é um perfil de estratégias s! = (s!i ) talque para todo jogador i & N e para todo histórico não-terminal h & H para oqual P (h) = i, temos que

ui(Oh(h, s!1, . . . , s!n)) ' ui(Oh(h, s!1, . . . , si, . . . , s

!n))

para toda estratégia si & Si.

Definição 1.2 Um equilíbrio de subjogo perfeito para um jogo extensivocom informação perfeita $N,H, P, (ui)% é um perfil de estratégias s! = (s!i )

tal que para todo jogador i & N , para toda estratégia si & Si e para todohistórico não-terminal h & H para o qual P (h) = i, temos que

ui(Oh(h, s!1, . . . , s!n)) ' ui(Oh(h, s!1, . . . , si, . . . , s

!n)).

Definição 1.3 Um equilíbrio de Nash para um jogo extensivo com informa-ção perfeita ! = $N, H, P, (ui)% é um perfil de estratégias s! = (s!i ) tal que paratodo jogador i e para todo histórico não-terminal h & H ao longo do históricoterminal que resulta do perfil de estratégias s! (i.e. h & O(s!)) para o qualP (h) = i, temos que

ui(Oh(h, s!1, . . . , s!n)) ' ui(Oh(h, s!1, . . . , si, . . . , s

!n)),

para toda estratégia si & Si.

Definição 1.4 Um equilíbrio de Nash para um jogo extensivo com infor-mação perfeita ! = $N, H, P, (ui)% é um perfil de estratégias s! = (s!i ) talque para todo jogador i, para toda estratégia si & Si e para todo históriconão-terminal h & H ao longo do histórico terminal que resulta do perfil deestratégias s! (i.e. h & O(s!)) para o qual P (h) = i, temos que

ui(Oh(h, s!1, . . . , s!n)) ' ui(Oh(h, s!1, . . . , si, . . . , s

!n)).

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 1. Introdução 19

Escolhemos desenvolver uma lógica de primeira-ordem baseada em CTL,chamada de Game Analysis Logic (GAL), por acreditarmos que esta é umalinguagem expressiva o suficiente para tratarmos um vasto espectro de tiposde interações e suas possíveis soluções. Além de CTL de primeira-ordem, GALcaracteriza-se por ter constantes lógicas que são utilizadas para representaros jogadores. Devido às possíveis combinações entre os operadores modais deCTL e os jogadores, é que podemos expressar diversos tipos de interaçõesentre os jogadores. Apesar de, à primeira vista, os operadores modais de GALserem “iguais” ao de CTL, suas interpretações são dadas de forma ligeiramentedistintas, como veremos em mais detalhes posteriormente. Na verdade, elessão interpretados à ótica dos jogadores que agem de forma conjunta a cadainstante. Quando os jogadores são desconsiderados, temos que GAL coincidecom CTL de primeira-ordem.

A lógica ATL também é uma lógica que estende a lógica CTL. Dife-rentemente de GAL, ATL é interpretada sobre jogos extensivos com açõessimultâneas1, no qual cada jogador possui um conjunto de ações a cada mo-mento do jogo. A relação de transição é então definida através das escolhas decada jogador e os operadores modais são interpretados sob esta ótica. Note queneste conceito exige-se que todos os jogadores tomem decisões e influenciem ojogo a todo momento.

Para representar jogos como xadrez, onde apenas um jogador atua acada instante, em ATL o que se faz é considerar as ações do jogador quenão deve atuar como um conjunto unitário. Desta forma, a ação resultanteé determinada apenas pelo outro jogador. Na verdade, essa é uma semânticaque não difere situações onde um jogador atua em um estado com apenas umapossibilidade, e situações onde o jogador de fato não tem influência alguma.Como exemplo, considere as seguintes interações entre dois homens: 1- Os doishomens estão para cometer um crime e um deles sempre concorda com a decisãodo outro, isto é, ele é também responsável pelo crime; 2- Um homem está paracometer um crime, enquanto o outro não tem responsabilidade nenhuma sobreo crime, por exemplo, ele pode nem ter conhecimento sobre este fato. EmATL, modelaríamos ambas as situações da mesma forma em um jogo no qualum dos homens tem duas possibilidades enquanto que o outro tem apenasuma possibilidade. A diferença entre estas duas situações em ATL é, então,desconsiderada.

Outro ponto que pode ser debatido sobre ATL, ainda mais importante, éque a relação de transição entre os estados de um jogo se dá através das escolhasindividuais que não consideram as escolhas dos outros jogadores. Assim, a

1Também chamados de jogos extensivos com informação quase perfeita.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 1. Introdução 20

transição se dá através de escolhas individuais dos jogadores, o que claramenteextirpa a possibilidade das ações de cada jogador serem possíveis somente deacordo com algum outro critério. Por exemplo, considere o caso onde um casalestá casado. Nesta situação existem duas possibilidades eles permaneceremcasados ou se separarem. Note que esta decisão usualmente ocorre de formaconjunta. Se utilizássemos ATL para modelar esta situação, teríamos queconsiderar as escolhas dos jogadores de forma individual. Assim, cada jogadorteria duas possibilidades, que iremos denotar por {Casado, Separado}, ea combinação destas possibilidades nos traz a quatro possíveis ações. Asações $Casado, Casado% e $Separado, Separado% têm conseqüências claras,contudo as ações $Casado, Separado% e $Separado, Casado% não têm umacontrapartida intuitiva, e o que acaba-se por fazer é arbitrar uma conseqüênciapara estes estados. Iremos apresentar este exemplo de forma mais detalhadaposteriormente.

Por esses motivos, escolhemos tomar uma interpretação extensionalde como se dão as ações, ou seja, as ações a cada instante são tomadaspelos jogadores que devem atuar naquele instante sem necessariamente seremdefinidas pelas escolhas individuais de cada jogador. Além disso, iremosdemonstrar que a parametrização dos operadores temporais de ATL podeser expressa na lógica GAL utilizando as características de primeira-ordem.Por conseqüência, não há a necessidade de tornar a linguagem restrita ainterpretação de ATL.

Uma outra razão que influenciou a escolha de CTL foi a existência deverificadores de modelos com algoritmos eficientes (complexidade linear), aexemplo do SMV (CGP99). O que não ocorre com lógicas mais expressivasdo que CTL, a exemplo de CTL* que o problema da verificação de modelos éPSPACE-Completo.

Por fim, a escolha de domínios constante se deveu ao fato de que estamosprocurando ter um melhor entendimento sobre jogos. Por este motivo, se GALfosse uma lógica de domínios variáveis, adicionaríamos à nossa linguagemdiversos problemas que, numa primeira análise, fogem da proposta desta tese.Só para exemplificarmos alguns dos problemas de lógicas modais de primeira-ordem com domínios variáveis, conseguimos expressar situações onde não hádesignação, como nos casos em que nos referimos ao ‘unicórnio’ ou ainda ao‘círculo quadrado’. Para ver mais detalhes sobre lógica modal de primeira-ordem veja (FM99).

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 1. Introdução 21

1.2Organização da Tese

Os primeiros capítulos destinam-se as definições que são utilizadas parajogos e verificação de modelos na literatura. Alguns exemplos destas seçõesserão utilizados nas seções posteriores quando situarmos a nossa abordagem emrelação às existentes na literatura. A estrutura básica desta tese é a seguinte:

– No capítulo 2, apresentamos os principais modelos da Teoria dos Jogos,assim como os seus principais conceitos. Especificamente, apresentamosos principais modelos não-cooperativos, que são jogo estratégico, jogoextensivo com informação perfeita (quase perfeita e imperfeita), assimcomo os seus principais conceitos de soluções, que são equilíbrio de Nash,equilíbrio de Nash de estratégias mistas, equilíbrio de subjogo perfeito eequilíbrio de estratégias comportamentais; Do lado dos modelos coopera-tivos apresentamos o jogo de coalizão com (e sem) utilidades transferíveis,assim como o conceito de solução core. Foram escolhidos apenas os tó-picos da Teoria dos Jogos que foram tratados até este momento nestetrabalho. Nesta seção, além de introduzirmos os principais conceitos daTeoria dos jogos, iremos propor uma redução na representação de umjogo extensivo e também a utilização de um certo tipo de jogo extensivocom informação imperfeita para prover um solução para jogo extensivocom informação perfeita. Como conseqüência, um menor esforço compu-tacional é necessário para encontrar os conceitos de soluções de formaautomática.

– No capítulo 3, introduziremos as lógicas temporais que são freqüente-mente utilizadas para a validação de software e hardware em ciênciada computação. Especificamente, as lógicas full Computation Tree Logic(CTL*), Computation Tree Logic (CTL) e Linear Temporal Logic (LTL)são apresentadas. Em particular, estaremos interessados na lógica CTL,que é base da lógica proposta neste trabalho. Do ponto de vista prático,iremos nos concentrar na técnica de verificação de modelos para CTL,apresentando dois algoritmos para verificação de CTL.

– Algumas das lógicas que são utilizadas para raciocinar sobre jogos sãoapresentadas no capítulo 4. Abordaremos as lógicas: Alternating-timeTemporal Logic (ATL) e sua variante Counterfactual ATL (CATL), cujosmodelos são jogos extensivos com informação quase perfeita; e CoalitionalGame Logic (CGL), cujos modelos são jogos de coalizão sem utilidadestransferíveis. Escolhemos estas 3 lógicas por acreditarmos que elas são

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 1. Introdução 22

as mais representativas para modelar cada tipo de interação (modelosnão-cooperativos e cooperativos).

– No capítulo 5, iremos apresentar a lógica Game Analysis Logic (GAL) queé a lógica proposta nesta tese para raciocinar sobre jogos. Consideraremosainda nesta seção alguns dos aspectos pertinentes a lógicas modaisde primeira-ordem, bem como algumas propriedades de certos tiposde jogos. Iremos prover também um algoritmo para a verificação demodelos de GAL conjuntamente com um protótipo desenvolvido comoum framework em Java. O verificador de modelos de GAL permiteaspectos computacionais, assim, diversos algoritmos podem ser utilizadospara as ações/estratégias de cada jogador. Isto não ocorre na maioria dosverificadores de modelos, tais como o SMV e o SPIN.

– Os principais modelos da Teoria dos Jogos assim como seus conceitos desoluções são expressos em GAL através de modelos de GAL e fórmulas deGAL, respectivamente, no capítulo 6. Os modelos e conceitos de soluçõestratados aqui são os apresentados no capítulo 2. Estudaremos ainda asalternativas de quantificação no contexto dos jogos extensivos. Por fim,iremos considerar outros modelos para jogos de coalizões com o intuitode demonstrar que a lógica GAL pode facilmente definir novos modelose conceitos de soluções.

– Iremos demonstrar que as lógicas ATL e CGL são fragmentos da lógicaGAL no capítulo 7.

– O capítulo 8 destina-se a apresentar alguns experimentos desenvolvidosutilizando o verificador de modelos de GAL. Mostramos como o nossoalgoritmo pode ser utilizado para achar algumas das soluções da Teoriados Jogos. Iremos também descrever como alguns dos algoritmos parajogos da ciência da computação podem ser utilizados na abordagem aquiproposta utilizando o protótipo desenvolvido para GAL. Um exemplo deleilão será apresentado nesta seção.

– No capítulo 9 concluímos este trabalho apresentando os principais resul-tados, e ainda apontando os desdobramentos e trabalhos futuros.

– O relacionamento entre os modelos de LORA (sistemas multi-agentesbaseados em BDI) e os jogos extensivos foi apresentado em (VHB06), euma versão estendida do mesmo é apresentada no apêndice C desta tese.A justificativa para este resultado não aparecer no corpo da tese é queo seu relacionamento com a lógica GAL se dá apenas de forma indireta,através do mapeamento dos jogos extensivos em GAL.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

2Teoria dos Jogos

A Teoria dos Jogos tem como marco principal a publicação do livro devon Neumann e Morgenstern, Theory of Games and Economic Behavior (1944)(NM44), onde buscou-se utilizar do rigor matemático para estabelecer critériosde racionalidade aos agentes (jogadores) que interagem em um ambientecomum na busca por certos objetivos individuais ou coletivos.

Naquela época a utilização da matemática não era amplamente aceita, e,na verdade, era de muita controvérsia dentro da economia. Na publicação emcomento, discutiu-se e comparou-se a economia a outras ciências com respeitoà utilização da matemática. Para os autores, tais ciências jamais obteriamo grau de desenvolvimento à época sem o uso da matemática. Levando-seem consideração o sucesso das outras ciências que já vinham utilizando amatemática, não haveria motivo para crer no insucesso da mesma utilizaçãopela economia. O que se pretendia nesta publicação era dar o inicio à Teoria dosJogos, sem necessariamente ter objetivos imediatos de modelar e interpretar ocomportamento humano e econômico como um todo.

Um dos aspectos mais importantes do trabalho de von Neumann eMorgenstern foi prover um tratamento quantitativo, a teoria das utilidades,para descrever e analisar jogos, abrangendo assim um maior espectro de tiposde jogos. A teoria das utilidades é sempre debatida devido a alguns de seusaxiomas (Rub91), contudo este debate foge ao escopo deste trabalho.

Existem dois tipos de funções de utilidades: utilidade ordinal, onde osvalores das utilidades não são importantes, mas a relação de preferência é; eutilidade cardinal, onde além de mantida a relação de preferência a diferençaentres os valores das utilidades é levada em consideração. Considere umexemplo onde uma pessoa prefere laranja à maçã. Podemos definir uma funçãode utilidade associando valores 2 e 1, respectivamente, para laranja e maçã.Em utilidade ordinal só estamos dizendo que a laranja é preferível à maçã.Contudo, em utilidade cardinal estamos também dizendo que a laranja é duasvezes mais preferível à maçã. Esta distinção é fundamental no desenvolver daTeoria dos Jogos. A teoria das utilidades desenvolvida por von Neumann eMorgenstern subentende utilidade cardinal.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 24

O que von Neumann e Morgenstern acreditavam à época de fato vem secomprovando, e a Teoria dos Jogos evoluiu com o passar dos anos, tornando-semais próxima dos problemas reais. Esta abordagem obteve relativo sucessoe tem sido empregada em diversas áreas do conhecimento, a exemplo deeconomia, relações internacionais e até mesmo de biologia. O reconhecimentona área de economia foi tão grande que o prêmio Nobel de economia foiconcedido em duas oportunidades aos pesquisadores da área: John C. Harsanyi,John F. Nash Jr. e Reinhard Selten em 1994; Robert J. Aumann e ThomasC. Schelling em 2005. Atualmente, dispomos de uma vasta produção literáriasobre o tema (OR94, FT91, Ros06, AH92, LR57, Dav83, Wil86, Gib92, Sch80).

A partir da ótica da Teoria dos Jogos são criados modelos matemáticosque tentam abstrair características comuns a determinados tipos de interaçõesentre os agentes, tais como jogos estratégicos, extensivos e coalizões. Tambémsão criados conceitos de soluções e provas matemáticas do que seriamas análises, ou seja, o que se está interessado em observar de cada tipo deproblema, tais como os conceitos de equilíbrio de Nash, de subjogo perfeito ecore. Os conceitos de soluções definidos na Teoria dos Jogos assumem que osjogadores são racionais, na medida que ao tomarem suas decisões, eles estãotentando maximizar os seus objetivos através de algum processo de otimizaçãolevando em consideração que os outros jogadores também estão.

Existem diversas interpretações para os conceitos de soluções da Teoriados Jogos, tais como: uma descrição do comportamento de agentes racionais(Homo rationalis); uma prescrição ou um conselho para os jogadores decomo agir; ou ainda como uma descrição do comportamento humano (HomoSapiens). Neste trabalho não iremos entrar em detalhes sobre esta discussão.

Os modelos da Teoria dos Jogos são basicamente divididos em dois gru-pos: modelos não-cooperativos, nos quais os conjuntos de possíveis ações dosjogadores são as primitivas; e modelos cooperativos, nos quais os conjuntos depossíveis ações tomadas em conjunto pelos jogadores são as primitivas. Recen-temente, alguns modelos incorporam aspectos cooperativos e não-cooperativos.Um bom exemplo disto é apresentado em (BS06), onde um jogo é definido emdois estágios: no primeiro estágio os jogadores tomam decisões em um jogo ex-tensivo; as estratégias dos jogadores no primeiro estágio levam a um segundoestágio – um jogo de coalizão com utilidades transferíveis.

O restante deste capítulo está dividido de modo a apresentar os principaismodelos não-cooperativos e cooperativos, e ainda, seus principais conceitosde soluções. Dentre os modelos não-cooperativos iremos apresentar: na seção2.1 os jogos estratégicos, assim como os conceitos de soluções de equilíbriode Nash e equilíbrio de Nash de estratégias mistas. O conceito de ótimo de

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 25

Pareto é também apresentado devido a sua importância dentro da economia; osjogos extensivos com informação perfeita e o conceito de equilíbrio de subjogoperfeito na seção 2.2; na seção 2.3 os jogos extensivos com informação quaseperfeita; e, por fim, na seção 2.4 os jogos extensivos com informação imperfeita,bem como os conceitos de equilíbrio de estratégias mistas e comportamentais.Do lado dos modelos cooperativos, apresentamos: os jogos de coalizão comutilidades transferíveis, com o seu principal conceito de solução, que é o core,na seção 2.6; e os jogos de coalizão sem utilidades transferíveis e o conceito decore na seção 2.7. Vale a pena notar que existem diversos outros modelose conceitos de soluções que não foram aqui mencionados. Utilizaremos asdefinições e notações o mais semelhante possível das encontradas em (OR94).

Um resultado deste trabalho é apresentado na seção 2.5 deste capítulo.Iremos propor uma redução na representação dos jogos extensivos e também autilização de um certo tipo de jogo extensivo com informação imperfeita paraprover soluções para jogos extensivos com informação perfeita. Estes resultadosserão úteis para os estudos de casos que serão realizados utilizando a verificaçãode modelos em uma seção posterior.

Os exemplos que serão utilizados nesta seção têm um caráter mais ilustra-tivo. Contudo, gostaríamos de deixar claro que exemplos reais são encontradosem diversas situações. Um exemplo é uma rede de computadores que liga umafonte a vários destinos através de uma rede que possui custos associados aos ar-cos. O que torna este problema interessante é a possibilidade de vários agentes(os destinos) poderem compartilhar os custos quando eles utilizam o mesmoarco. Na figura 2.1.a, apresentamos uma rede de computadores que liga a fonteo aos destinos d1 e d2. O destino d1 tem como caminho possível a partir deo: o arco mais externo à esquerda, rotulado por A, cujo custo é 4; e os arcosB e L, que têm custos 5 e 1, respectivamente. O destino d2 também possuiapenas dois caminhos: o arco mais externo à direita, rotulado por C, cujo custoé 8; e os arcos B e R com custos de 5 e 2, respectivamente. Sabendo que oscustos são divididos quando os arcos são compartilhados, então qual deveriaser o caminho tomado por cada destino para que ele minimize os seus custos?Note que esta decisão depende das escolhas dos outros destinos. Apesar denão entrarmos em detalhes neste momento, podemos facilmente modelar esteproblema como um jogo estratégico (veja figura 2.1.b), onde cada destino re-presenta um jogador, e cada possível caminho de um jogador é uma estratégiade cada jogador. As utilidades são definidas através das escolhas de cada joga-dor. Desta forma, utilizamos o conceito de solução de equilíbrio de Nash paraprover uma solução tal que nenhum jogador pode de forma individual alterarsua estratégia e obter um menor custo. Neste jogo, o único equilíbrio de Nash

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 26

é a solução na qual o destino d1 escolhe !B,L" e o destino d2 escolhe !B,R",e seus custos são 3.5 e 4.5, respectivamente.

c(A) = 4c(B) = 5c(C) = 8c(L) = 1c(R) = 2

!"#$

o

!!!!!!!"

##

##

##

#$

%

A B C

!"#$

&&&&'(((() L R

i

!"#$

d1 !"#$

d2

!B,L"

!A"

!C" !B, R"

#4.0 , #8.0

#6.0 , #8.0

#4.0 , #6.0

#3.5 , #4.5

(a) - Estrutura da Rede (b) - Jogo Estratégico

Figura 2.1: Uma rede de computadores com custos compartilhados.

2.1Jogo Estratégico

Um jogo estratégico é um modelo de tomada de decisão no qual cadaresponsável pelas decisões (jogadores) escolhe sua ação uma única vez, e todosos jogadores fazem suas escolhas simultaneamente1. O modelo consiste em umconjunto de jogadores N e, para cada jogador i, um conjunto Ai de ações euma relação de preferência sobre o conjunto A =

!

i!N

Ai. Uma estratégia para

um jogador i é uma ação ai $ Ai. Um perfil de estratégias (ou de ações)é definido como uma n-upla de estratégias (ai)i!N , ou seja, uma ação para cadajogador i pertencente à N . Definem-se a"i = (aj)j!N\{i} como sendo a n-uplaa sem a ação do jogador i e o par (a"i, ai) como sendo a n-upla a.

Definição 2.1 Jogo Estratégico (Strategic Game) ! = !N, (Ai), (%i)":

– um conjunto finito N (de jogadores).

– para cada jogador i $ N , um conjunto não-vazio Ai (de ações disponíveispara o jogador i).

– para cada jogador i $ N , uma relação de preferência (relação de ordem)%i sobre A =

!

i!N

Ai (a relação de preferência do jogador i).

Se o conjunto Ai de ações de cada jogador for finito então o jogo é finito.Em diversas circunstâncias a relação de preferência %i de cada jogador

pode ser representada por uma função de utilidade ui: A & R (também1Por simultâneo, queremos dizer que cada jogador, ao tomar sua decisão, desconhece as

escolhas dos outros. Assim, os jogadores podem tomar suas decisões em tempos diferentes,mas, ao tomarem, desconhecem as escolhas dos outros.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 27

chamada de função de payo! ). Assim, ui(a) ' ui(b) sempre que a %i b. Osvalores da função são chamados de utilidades (ou payo!s). Então, o jogo serádefinido como ! = !N, (Ai), (ui)".

Um jogo finito estratégico com dois jogadores pode ser representadoconvenientemente em uma tabela, na qual as linhas são as ações de um jogadore as colunas são as ações do outro jogador. Cada célula possui uma n-upla!l, c", onde l e c são as utilidades das escolhas das ações da linha l e da colunac dos jogadores. Na figura 2.2, temos um jogo estratégico com dois jogadoresno qual um escolhe uma das duas linhas e o outro escolhe uma das colunas.O conjunto de ações dos jogadores das linhas e colunas são {T,B} e {L,R},respectivamente. As funções de utilidades são representadas nas células. Porexemplo, quando os jogadores escolhem as ações T e R, as suas utilidades sãox1 e x2, respectivamente.

B

T

R L

x1,x2

y1,y2

z1,z2

w1,w2

Figura 2.2: Jogo estratégico com dois jogadores.

Apresentamos abaixo diversas situações estratégicas e como podemosmodelá-las como jogos estratégicos. Os modelos apresentados abaixo sãoexemplos clássicos na literatura e apesar de simples expõem bem o propósitoda Teoria dos Jogos.

Exemplo 2.2 [Batalha dos Sexos] Duas pessoas (um homem e uma mulher)desejam sair juntos para um concerto de música ou de Bach ou Stravisky.Contudo, uma delas (o homem) prefere Bach, enquanto que a outra (a mulher)prefere Stravisky.

Nesta situação está claro que temos dois jogadores (um homem e umamulher), que iremos representá-los como h e m, e que cada jogador pode es-colher entre Bach ou Stravisky, que serão representados como B e S, res-pectivamente. Para representar suas relações de preferências, devemos ob-servar que ambos preferem sair juntos a saírem separados. Assim, temosque !B,B"(h !B, S", !B,B" (h !S, B", !S, S" (h !B,S", !S, S" (h !S, B",!B, B"(m!B, S", !B,B"(m!S,B", !S, S"(m!B,S" e !S, S"(m!S, B". E queo homem prefere ir ao concerto de Bach, ou seja, !B,B" (h !S, S", enquanto

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 28

que a mulher prefere Stravisky !S, S" (m !B, B". E ainda que ambos são in-diferentes se eles vão separados, ou seja, !B, S" )h !S, B" e !S, B" )m !B, S".Formalmente, este jogo é definido por !{h,m}, (Ah, Am), (%h,%m)", onde

– Ah = Am = {B, S}.

– !B, B" (h !B, S", !B,B" (h !S, B", !S, S" (h !B, S", !S, S" (h !S, B",!B, B"(m !B, S", !B, B"(m !S, B", !S, S"(m !B, S", !S, S"(m !S, B",!B, B"(h!S, S", !S, S"(m!B, B", !B, S")h!S,B" e !S, B")m!B, S".

Podemos arbitrar valores que satisfaçam estas relações de preferênciaspara definirmos este jogo utilizando funções de utilidades. Na figura 2.3, apre-sentamos duas versões deste jogo utilizando funções de utilidades diferentes.Note que ambas as funções satisfazem as relações de preferências dos jogadorescomo definido acima. Como verermos no restante deste capítulo, as diferentesfunções de utilidades para o mesmo problema podem apresentar diferentessoluções como no caso do conceito de equilíbrio de Nash de estratégias mis-tas que será definido posteriormente. Deixaremos esta discussão para quandoapresentarmos este conceito.

B

S

B S

2,1

0,0

0,0

1,2

B

S

B S

3,1

0,0

0,0

1,3

Figura 2.3: Duas representações do jogo estratégico Batalha dos Sexos.

Exemplo 2.3 [Dilema dos Prisioneiros] Dois suspeitos de um crime sãoacusados de terem cometido um crime conjuntamente. Para cada um deles,a polícia diz: “Se vocês dois confessarem o crime, cada um ficará seis anos naprisão. Se você confessar e seu parceiro não confessar, você ficará apenas doisanos preso por sua colaboração e o seu parceiro dez anos, pela resistência. Seninguém confessar, ambos ficarão presos quatro anos”.

Neste exemplo temos dois jogadores, que representamos por 1 e 2,com duas ações cada confessar e não confessar, representadas por C e NC,respectivamente. As relações de preferências são definidas da seguinte forma:!C, NC" (1 !C,C", !C,NC" (1 !NC, C", !C,NC" (1 !NC,NC",!NC, NC" (1 !NC, C", !NC, NC" (1 !C, C", !C,C" (1 !NC,C",!NC, C" (2 !C,C", !NC, C" (2 !C,NC", !NC, C" (2 !NC,NC",!NC, NC" (2 !C,NC", !NC, NC" (2 !C, C", !C,C" (2 !C, NC".

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 29

Note que apesar de neste exemplo definirmos os valores que cada prisioneiropoderá ficar preso, não podemos utilizar estes valores de forma direta como asutilidades de cada jogador, pois estes não estarão de acordo com as relaçõesde preferências dos jogadores. Na figura 2.4 apresentamos duas representaçõesdeste jogo.

C

NC

C NC

2,2

0,4

4,0

3,3

C

NC

C NC

#6,#6

#10,#2

#2,#10

#4,#4

Figura 2.4: Duas representações do jogo estratégico Dilema do Prisioneiro.

Exemplo 2.4 [Matching Pennies] Duas crianças (1 e 2) possuem, cada uma,uma moeda. Ao arremessarem as moedas, escolhem entre cara ou coroa. Se suasescolhas coincidirem, a criança 2 paga R$1, 00 à criança 1, caso contrário, acriança 1 paga R$1, 00 à criança 2.

Neste exemplo, temos dois jogadores, que representamos por 1 e 2, comduas possibilidades de escolhas: cara ou coroa, representadas neste exemplocomo Cara ou Coroa. A relação de preferência é dada da seguinte forma:!Cara, Cara" (1 !Cara, Coroa", !Cara, Cara" (1 !Coroa, Cara",!Coroa, Coroa" (1 !Cara, Coroa", !Coroa, Coroa" (1 !Coroa, Cara",!Cara, Coroa" )1 !Coroa, Cara", !Cara, Cara" )2 !Coroa, Coroa",!Cara, Coroa" (2 !Cara, Cara", !Cara, Coroa" (2 !Coroa, Coroa",!Coroa, Cara" (2 !Cara, Cara", !Coroa, Cara" (2 !Coroa, Coroa".

Diferentemente do dilema anteriormente apresentado, dilema do prisio-neiro, neste podemos utilizar a função de utilidade de forma clara atravésdo exemplo. Vejamos a figura 2.5 que representa este jogo com a função deutilidade representando quanto de dinheiro cada jogador ganhou ou perdeu.

Coroa

Cara

Cara Coroa

+1,#1

#1,+1

#1,+1

+1,#1

Figura 2.5: Uma representação do jogo estratégico Matching Pennies.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 30

2.1.1Equilíbrio de Nash

Um dos conceitos de soluções mais importantes em Teoria dos Jogos éo equilíbrio de Nash (Nash equilibrium) (Nas50) onde um perfil de estratégiasé um equilíbrio de Nash se, e somente se, nenhum jogador pode de formaunilateral alterar sua estratégia de forma que esta seja preferida por ele.

Definição 2.5 Um equilíbrio de Nash de um jogo estratégico !N, (Ai), (%i)"é um perfil de estratégias a# $ A tal que para cada jogador i $ N , temos que2

(a#"i, a#i ) %i (a#"i, ai) para todo ai $ Ai

Apesar deste conceito ter forte apelo nem sempre podemos utilizá-lo,pois em certos casos não temos soluções únicas ou mesmo uma solução. Iremosmostrar abaixo algumas dessas condições utilizando os exemplos da seção 2.1.

No exemplo 2.2, Batalha dos Sexos, temos dois equilíbrios de Nash, !B, B"e !S, S", onde ambos vão para o concerto de Bach ou de Stravisky. Para verque !B, B" é um equilíbrio de Nash, note que se o homem escolher Bach amulher prefere Bach, pois ela prefere sair junto com o homem a ir só aoconcerto de Stravisky. O mesmo se verifica para a mulher. Assim, os doisirem para o concerto de Bach é uma solução, onde nenhum dos dois podeobter uma melhor solução alterando a sua estratégia de forma unilateral. Oraciocínio para o equilíbrio !S, S" é semelhante. Vale notar que se utilizássemosas definições com relações de preferências ou funções de utilidades, teríamossempre as mesmas soluções.

No exemplo 2.3, Dilema do Prisioneiro, temos um único equilíbrio deNash !C,C", onde ambos os prisioneiros confessam o crime. Para verificarmosisso, veja que se o prisioneiro 1 confessar, então o melhor que o prisioneiro2 faz é também confessar. O mesmo ocorre para o prisioneiro 2. Assim,ambos confessarem é um equilíbrio de Nash. Vale notar que esta soluçãoé pior para ambos os jogadores do que a solução !NC, NC", onde ambosnão confessam. Mas vale notar que os prisioneiros não têm como de formaindividual garantirem esta solução. Mesmo quando apresentamos este jogo na

2Lembre-se que um jogo estratégico pode ser definido utilizando funções de utilidades.Assim, o conceito de equilíbrio de Nash é um perfil de estratégias a! $ A tal que para cadajogador i $ N , temos que

ui(a!"i, a!i ) ' ui(a!"i, ai) para todo ai $ Ai

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 31

sua forma extensivo (que será apresentado mais adiante) temos como soluçãoapenas !C, C".

Como dito anteriormente existem algumas situações onde não existenenhum equilíbrio de Nash. O exemplo 2.4, Matching Pennies, não apresentanenhum equilíbrio de Nash.

2.1.2Equilíbrio de Nash de Estratégias Mistas

Em vez de consideramos que cada jogador toma sua decisão de formapura, i.e., escolhendo uma das possíveis ações, podemos estender o conceito deequilíbrio de Nash para permitir que os jogadores utilizem uma distribuição deprobabilidades sobre o conjunto de ações. Uma estratégia mista !i para ojogador i é uma distribuição de probabilidades sobre o conjunto de ações Ai.Denotamos !i(ai) como a probabilidade que !i atribui à ação ai. O conjuntode estratégias mistas do jogador i é representado como "(Ai). Uma estratégiamista "i para o jogador i é denominada de degenerada se atribui o valor 1 parauma das ações do jogador i e 0 para as demais do jogador i. O conjunto deestratégias degeneradas para o jogador i é representado por #(Ai).

Segundo a teoria das utilidades de von Neumann e Morgenstern asescolhas dos jogadores são independentemente randômicas3 e as funções deutilidades de cada jogador, considerando um perfil de estratégias mistas (!i),é definida como segue.

Ui(!1, . . . , !n) ="

a!A

##!

j!N

!j(aj)

$* ui(a)

$

No exemplo 2.2, Batalha dos Sexos, apresentado na tabela da esquerdada figura 2.3 temos as utilidades para o jogador 1 para o perfil de estratégiasmistas

%%23 ,

13

&,%

13 ,

23

&&como calculado abaixo.

U1

'(2

3,1

3

),

(1

3,2

3

)*

=2

3* 1

3* u1(B, B) +

2

3* 2

3* u1(B,S) +

1

3* 1

3* u1(S,B) +

1

3* 2

3* u1(S, S)

=2

3* 1

3* 2 +

2

3* 2

3* 0 +

1

3* 1

3* 0 +

1

3* 2

3* 1

=6

9.

3Um probabilidade é independentemente randômica se a probabilidade de que doiseventos, A e B, ocorram juntos P (A +B) é de P (A)P (B).

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 32

Definição 2.6 Um equilíbrio de Nash de Estratégias Mistas para um jogoestratégico ! = !N, (Ai), (ui)" é um perfil de estratégias mistas ! # tal que paracada jogador i $ N temos que

Ui(! #"i, !#i ) ' Ui(! #"i, "i) para toda estratégia degenerada "i $ #(Ai)

Existem várias interpretações para o conceito de equilíbrio de Nash de estra-tégias mistas. Para ver mais detalhes veja (OR94).

No exemplo 2.2, Batalha dos Sexos, apresentado na tabela da esquerdada figura 2.3 temos como equilíbrios de Nash de estratégias mistas as se-guintes soluções puras !!1, 0", !1, 0"" e !!0, 1", !0, 1"" e a seguinte solução mista!!2

3 ,13", !

13 ,

23"".

Na tabela da direita da figura 2.3 consideramos uma outra versão4 doexemplo 2.2, Batalha dos Sexos. Os equilíbrios de Nash de estratégias mistassão as seguintes soluções puras !!1, 0", !1, 0"" e !!0, 1", !0, 1"" e a seguintesolução mista !!3

4 ,14", !

14 ,

34"". Do ponto de vista do conceito de solução de

equilíbrio de estratégias mistas, as duas versões são diferentes. Assim, aomodelarmos um problema como um jogo, devemos ser cuidadosos ao atribuiros valores das utilidades.

Para o exemplo 2.4, Matching Pennies, que não tem equilíbrio de Nash,temos um único equilíbrio de estratégias mistas !!1

2 ,12", !

12 ,

12"".

Um dos resultados mais importantes é a proposição abaixo que foidemonstrada por Nash, que assegura a existência de equilíbrio de Nash deestratégias mistas. A prova desta proposição é baseada no teorema de pontofixo de Brouwer-Kakutani (Kak41) e pode ser encontrada em diversas fontes(OR94, FT91).

Proposição 2.7 Todo jogo estratégico finito tem pelo menos um equilíbrio deNash de estratégias mistas.

2.1.3Ótimo de Pareto

Um dos conceitos mais utilizados em economia é o de ótimo de Pareto5

(Pareto Optimal), no qual um perfil de estratégias é um ótimo de Pareto se,e somente se, nenhum outro perfil de estratégias pode melhorar a solução deum jogador sem piorar a solução para pelo menos um outro jogador.

4Note que em ambos os casos as utilidades respeitam as relações de preferências (%i)deste problema.

5Apesar deste conceito não seguir as suposições da Teoria dos Jogos, optamos porconsiderá-lo aqui devido a sua importância dentro da economia.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 33

Definição 2.8 Um ótimo de Pareto de um jogo estratégico !N, (Ai), (%i)" éum perfil de estratégias a# $ A tal que não existe um outro perfil de estratégiasa $ A onde existe um jogador j $ N a (j a# e para todos os jogadores i $ N

a %i a#.

No exemplo 2.3, dilema do prisioneiro, a solução !NC, NC" é um ótimode Pareto. Note que não há relação entre ótimo de Pareto e equilíbrio de Nashcomo demonstra este exemplo.

2.2Jogo Extensivo com Informação Perfeita

Em vez de considerarmos que os jogadores tomam apenas uma decisãocomo no caso dos jogos estratégicos, podemos considerar uma versão maisdetalhada de uma situação estratégica. Nestas situações os jogadores podemtomar decisões em várias etapas. Desta forma, cada jogador pode reconsiderar oseu plano de ação a cada instante do jogo que ele deve tomar uma decisão. Estetipo de jogo é chamado de jogo extensivo (extensive game). Um jogo extensivo édito de informação perfeita (perfect information) se um jogador ao tomar a suadecisão, tem conhecimento de todos os eventos que aconteceram anteriormenteno jogo. Os jogos extensivos com informação perfeita permitem que apenas umjogador tome uma decisão a cada instante. Em uma seção posterior, iremosestender este modelo para permitir jogos com ações simultâneas. Formalmente,um jogo extensivo com informação perfeita é definido como segue.

Definição 2.9 Um jogo extensivo com informação perfeita é definidopor !N,H,P, (ui)", onde

– N é um conjunto finito (de jogadores).

– H é um conjunto de seqüências (finitas e infinitas) de ações, chamadode conjunto de históricos, que satisfazem as seguintes propriedades

– uma seqüência vazia é um histórico, i.e., , $ H

– se (ak)k!K $ H onde K - N e para todo l . |K|, então (ak)k=0,...,l $H

– se (a0 . . . ak) $ H para todo k $ N, então a seqüência infinita(a0a1 . . .) $ H.

Um histórico h é terminal se ele é infinito ou se não existe uma açãoa tal que (h, a) $ H. O conjunto de terminais é representado por T.

– P é uma função que atribui para cada histórico não-terminal um jogador.

– Para cada jogador i $ N , uma função de utilidade ui sobre T .

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 34

A interpretação de um jogo extensivo é como segue. A seqüência vazia, representa o início do jogo, e para cada histórico não-terminal h o jogadorP (h) escolhe uma ação do seguinte conjunto.

A(h) = {a | (h, a) $ H}

Note que esta definição permite seqüências infinitas, para tanto é assumido quenenhuma ação é tomada após um histórico infinito, assim este é um históricoterminal.

Abaixo apresentamos um exemplo com o intuito apenas de exemplificara definição de jogo extensivo. Este mesmo exemplo será utilizado em seçõesposteriores.

Exemplo 2.10 Um exemplo de um jogo extensivo com dois jogadores!N,H,P, (ui)", onde

– N = {1, 2}

– H = {,, (A), (B), (A,L), (A,R)}

– P(,) = 1 e P((A)) = 2

– u1((B)) = 1,u1((A,L)) = 0,u1((A,R)) = 2,u2((B)) = 2,u2((A,L)) = 0,u2((A,R)) = 1

O exemplo 2.10 é mostrado como uma árvore na figura 2.6.b, na qual araiz é o estado inicial ,, cada arco é uma ação a, e os números dentro de cadanó representam a função P . Os históricos são representados pelas seqüênciasde ações a partir da raiz. As funções de utilidades são apresentadas no fim decada ramo da árvore.

!A"

!B"

!L" !R"

0,0

1,2

2,1

1,2

(a) - Representação Matricial (b) - Representação Extensiva

0,0 2,1

1,2

A B

L R

%1*

***+

,,

,,-%2*

**+,

,,-

Figura 2.6: Jogo Extensivo na versão matricial e extensiva do exemplo 2.10.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 35

Uma estratégia de um jogador i é uma função si que atribui uma açãoa a cada histórico não-terminal h para o qual P (h) = i, i.e., si(h) = a $ A(h).No exemplo 2.10, o jogador 1 tem que tomar uma decisão apenas no estadoinicial, e ele tem duas possíveis ações A e B. O jogador 2 toma decisão nohistórico (A), e ele tem duas possíveis ações L e R. Denotamos Si como oconjunto de estratégias para o jogador i. Referenciamos s = (si) como umperfil de estratégias, uma para cada jogador i $ N . Definimos O(s1, . . . , sn)como o histórico terminal quando cada jogador segue a sua estratégia si. Iremosrepresentar uma estratégia de um jogador i através de uma seqüência de açõestomadas por i através de uma busca em largura na árvore do jogo6. Assim, noexemplo 2.10, as estratégias do jogador 1 são !A" e !B", enquanto que parao jogador 2 são !L" e !R". E, !!B", !L"" é um perfil de estratégias no qual ojogador 1 escolhe B no histórico inicial, e o jogador 2 escolhe L no histórico(A), e O(!B", !L") é o histórico terminal (B).

Um jogo extensivo com informação perfeita pode ser modelado como umjogo estratégico no qual o conjunto de ações de cada jogador é o conjuntode estratégias do jogador (no jogo extensivo), i.e., Ai = Si. E, cada funçãode utilidade Ui (do jogo estratégico) é a função de utilidade ui (do jogoextensivo) aplicada as estratégias de cada jogador, i.e., Ui(s1, . . . , sn) =

ui(O(s1, . . . , sn)). Desta forma, a solução de equilíbrio de Nash pode serutilizada para prover uma solução para um jogo extensivo. O exemplo 2.10é mostrado na figura 2.6.a como um jogo estratégico. Aplicando o conceito deequilíbrio de Nash chegamos a duas soluções !!A", !R"" e !!B", !L"".

Diversos teóricos de jogos argumentam que a solução !!B", !L"" não érazoável quando os jogadores consideram a seqüência das escolhas das ações decada jogador. Para ver isto, devemos observar que no histórico (A) o jogador 2

escolherá R em vez de L, pois ele irá obter uma melhor utilidade (sua utilidade é1 em vez de 0). Assim, o jogador 2 tem um incentivo para desviar do equilíbrio.Na próxima seção, iremos apresentar uma solução de equilíbrio que consideraa seqüência das ações tomadas pelos jogadores.

2.2.1Equilíbrio de Subjogo Perfeito

Um conceito de solução alternativo para um jogo extensivo com informa-ção perfeita é o equilíbrio de subjogo perfeito, que requer que a ação tomadapor cada jogador em cada histórico seja ótima, dadas as estratégias dos outrosjogadores. Definimos Oh(h, s1, . . . , sn) como o histórico terminal quando cada

6Para evitar confusão, iremos utilizar os símbolos ‘!’ e ‘"’ para delimitar as estratégias,enquanto que os históricos serão delimitados por ‘(’ e ‘)’.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 36

jogador segue a sua estratégia si a partir do histórico h, ou seja, no subjogoa partir do histórico h. Assim, definimos ui(Oh(h, s1, . . . , sn)) como a utili-dade do jogador i quando cada jogador segue a sua estratégia si a partir dohistórico h. No exemplo 2.10, Oh((A), !B", !L") é o histórico terminal (A,L) eu1(Oh((A), !B", !L")) = u1((A,L)) = 0.

Definição 2.11 Um equilíbrio de subjogo perfeito (ESP) para um jogoextensivo com informação perfeita !N, H, P, (ui)" é um perfil de estratégiass# = (s#i ) tal que para todo jogador i $ N e para todo histórico não-terminalh $ H para o qual P (h) = i, temos que

ui(Oh(h, s#1, . . . , s#n)) ' ui(Oh(h, s#1, . . . , si, . . . , s

#n))

para toda estratégia si $ Si.

No exemplo 2.10, o único equilíbrio de subjogo perfeito é !!A", !R"".Assim, neste equilíbrio nenhum jogador pode desviar do equilíbrio de formaunilateral obtendo uma utilidade maior considerando cada histórico não-terminal.

Denotamos |!| e |!(h)| como o tamanho do maior histórico no jogo ! eo tamanho do maior histórico de ! a partir do histórico h, respectivamente.No exemplo 2.10, temos que |!| = 2; |!(,)| = 2; |!((A))| = 1; |!((B))| = 1;|!((A,L))| = 0; |!((A,R))| = 0.

A idéia do teorema abaixo foi inicialmente apresentado em (Zer13) e foiprovado e generalizado por (Kuh53). O que este teorema garante é que qualquerjogo extensivo finito com informação perfeita tem pelo menos um equilíbrio desubjogo perfeito. A idéia é construir um conjunto de estratégias, começandopelos históricos não-terminais que só tenham históricos terminais, e escolher amelhor ação para o jogador que deve tomar uma decisão naquele histórico. Apartir daí, segue-se este processo de trás para frente na estrutura do jogo atéatingir o histórico inicial. Desta forma, constrói-se um perfil de estratégias queé um equilíbrio de subjogo perfeito.

Teorema 2.12 Todo jogo extensivo finito com informação perfeita tem pelomenos um equilíbrio de subjogo perfeito.Prova. Sejam ! = !N, H, P, (ui)" e |!| um jogo extensivo com informação per-feita e o tamanho do maior histórico em !, respectivamente. Iremos construirum perfil de estratégias (s#i ) de ! que é um equilíbrio de subjogo perfeito porindução no tamanho do maior histórico em !.

– Base: Se |!(h)| = 0 (i.e. o histórico h é terminal), entãoOh(h, s#1, . . . , s

#n) = Oh(h, s1, . . . , sn) para toda estratégia si $ Si e

para todo jogador i.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 37

– Passo Indutivo: |!(h)| = k + 1 (i.e. o histórico h é não-terminal) eseja i = P (h). Para todo a $ A(h), temos que |!(h, a)| . k. Daípor hipótese de indução o perfil de estratégias (s#i ) é um ESP paratodo (h, a). Defina s#i (h) = a $ A(h) tal que ui(Oh(h, s#1, . . . , s

#n)) '

ui(Oh(h, s#1, . . . , si, . . . , s#n)), para toda estratégia si $ Si, onde a estra-tégia si é definida até h através do produto cartesiano entre as escolhassi(h) = a $ A(h) e as estratégias definidas pela hipótese de indução.

Por indução temos que o perfil de estratégias s# é definido para jogos finitos,e é um equilíbrio de subjogo perfeito. !

O procedimento acima é chamado de indução retroativa (backward induction).Um resultado que segue deste teorema é que se considerarmos jogos de soma-zero com dois jogadores alternando as jogadas7, então temos que existe umaestratégia que garante que um dos jogadores ganhe ou empate. A partir desteresultado, temos que jogos como xadrez são determinados, e, do ponto de vistateórico, são sem interesse. Apesar deste resultado, devemos observar que jogoscomo xadrez são difíceis de serem resolvidos na prática, e, por este motivo,ainda é desconhecido qual seria o jogador que tem uma estratégia vencedora equal é esta estratégia.

Abaixo representamos o exemplo 2.3, Dilema do Prisioneiro, na suaversão extensiva. A história do dilema dos prisioneiros é muita vezes contadacom a restrição de que os dois jogadores são colocados em celas separadas,não podendo assim haver comunicação. Como mostraremos no exemplo 2.13esta restrição não é necessária. A figura 2.7 apresenta sua forma estratégicae extensiva. Como podemos verificar, utilizando os conceitos de equilíbrio deNash e de equilíbrio de subjogo perfeito chegamos a mesma solução, que são!!C", !C"" e !!C", !C, C"", respectivamente, onde a melhor coisa a fazer, paraambos, é confessar.

Exemplo 2.13 O dilema na sua forma extensiva é representado por!N,H,P, (ui)", onde

– N = {1, 2}.

– H = {,, (C), (NC), (C, C), (C, NC), (NC, C), (NC, NC)}.

– P(,) = 1 e P((C)) = P((NC)) = 2.

– u1((C, C)) = 2,u1((C,NC))=4,u1((NC, C)) = 0,u1((NC,NC))=3,u2((C, C)) = 2,u2((C,NC))=0,u2((NC, C)) = 4,u2((NC,NC))=3.

7Jogos de soma-zero são jogos cujas soma das utilidades de qualquer resultado do jogo ézero.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 38

!C"

!NC"

!C" !NC"

2,2

0,4

4,0

3,3

(a) - Jogo Estratégico (b) - Jogo Extensivo

2,2 4,0 0,4 3,3

C NC

C NC C NC

%1*

***+

,,

,,-%2*

**+,

,,-

%2*

**+,

,,-

Figura 2.7: Dilema do Prisioneiro na versão extensiva.

O conceito de solução de equilíbrio de subjogo perfeito requer que umjogador ao tomar sua decisão, leve em consideração que cada jogador é racionala cada instante, e que cada jogador também racionaliza desta forma. Assim, noexemplo 2.13, o jogador 2 decide tomar a decisão C no histórico não-terminal(C), uma vez que ele recebe uma melhor utilidade (2 em vez de 0 quandoele escolhe NC). De forma semelhante, ele escolhe novamente C no históriconão-terminal (NC). A partir daí, o jogador 1 toma a sua decisão, sabendo queo jogador 2 é racional, e escolhe C, pois obtém uma utilidade 2 em vez de 0

(quando ele escolhe NC). Perceba que mesmo em exemplos simples como este,estamos considerando que a cada histórico não-terminal os jogadores acreditamque os outros jogadores racionalizam desta forma, e eles também. Esta definiçãotorna-se complicada quando consideramos jogos com longas durações. Veremosum exemplo disto a seguir.

Nem sempre o conceito de equilíbrio de subjogo perfeito obtém umsolução que seja considerada “razoável”. Um exemplo disso é o caso do jogoCentipede como mostrado na figura 2.8. Neste exemplo, a única solução deequilíbrio de subjogo perfeito é quando cada jogador escolhe S a cada históriconão-terminal, i.e., s1 = s2 = !S, S, S". Assim, as utilidades dos jogadores 1 e2 são 1 e 0, respectivamente. Verifique que quase todas as soluções neste jogosão melhores para ambos os jogadores. Nesta solução devemos notar que cadajogador deve raciocinar que cada jogador é racional em todos os históricos, atémesmo nos históricos que não são alcançáveis, quando cada jogador segue a suaestratégia. A justificativa para isto é que, a decisão de qual caminho tomar éinfluenciada pelos históricos que não são alcançáveis quando cada jogador seguea sua estratégia. Voltando ao exemplo da figura 2.8, temos que no históriconão-terminal (C,C, C, C, C) o jogador 2 escolhe S, pois ele obtém uma melhorutilidade, e a partir daí, então, começa-se uma cadeia de escolhas de S quesão as melhores estratégias. Neste tipo de raciocínio, estamos exigindo que,a cada momento, cada jogador acredite que os outros jogadores atuam desta

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 39

Figura 2.8: Exemplo de uma instância do jogo Centipede.

forma, criando crenças sobre o comportamento dos outros a cada momento,mesmo nos históricos que nunca são alcançados quando cada jogador segue asua estratégia a exemplo deste jogo.

2.3Jogo Extensivo com Informação Quase Perfeita

Um jogo extensivo com informação quase perfeita é um jogo extensivono qual os jogadores podem atuar de forma simultânea em um dado momentodo jogo. Formalmente, um jogo extensivo com informação quase perfeita édefinido por !N,H, P, (ui)", onde N , H e (ui) são definidos como na definição2.9, P é uma função que atribui a cada histórico não-terminal um conjuntode jogadores, e H e P satisfazem a condição de que para todo históriconão-terminal h existe (Ai)i!P (h) para o qual A(h) = {a | (h, a) $ H} =+

i!P (h) Ai(h). O conceito de estratégia para um jogador i é então uma funçãoque associa uma ação ai $ Ai(h) para cada não-terminal h tal que i $ P (h). Oconceito de equilíbrio de subjogo perfeito é definido como na definição 2.11 coma exceção de que P (h) = i é substituído por i $ P (h). Abaixo apresentamosa versão do Dilema do Prisioneiro como jogo extensivo com informação quaseperfeita.

Exemplo 2.14 O Dilema do Prisioneiro na versão de jogo com informaçãoquase perfeita !N, H, P, (ui)", onde:

– N = {1, 2}.

– H = {,, (!C, C"), (!C,NC"), (!NC,C"), (!NC,NC")}.

– T = {(!C, C"), (!C, NC"), (!NC, C"), (!NC, NC")}

– P (,) = {1, 2}.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 40

– u1((!C, C")) = 2, u1((!C,NC")) = 4,

u1((!NC,C")) = 0, u1((!NC, NC")) = 3,u2((!C, C")) = 2, u2((!C,NC")) = 0,

u2((!NC,C") = 4, u2((!NC, NC")) = 3.

A figura 2.9 representa este jogo na sua versão matricial e extensiva. Vejaque neste jogo temos o equilíbrio de subjogo perfeito !!C", !C"", quando cadajogador escolhe C no histórico não-terminal ,. Por outro lado, se considerarmosuma versão do jogo Matching Pennies em jogo extensivo com informação quaseperfeita, então não temos nenhuma solução de equilíbrio de subjogo perfeito.

!C"

!NC"

!C" !NC"

2,2

0,4

4,0

3,3

(a) - Jogo Estratégico (b) - Jogo Extensivo

2,2 4,0 0,4 3,3

&'(){1,2}

!C, C" !C, NC" !NC, C" !NC, NC"

......./

00

00

0001

22

22

2223

44

44

44

45

Figura 2.9: Versão do Dilema do Prisioneiro em Jogo de Informação QuasePerfeita.

2.4Jogo Extensivo com Informação Imperfeita

Em jogos estratégicos, quando um jogador toma uma decisão ele descon-hece as escolhas dos outros jogadores, o que também ocorre em jogos extensivoscom informação quase perfeita. Contudo, os modelos de jogos extensivos cominformação imperfeita adicionam também situações nas quais os jogadores têminformação parcial das ações que já foram tomadas anteriormente. Esta defini-ção cobre situações nas quais durante o curso de um jogo um jogador esqueceuma ação que ele tomou anteriormente, ou ainda situações nas quais um jo-gador está incerto sobre qual ação um outro jogador tomou no decorrer dojogo.

Para modelarmos tais situações, adicionamos à definição de jogo exten-sivo com informação perfeita uma partição Ii, para cada jogador i, dos histó-ricos para o qual o jogador i toma uma decisão com a propriedade que doishistóricos h e h$ pertencem ao mesmo conjunto da partição Ii se eles sãoindistinguíveis, ou seja, as ações a partir de cada histórico são iguais, i.e.,A(h) = A(h$). Abaixo apresentamos a definição formal.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 41

Definição 2.15 Um jogo extensivo com informação imperfeita é defi-nido por !N,H,P, (Ii), (ui)", onde

– N é um conjunto finito (de jogadores).

– H é um conjunto de seqüências (finitas e infinitas) de ações, chamadode conjunto de históricos, que satisfazem as seguintes propriedades

– uma seqüência vazia é um histórico, i.e., , $ H.– se (ak)k!K $ H onde K - N e para todo l . |K|, então (ak)k=0,...,l $

H.– se (a0 . . . ak) $ H para todo k $ N, então a seqüência infinita

(a0a1 . . .) $ H.

Um histórico h é terminal se ele é infinito ou se não existe uma açãoa tal que (h, a) $ H. O conjunto de terminais é representado por T.

– P é uma função que atribui para cada histórico não-terminal um jogador.

– Para cada jogador i $ N , uma partição Ii de {h $ H | P (h) = i} com apropriedade que se dois históricos h e h$ estão em um mesmo conjuntode Ii, então A(h) = A(h$). Chamamos Ii de partição de informaçãode i e Ii $ Ii de um conjunto de informação para i. DenotamosA(Ii) como o conjunto de ações A(h) e P (Ii) como o jogador P (h) paraqualquer h $ Ii.

– Para cada jogador i $ N , uma função de utilidade ui sobre T

Note que esta definição coincide com a definição de jogo extensivo cominformação perfeita quando tomamos todos os conjuntos de informações detodos os jogadores como conjuntos unitários.

Abaixo iremos apresentar um exemplo de jogo extensivo com informaçãoimperfeita para dois jogadores, no qual um dos jogadores não percebe a açãotomada pelo outro jogador.

Exemplo 2.16 Um exemplo de um jogo extensivo com informação imperfeitade dois jogadores !N,H,P, (Ii), (ui)", onde

– N = {1, 2}.

– H = {,, (A), (B), (A,L), (A,R), (A, L,C), (A,L, D), (A,R, C), (A,R, D)}.

– P(,) = P((A,L)) = P((A, R)) = 1 e P((A)) = 2.

– I1 = { {,}, {(A,L), (A, R)} } e I2 = { {(A)} }.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 42

– u1((B)) = 2, u1((A,L, C)) = 0, u1((A,L,D)) = 1,

u2((B)) = 1, u2((A,L, C)) = 0, u2((A,L,D)) = 2,

u1((A, R,C)) = 1, u1((A,R,D)) = 0,

u2((A, R,C)) = 2, u2((A,R,D)) = 0.

Assim como em jogo extensivo com informação perfeita, usualmenteapresentaremos um jogo extensivo sem informação perfeita como uma árvorena qual os conjuntos das partições dos jogadores são representadas por linhaspontilhadas quando temos que o conjunto não é unitário. Assim, o jogo 2.16é apresentado na figura 2.10.a, onde a linha pontilhada representa que oshistóricos (A,L) e (A,R) estão no mesmo conjunto de informação para ojogador 1, ou seja, ele desconhece a ação tomada pelo jogador 2 no histórico(A).

0,0 1,2 1,2 0,0

2,1

A B

L R

C DC D

%1*

***+

,,

,,-%2*

***+

,,

,,-%1 %1- - - - - - -*

**+,

,,-*

**+,

,,-

(a) - Forma Extensiva (b) - Forma Matricial

!A,C"

!A,D"

!B,C"

!B,D"

!L" !R"

0, 0 1, 2

1, 2 0, 0

2, 1 2, 1

2, 1 2, 1

Figura 2.10: Jogo Extensivo com informação imperfeita (Exemplo 2.16).

Uma estratégia para o jogador i para um jogo extensivo cominformação imperfeita é uma função si que atribui um ação em A(Ii) paracada conjunto de informação Ii $ Ii. Por conveniência, representaremos asfunções através de tuplas. No exemplo 2.16, temos !A,C", !A,R", !B, C" e!B, D" como estratégias para o jogador 1, e !L" e !R" para o jogador 2.

Podemos utilizar as definições de estratégias para gerarmos um jogoestratégico. A definição é semelhante a de jogo extensivo com infor-mação perfeita. Desta forma, podemos utilizar o conceito de equilíbriode Nash para raciocinar sobre jogos. A figura 2.10.b representa o jogo2.16 como um jogo estratégico e tem os seguintes perfis de estratégias!!B, C", !L"", !!B,D", !L"", !!B, C", !R"", e !!B, D", !R"" como equilíbriosde Nash. Note que todos os equilíbrios levam ao mesmo histórico terminal(B).

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 43

Ao estendermos o modelo de informação perfeita para informação im-perfeita temos diversas conseqüências em relação a alguns dos conceitos desoluções. Eles simplesmente não estendem de forma usual. Para vermos isto,considere o caso de equilíbrio de subjogo perfeito. Lembre-se que o conceitode equilíbrio de subjogo perfeito para um jogo com informação perfeita é umperfil de estratégias, tal que cada estratégia é ótima a cada momento do jogo(mesmo os que nunca são alcançados quando eles seguem suas estratégias),levando em consideração as estratégias dos outros. A extensão natural doconceito de equilíbrio de subjogo perfeito para jogo com informaçãoimperfeita é que cada estratégia seja ótima a cada conjunto de informação,levando em consideração as estratégias dos outros jogadores. Vejamos entãoeste conceito aplicado ao exemplo 2.16. O jogador 1 tem que tomar uma de-cisão no conjunto de informação A({(A,L), (A,R)}) = {C,D}. Note que nohistórico não-terminal (A, L) a melhor escolha é D, enquanto que para o histó-rico não-terminal (A,R) a melhor escolha é C. Daí, podemos concluir que ojogador 1 não tem como afirmar qual é a melhor escolha, a não ser que eletenha alguma expectativa sobre o seu conjunto de informação.

Estamos seguindo a definição apresentada em (OR94). Contudo, vale res-saltar que alguns autores (Gib92, Ros06) divergem desta definição e consideramo conceito de subjogo perfeito de forma mais restrita, onde a racionalidade édefinida somente nos subjogos, e não a cada conjunto de informação comodefinido acima. O conceito de subjogo para jogo com informação imperfeita édefinido como segue. Em um subjogo o histórico inicial h está em um conjuntode informação unitário; o subjogo inclui todos os históricos a partir de h; e to-dos os históricos nos conjuntos de informações seguem a partir de h. De acordocom esta definição temos que no exemplo 2.16 temos apenas dois subjogos: uma partir do histórico inicial ,; e outro a partir do histórico (A). No exemploapresentado na figura 2.11 a seguir, o único subjogo é o próprio jogo.

Um outro ponto que veremos na próxima seção é que até mesmo oconceito de solução de equilíbrio de Nash, que considera randomização, deve serrepensado, na medida em que existem pelo menos dois tipos de randomizaçõesdisponíveis para os jogadores: uma a nível das estratégias puras; e a outra anível de cada conjunto de informação.

Na figura 2.11, apresentamos um exemplo clássico de jogo extensivo cominformação imperfeita, onde ocorre os mesmos problemas acima citados. Nesteexemplo, temos 3 jogadores, onde o primeiro jogador começa o jogo e deveescolher entre A e B. Se ele escolher B, então o jogador 2 deve escolherentre L e R. O jogador 3 tem informação imperfeita e deve escolher entreC e D, contudo, ele não percebe as ações que ocorreram anteriormente, ou

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 44

seja, se o histórico anterior foi (A) ou (B, L). As funções de utilidades estãorepresentadas no fim de cada ramo da árvore, onde os valores correspondemas utilidades dos jogadores 1, 2 e 3, respectivamente. Perceba que não temosequilíbrio de subjogo perfeito neste jogo, pois o jogador 3 prefere C no históriconão-terminal (A), e ele prefere D no histórico (B,L) que estão no mesmoconjunto de informação. Desta forma, não temos que uma ação é melhor doque a outra. Representamos este jogo na sua forma estratégia na figura 2.12,onde as linhas, colunas e tabelas representam as escolhas dos jogadores 1, 2

e 3, respectivamente. Por exemplo, as utilidades dos jogadores quando elesescolhem B, R e D estão representados na célula da tabela D na linha B ecoluna R, e são, respectivamente, 3, 3 e 0. Neste jogo temos dois equilíbrios deNash !!A", !R", !C"" e !!B", !R", !D"".

4,4,4 1,1,1 5,5,0 2,2,2

3,3,0

A B

L R

C DC D

%1*

***+

,,

,,

,,

,,,-

%2,

,,,-

**

**+%3 %3- - - - - - - -*

**+,

,,-*

**+,

,,-

Figura 2.11: Jogo Extensivo com informação imperfeita (Selten’s Horse).

A

B

L R

Tabela C Tabela D

4,4,4

5,5,0

4,4,4

3,3,0

A

B

L R

1,1,1

2,2,2

1,1,1

3,3,0

Figura 2.12: Representação matricial do jogo Selten’s Horse.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 45

2.4.1Equilíbrio de Nash de estratégias Mistas e Comportamentais

Nesta seção iremos definir dois tipos de estratégias que utilizam rando-mização em diferentes contextos. O primeiro deles é quando os jogadores ran-domizam suas escolhas sobre as estratégias disponíveis para ele, enquanto queo segundo considera uma randomização a cada instante que um jogador tomauma decisão. A primeira caracterização é chamada de equilíbrio de Nash deestratégias mistas, e a idéia é semelhante à de jogos estratégicos. A segunda échamada de equilíbrio de Nash de estratégias comportamentais, por que consi-dera uma randomização a medida que o jogo evolui. Formalmente, uma estra-tégia mista para um jogador i é uma distribuição de probabilidades sobreo conjunto de estratégias de Si, enquanto que um estratégia comportamen-tal para um jogador i é uma seqüência de distribuições de probabilidadesindependentes (!i(Ii)) para cada conjunto de informação Ii $ Ii.

Para um perfil ! = (!i) de estratégias mistas (comportamentais), defi-nimos p(h, !) como a probabilidade sobre o histórico terminal quando cadajogador i segue sua estratégia !i. Desta forma, a probabilidade atribuída aum histórico terminal finito h por um perfil de estratégias mistas ! é definidocomo na equação 2-1, enquanto que a probabilidade atribuída a um históricoterminal finito h = (a0 . . . ak) por um perfil de estratégias comportamentais !

é p(h, !) =

#j=k+j=0

!P (a0...aj)(a0 . . . aj)(aj+1)

$.

p(h, !1, . . . , !n) ="

s!S % O(s)=h

#!

i!N

!i(si)

$(2-1)

No exemplo da figura 2.11 tomando o perfil de estratégias mistas% %

12 ,

12

&,

%23 ,

13

&,

%13 ,

23

& &, a função p associa probabilidade de 1

6 ao históricoterminal (A,C), e é calculado como segue. Note que apenas os perfis de estra-tégias !!A", !L", !C"" e !!A", !R", !C"" levam ao histórico terminal (A,C).

p

'(A,C),

(1

2,1

2

),

(2

3,1

3

),

(1

3,2

3

)*=

1

2* 2

3* 1

3+

1

2* 1

3* 1

3=

2

18+

1

18=

1

6

No exemplo da figura 2.11 tomando o perfil de estratégias comportamen-tais

%%12 ,

12

&,%

23 ,

13

&,%

13 ,

23

&&, a função p associa probabilidade de 1

6 ao históricoterminal (A,C) e é calculada como segue.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 46

p

'(A,C),

(1

2,1

2

),

(2

3,1

3

),

(1

3,2

3

)*=

1

2* 1

3=

1

6

Referenciamos p como sendo a distribuição de probabilidades sobreos históricos terminais. No exemplo da figura 2.11, p =

%16 ,

26 ,

218 ,

418 ,

16

&

é a distribuição de probabilidades sobre os históricos terminais(A,C), (A,D), (B, L,C), (B, L,D), (B, R), respectivamente, para o perfilde estratégias mistas

%%12 ,

12

&,%

23 ,

13

&,%

13 ,

23

&&. Esta mesma distribuição é válida

para o perfil de estratégias comportamentais%%

12 ,

12

&,%

23 ,

13

&,%

13 ,

23

&&.

A utilidade de cada jogador é então calculada da seguinte forma.

Ui(!1, . . . , !n) ="

h!T

(p(h, !1, . . . , !n)* ui(h))

Definição 2.17 Um equilíbrio de estratégias mistas (comportamentais) é umperfil de estratégias ! # tal que para todos os jogadores i $ N , temos que

Ui(!#"i, !

#i ) ' Ui(!

#"i, !i), para todos as estratégias mistas

(comportamentais) !i do jogador i.

Um jogo extensivo é dito com lembrança perfeita (perfect recall),se a cada momento que um jogador tem que tomar uma decisão, ele se re-corda de todos os eventos que lembrava anteriormente, bem como de todas asações tomadas por ele anteriormente. Em caso contrário, ele é com lembrançaimperfeita (imperfect recall). Os jogos das figuras 2.10 e 2.11 são com lem-brança perfeita, enquanto que o jogo apresentado na figura 2.13 abaixo é comlembrança imperfeita, uma vez que o jogador 1 esquece qual ação ele tomou nohistórico inicial (i.e. (A) e (B,L) pertencem ao mesmo conjunto de informa-ção). Um resultado que segue, quando um jogo é finito com lembrança perfeita,é que existe uma certa equivalência entre estratégias mistas e comportamentaisque resultam na mesma distribuição de probabilidades para os históricos termi-nais. Isto pode ser verificado no exemplo da figura 2.11. No exemplo da figura2.13, temos a distribuição de probabilidades p =

%12 , 0, 0,

12 , 0

&para o perfil

de estratégias mistas%%

12 , 0, 0,

12

&, !1, 0"

&. Por outro lado, não existe um perfil

de estratégias comportamentais que resultem em p. Para ver isto, considereo perfil de estratégias comportamentais !!a, 1# a" , !b, 1# b"", !1, 0"". Assim,o histórico terminal (A,D) tem probabilidade 0 se ou a = 0 ou b = 0, masneste caso, teríamos que ou a probabilidade de (A, C) ou a probabilidade de(B,L, D) é 0, o que não é o caso para p.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 47

A prova da proposição abaixo pode ser encontrada em (OR94, Kuh53).

4,4 1,1 5,5 2,2

3,3

A B

L R

C DC D

%1*

***+

,,

,,

,,

,,,-

%2,

,,,-

**

**+%1 %1- - - - - - - - -*

**+,

,,-*

**+,

,,-

Figura 2.13: Jogo Extensivo com informação imperfeita e lembrança imperfeita.

Proposição 2.18 Para qualquer estratégia mista de um jogador em um jogoextensivo finito com lembrança perfeita, existe uma estratégia comportamentalequivalente.

2.5Jogo Extensivo Reduzido e Informação Imperfeita Equivalente

Nesta seção iremos apresentar um resultado importante para as aplica-ções que serão desenvolvidas posteriormente nesta tese, utilizando o verificadorde modelos. O que faremos é propor uma redução na representação de um jogoextensivo. Esta redução compacta a representação do jogo de tal modo que aspropriedades acerca deste jogo são preservadas.

Antes de definirmos isto formalmente, apresentaremos, no exemplo 2.19abaixo, um jogo extensivo com informação perfeita que possui um certo tipode redundância. Veja a representação deste jogo como uma árvore na figura2.14.a. Note que há uma redundância nesta representação, uma vez que ossubjogos a partir dos históricos (A,D) e (B,F ) são iguais8, i.e, toda todosos nós, ações e utilidades são iguais. Desta forma, propomos que apenas umdestes subjogos seja representado, preservando todavia, a estrutura seqüencialdo jogo. Para tanto, o que fazemos é ligar todas as setas (que são as ações)que têm como destino o mesmo subjogo ao subjogo remanescente9. Na figura2.14.b, representamos o jogo 2.19 sem redundâncias, onde eliminamos o subjogoa partir do histórico (B, F ) e ligamos este ao histórico (A,D).

8Do ponto de vista lógico estes estados são bissimilares.9A idéia é semelhante à compactação através de OBDD e à utilização de estruturas de

Kripke para representar árvores infinitas.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 48

Exemplo 2.19 Um jogo extensivo com redundância definido por!N,H,P, (ui)", onde

– N = {1, 2}.

– H = {,, (A), (B), (A,C), (A,D), (B, E),

(B, F ), (A,D, G), (A,D, H), (B, F, G), (B, F, H)}.

– P(,) = P((A,D)) = P((B, F )) = 1 e P((A)) = P((B)) = 2.

– u1((A, C)) = 2, u2((A,C)) = 1,

u1((A, D,G)) = 3, u2((A,D, G)) = 2,

u1((A, D,H)) = 1, u2((A,D, H)) = 2,

u1((B, E)) = 2, u2((B, F )) = 4,

u1((B, E,G)) = 3, u2((B, F, G)) = 2,

u1((B, E,H)) = 1, u2((B, F, H)) = 2.

Apresentamos abaixo as representações das estratégias deste jogo.

– O jogador 1 possui as seguintes estratégias: !A,G, G", !A,G, H", !A,H, G",!A,H, H", !B, G,G", !B, G,H", !B, H,G", !B, H,H".

– O jogador 2 possui as seguintes estratégias: !C, E", !C,F ", !D, E", !D,F ".

2,1

3,2 1,2 3,2 1,2

2,4

A B

C D E F

G H G H

%1*

***+

,,

,,-%2*

**+,

,,- %1*

**+,

,,-

%2*

**+,

,,- %1*

**+,

,,-

2,1

3,2 1,2

2,4

A B

C D F E

G H

%1*

***+

,,

,,-%2*

**+,

,,- %1*

**+,

,,-

%2*

**+

66

667

(a) - Representação Extensiva (b) - Representação Reduzida

Figura 2.14: Representação do jogo 2.19.

O que propomos nesta seção é apenas representar o jogo de uma formamais compacta, e nada estamos falando sobre o jogo ser ou não de informaçãoperfeita; o conceito de estratégia continua definido da mesma forma. Noreferido exemplo, o único equilíbrio de subjogo perfeito é o perfil de estratégias!!A,G, G", !D,E"" que representa o histórico terminal (A,D, G), onde osjogadores 1 e 2 têm utilidades 3 e 2, respectivamente.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 49

Uma representação reduzida de um jogo extensivo tem como vantagemum menor esforço computacional para encontrarmos o conjunto de equilíbriosde subjogo perfeito, além de uma redução no espaço de memória necessário.Utilizando o procedimento de backward induction encontramos as possíveissoluções de uma forma mais eficiente devido a esta representação.

Abaixo apresentamos a definição de igualdade entre jogos e de jogoextensivo reduzido.

Definição 2.20 Um jogo ! = !N, H, P, (Ii), (ui)" é igual a um jogo !$ =

!N $, H $, P $, (I $i), (u$i)" se e somente se

– N = N $.

– H = H $.

– Para todo h $ H, temos que P (h) = P $(h).

– Para todo i $ N , temos que Ii = I $i.

– Para todo i $ N e para todo h $ T , ui(h) = u$i(h).

Definição 2.21 Um jogo extensivo reduzido é um jogo no qual não existemdois subjogos iguais neste jogo.

Todavia, devemos ressaltar que os perfis de estratégias ainda podem serreduzidos. Apresentaremos mais uma redução na representação de um jogoextensivo no tocante a representação das estratégias. Para tanto, utilizaremosjogos extensivos com informação imperfeita que possuem uma determinadacaracterística. Considere novamente o exemplo 2.19 na seguinte versão: ojogador 1 não percebe quais foram as ações tomadas anteriormente aoshistóricos (A,D) e (B, F ). A definição deste jogo é apresentada no exemplo2.22.

Exemplo 2.22 Um jogo extensivo com redundância definido por!N,H,P, (ui), (Ii)", onde

– N = {1, 2}.

– H = {,, (A), (B), (A,C), (A,D), (B, E),

(B, F ), (A,D, G), (A,D, H), (B, F, G), (B, F, H)}.

– P(,) = P((A,D)) = P((B, F )) = 1 e P((A)) = P((B)) = 2.

– I1 = {I11 , I

21} e I2 = {I1

2 , I22}, onde I1

1 = {,}, I21 = {(A,D), (B,F )},

I12 = {A} e I2

2 = {B}.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 50

– u1((A, C)) = 2, u2((A,C)) = 1,

u1((A, D,G)) = 3, u2((A,D, G)) = 2,

u1((A, D,H)) = 1, u2((A,D, H)) = 2,

u1((B, E)) = 2, u2((B, F )) = 4,

u1((B, E,G)) = 3, u2((B, F, G)) = 2,

u1((B, E,H)) = 1, u2((B, F, H)) = 2.

Apresentamos abaixo as representações das estratégias deste jogo.

– O jogador 1 possui as seguintes estratégias: !A,G", !A, H", !B,G", !B, H".

– O jogador 2 possui as seguintes estratégias: !C, E", !C,F ", !D, E", !D,F ".

2,1

3,2 1,2 3,2 1,2

2,4

A B

C D E F

G H G H

%1*

***+

,,

,,-%2*

**+,

,,- %1*

**+,

,,-

- - - - - - - -

%2*

**+,

,,- %1*

**+,

,,-

2,1

3,2 1,2

2,4

A B

C D F E

G H

%1*

***+

,,

,,-%2*

**+,

,,- %1*

**+,

,,-

%2*

**+

66

667

(a) - Representação Extensiva (b) - Representação Reduzida

Figura 2.15: Representação do jogo 2.22.

Pode-se verificar que o perfil de estratégias !!A,G", !D, E"" é o único equilí-brio de subjogo perfeito10, e o histórico terminal referente a este equilíbrio é(A,D, G). Note que este é o mesmo histórico terminal deste jogo com infor-mação perfeita.

A representação extensiva deste jogo é apresentado na figura 2.15.a e suaforma reduzida em 2.15.b. De acordo com a definição de estratégias para jogosextensivos com informação imperfeita, temos que um jogador deve tomar umadecisão para cada conjunto de informação. Assim, observamos que no jogo2.22 as estratégias coincidem com as escolhas a cada instante do jogo reduzidorepresentado no grafo 2.15.b.

Dois aspectos podem ser observados no exemplo acima: todo histórico nomesmo conjunto de informação têm o mesmo subjogo; e o conceito de equilíbrio

10Lembre-se que nem todo jogo extensivo com informação imperfeita tem equilíbrio desubjogo perfeito.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 51

de subjogo perfeito leva ao mesmo resultado do jogo com informação perfeita.A questão é: podemos generalizar isto? Veremos uma prova de que isto não éuma coincidência deste exemplo.

Definição 2.23 Um jogo extensivo com informação imperfeita equi-valente é um jogo no qual se dois históricos h e h$ pertencem ao mesmoconjunto de informação de um jogador (i.e. h, h$ $ Ii $ Ii), então os subjogosde h e h$ são iguais, ou seja, Oh(h, s1, . . . , sn) = Oh(h$, s1, . . . , sn) para todasas estratégias si $ Si para todos os jogadores i $ N .

A idéia da prova do teorema abaixo é semelhante a idéia da prova daexistência de equilíbrio de subjogo perfeito para jogo extensivo finito cominformação perfeita.Teorema 2.24 Todo jogo extensivo finito com informação imperfeita equiva-lente tem equilíbrio de subjogo perfeito.Prova. Seja ! = !N, H, P, (Ii), (ui)" um jogo extensivo com informação imper-feita equivalente. Iremos construir um perfil de estratégias (si) por indução notamanho do maior histórico em !.

– Base: Se o histórico h é terminal (i.e. |!(h)| = 0) então por definição te-mos que ui(Oh(h, s1, . . . , sn)) = ui(Oh(h, s#1, . . . , s

#n)) para toda estratégia

s#i $ Si.

– Passo Indutivo: O histórico h é não-terminal e tem tamanho |!(h)| =

k + 1. Sejam i e Ii o jogador que deve tomar uma decisão em h

(i.e. P (h) = i) e o conjunto de informação Ii que contém o histó-rico h. Para todo a $ A(h), temos que |!(h, a)| . k. Daí por hipó-tese de indução temos que o perfil de estratégias (si) é ESP para todo(h, a). Defina si(Ii) = a $ A(h) como sendo ui(Oh(h, s1, . . . , sn)) 'ui(Oh(h, s1, . . . , s#i , . . . , sn)), para toda estratégia s#i $ Si, onde a es-tratégia s#i é definida até h através do produto cartesiano entre asescolhas s#i (Ii) = a $ A(h) e as estratégias definidas pela hipótesede indução. Por fim, como ! é um jogo com informação imperfeitaequivalente, temos que todos os históricos h, h$ $ Ii tem o mesmosubjogo daí vale que ui(Oh((h, s1, . . . , sn)) = ui(Oh(h$, s1, . . . , sn)) 'ui(Oh(h$, s1, . . . , s#i , . . . , sn)) = ui(Oh(h, s1, . . . , s#i , . . . , sn)) para toda es-tratégia s#i $ Si.

Desta forma, construímos um perfil de estratégias (si) por indução que é umequilíbrio de subjogo perfeito. !

O teorema abaixo garante que: jogo com informação imperfeita equiva-lente e jogo extensivo com informação perfeita são equivalentes em relação aoconceito de equilíbrio de subjogo perfeito.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 52

Teorema 2.25 Os históricos terminais que são resultados de equilíbrio desubjogos perfeito de jogo extensivo com informação perfeita e de jogo extensivocom informação imperfeita equivalente são os mesmos.Prova. Sejam ! = !N, H, P, (ui)", !I = !N,H, P, (Ii), (ui)" e h um jogo exten-sivo com informação perfeita, um jogo extensivo com informação imperfeitaequivalente para ! e um histórico terminal em H, respectivamente. Esta provaé dividida nos dois casos a seguir.

– Caso: Se h é um histórico terminal que advém de um ESP de !, entãoh é um histórico terminal que advém de um ESP de !I.

h é um histórico terminal que advém de um ESP de !

=/ existe um perfil de estratégias (si) que é um ESP

tal que O(s1, . . . , sn) = h.

Defina a estratégia sIi de cada jogador i do jogo !I da seguinte forma.

sIi (Ii) =

,si(h), se h $ O(s1, . . . , sn)

si(h), caso contrário tome qualquer h $ Ii

Pela definição acima temos que O(sI1 , . . . , sIn) = O(s1, . . . , sn) = h e queo perfil de estratégia (sIi ) é um ESP de !I .

– Caso: Se h é um histórico terminal que advém de um ESP de !I, entãoh é um histórico terminal que advém de um ESP de !.

h é um histórico terminal que advém de um equilíbrio de subjogo perfeito de !I

=/ existe um perfil de estratégias (sIi ) que é um ESP

tal que O(sI1 , . . . , sIn) = h.

Defina a estratégia si de cada jogador i do jogo ! da seguinte forma.

si(h) = sIi (Ii) com h $ Ii

Pela definição acima temos que O(sI1, . . . , s

In) = O(s1, . . . , sn) = h. Agora

devemos mostrar que o perfil de estratégia (si) é um equilíbrio de subjogoperfeito de !. Esta prova é semelhante a prova do teorema 2.24.

!

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 53

Voltando a questão da representação de um jogo extensivo, primeira-mente argumentamos que há redundância na representação de um jogo ex-tensivo como uma árvore, e depois argumentamos que um jogo extensivo cominformação imperfeita (em relação à equivalência entre os subjogos) tem osmesmos resultados (históricos terminais), de acordo com o conceito de equilí-brio de subjogo perfeito, do que um jogo com informação perfeita. Assim,podemos utilizar este tipo de jogo com informação imperfeita para prover umasolução para um jogo com informação perfeita. Assim, claramente a represen-tação do perfil de estratégias também é reduzida.

Apesar destes fatos em uma primeira análise não terem tanta importân-cia, iremos demonstrar que na prática isto faz uma enorme diferença. Exemplosque se encaixam bem no aqui exposto são jogos como jogo da velha e xadrez.Desta forma, podemos utilizar uma representação bem mais enxuta destes jo-gos, e ainda assim acharmos uma solução para os mesmos. Só pra exemplificaro jogo da velha tem 549.946 históricos (dos quais 255.168 são terminais) en-quanto que uma representação como aqui exposto tem apenas 5.478 nós (dosquais apenas 958 são terminais) e 16.167 ações.

2.6Jogo de Coalizão com Utilidades Transferíveis

Jogo de Coalizão com Utilidades Transferíveis é um modelo que consisteem um conjunto de jogadores N , e para cada possível coalizão (um subconjuntode N) associa-se um número real, interpretado como a utilidade disponível paraa coalizão; Não existem restrições em como esta utilidade possa ser divididaentre os membros da coalizão.

Definição 2.26 Um jogo de coalizão com utilidades transferíveis édefinido por !N, v", onde

– N é um conjunto não-vazio (de jogadores)

– v é uma função que associa um número real para cada conjunto não-vaziodos jogadores S - N\, (Coalizão).

Seja !N, v" um jogo de coalizão com utilidades transferíveis. Para qual-quer solução x $ RN e uma coalizão S, definimos11 c(x, S) =

-i!S xi, onde xi

é o número real para o jogador i em x. Uma solução (xi)i!S é uma seqüên-cia possível para S se c(x, S) = v(S), ou seja, que a utilidade associada acoalizão S foi totalmente dividida entre os seus membros.

11Para evitar confusão de notação quando referenciamos a solução x ou a função x,utilizamos a notação c(x,S) em vez da notação padrão x(S) na literatura.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 54

Um problema típico tratado, pela área de economia rural, como umjogo de coalizão (Sta87) é uma situação na qual existe uma cooperativaagropecuária que presta serviços de processamento e comercialização a umconjunto heterogêneo de fazendeiros que entregam sua produção à cooperativaque a processa e vende. Nesta situação há a possibilidades dos fazendeirosprocessarem e comercializarem suas produções de forma individual ou de formacooperativa entre alguns dos fazendeiros. A cooperativa tem de definir o quantocada agricultor deve ganhar por processar e comercializar sua produção com acooperativa.

Abaixo apresentamos um exemplo de uma situação como esta na qualexistem quatro fazendeiros A,B,C e D que podem cooperar e obter ganhos,como é mostrado a seguir de acordo com a função v. Por exemplo, se a produçãoocorrer de forma conjunta entre todos os fazendeiros, a coalizão grande, elesobterão um ganho de 35 que deve ser partilhado entre eles. Por outro lado,os fazendeiros A,B,C e D podem garantir de forma individual que ganham10, 8, 5 e 7, respectivamente. Uma pergunta interessante é quando a cooperativapode propor uma divisão dos ganhos tal que nenhum fazendeiro de formaindividual ou coletiva tenha o incentivo de sair da cooperativa. Este conceitoserá tratado logo a seguir quando apresentarmos o conceito de solução core.

Exemplo 2.27 Seja !N, v" um jogo de coalizão com utilidades transferíveis,onde

– N = {A,B,C,D}

– v({A,B, C, D}) = 35,

– v({A}) = 10, v({B}) = 8, v({C}) = 5, v({D}) = 7

– v({A,B}) = 20, v({A,C}) = 17, v({A,D}) = 18, v({B, C}) = 15,

v({B,D}) = 12, v({C, D}) = 13

– v({A,B, C}) = 25, v({A, B, D}) = 25, v({A, C, D}) = 23,

v({B,C,D}) = 22

Quando um jogo de coalizão tem a propriedade que a função v satisfazv(S 0 T ) ' v(S) + v(T ) com S 1 T 2= , para todo S e T diz-se que este ésuperaditiva. O exemplo acima é superaditivo.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 55

2.6.1Core

O principal conceito de solução para jogo de coalizão com utilidadestransferíveis é o core, que requer que não exista uma coalizão tal que todos osseus membros possuam uma utilidade maior.

Definição 2.28 O core para um jogo de coalizão com utilidades trans-feríveis !N, v" é definido pelo conjunto das seqüências possíveis x para N talque não existe uma coalizão S e uma seqüência possível y para S tal que y >i x

para todo i $ S.

Podemos verificar que a definição de core pode se dar alternativamentecomo segue.

Definição 2.29 O core para um jogo de coalizão com utilidades trans-feríveis !N, v" é definido pelo conjunto:

{x| x é uma seqüência possível de N e c(x, S) ' v(S) para todo S - N\,}

No exemplo 2.27, temos as soluções x = !13, 9, 6, 7" e y = !10, 10, 8, 7"pertencendo ao core entre outras.

2.7Jogo de Coalizão sem Utilidades Transferíveis

Uma generalização de um jogo de coalizão com utilidades transferíveis édefinido nesta seção. A generalização ocorre quando, em vez de considerarmosum valor associado a cada coalizão, associamos um conjunto de conseqüênciaspara cada coalizão. A definição formal é apresentada abaixo.

Definição 2.30 Um jogo de coalizão sem utilidades transferíveis é definidopor ! = !N,X, v, (%i)", onde

– um conjunto não-vazio N (de jogadores).

– um conjunto X (de conseqüências).

– uma função v que associa a toda coalizão S um conjunto de conseqüênciasv(S) - X.

– para cada jogador i uma relação de preferência %i sobre o conjunto deconseqüências X.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 2. Teoria dos Jogos 56

Esta definição coincide com jogo de coalizão com utilidades transferíveisquando: X = RN ; v(S) = {x $ RN :

-i!S xi = v(S) e xj = 0 para todo

j $ N\S} para toda coalizão S; e x %i y se, e somente se, xi ' yi.Um exemplo com caráter apenas ilustrativo da definição 2.30 é apresen-

tado abaixo.

Exemplo 2.31 Jogo de coalizão sem utilidades transferíveis! = !N, X, v, (%i)", onde

– N = {1, 2}.

– X = {w1, w2, w3, w4, w5}.

– v({1, 2}) = {w2, w3, w4}, v({1}) = {w1, w2}, v({2}) = {w4, w5}.

– w1 %1 w2, w2 %1 w3, w3 %1 w4, w4 %1 w5.

– w5 %2 w4, w4 %2 w3, w3 %2 w2, w2 %2 w1.

O conceito de core é generalizado abaixo.

Definição 2.32 O core para um jogo ! = !N,X, v, (%i)" é definido peloseguinte conjunto de todos os x $ v(N) tal que não existe uma coalizão S - N

e uma conseqüência y $ v(S) tal que y (i x para todo i $ S.

O exemplo 2.31 tem apenas a conseqüência w3 pertencente ao core.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

3Lógicas Temporais para a Validação de Sistemas

Neste capítulo apresentamos diversas lógicas que têm sido utilizadaspara a validação de sistemas. Do ponto de vista prático, a validação ocorre,tipicamente, através de duas abordagens: a verificação de modelos (modelchecking) (CGP99), na qual o sistema e a propriedade a ser validada sãorepresentados, respectivamente, como um modelo, geralmente finito, e umafórmula da lógica; e a prova automática de teoremas (automated theoremproving) (Fit96), na qual tanto o sistema como a propriedade são representadascomo fórmulas da lógica. Diversas linguagens lógicas têm sido utilizadas paraambas as abordagens a exemplo da lógica proposicional, da lógica de primeira-ordem, e das lógicas modais e temporais, entre outras. Cada abordagem possuias suas vantagens e desvantagens. Vale ainda ressaltar que essas duas técnicaspodem ser combinadas para a validação de sistemas.

Abaixo iremos declarar o problema da verificação de modelos e da provaautomática de teoremas para lógicas em geral. A partir daí, apresentamos aslógicas temporais: full Computation Tree Logic (CTL*) (EH86); ComputationTree Logic (CTL) (CE81); e Linear Temporal Logic (LTL). A lógica µ-calculus,que expressa CTL e LTL, não será apresentada neste capítulo. Em particular,estaremos mais interessados neste trabalho na lógica CTL, que é base da lógicaproposta neste trabalho. Por fim, esboçaremos a verificação de modelos para alógica CTL através do verificador de modelos Symbolic Model Verifier (SMV)(McM93).

Em verificação de modelos se está interessado em procedimentos ‘efi-cientes’ que decidam se uma fórmula !, que representa uma propriedade dosistema, é satisfeita (|=) na estrutura G, geralmente finita, que representa osistema. Uma formulação geral para o problema de verificação de modelos éintroduzido como:

G |= !

A técnica de verificação de modelos (model checking) (CGP99) é fre-qüentemente aplicada na ciência da computação para a validação de software ehardware (BCL91). Esta técnica consiste na verificação automática de proprie-dades acerca do comportamento de sistemas através de enumeração exaustiva

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 3. Lógicas Temporais para a Validação de Sistemas 58

de todos os estados alcançáveis. Diversas implementações estão disponíveis naliteratura, tais como o Symbolic Model Verifier (SMV) (McM93) e o SPIN(Hol97). Algumas outras também incluem características especificas na suamodelagem: UPPAAL (BLL+95) trata de tempo-real; HYTECH (HHWT95)de autômatos híbridos; e o PRISM (Par02) de autômatos estocásticos. Re-centemente, a verificação de modelos vem sendo empregada na verificação depropriedades de jogos (Vas03, BSWZ01, vOvdHW04, vdHW02, KP04).

Embora a uma primeira vista esta abordagem pareça simples, a exemploda lógica proposicional, veremos que este problema para algumas lógicas podeser uma tarefa difícil. Para algumas lógicas a complexidade para determinarse uma fórmula é satisfeita em uma estrutura é PSPACE-completo.

A outra abordagem que vem sendo aplicada em ciência da computação é ade provas automáticas de teoremas (automated theorem proving) (Fit96), ondeutiliza-se de uma linguagem lógica para representar o sistema e a propriedadeque se deseja verificar, então utiliza-se um método de prova (cálculo dedutivo)para verificar a correção da propriedade de forma automática. Diversos cálculosdedutivos têm sido desenvolvidos, tais como axiomático (ou à la Hilbert),dedução natural, cálculo de sequentes, tableaux, resolução, entre outros. Cadaum dos sistemas têm as suas vantagens e desvantagens.

Sejam ! e ! um conjunto finito de fórmulas e uma fórmula, respecti-vamente, de uma lógica com um sistema de prova K. Então uma formulaçãogeral para o problema de prova de teoremas é introduzido como:

! !K !

Este problema está relacionado ao problema de determinar se umconjunto de fórmulas ! " {¬!} é insatisfatível, i.e., se não existe uma es-trutura que satisfaz todas as fórmulas de !" {¬!}. Para lógica proposicional,por exemplo, o problema da satisfatibilidade é NP-Completo e o da prova deteoremas é, então, CoNP-Completo. Além da dificuldade de resolver este pro-blema para algumas lógicas, temos que este problema é indecidível, a exemploda lógica de primeira-ordem.

Apesar disso, existe muita pesquisa na área de prova automática deteoremas, e existem diversos provadores automáticos de teoremas disponíveisna literatura. Os provadores Otter (Kal01), SPASS(Wei97), Vampire (RV02) eWaldmeister (THL97) usam lógica de primeira-ordem, enquanto os provadoresACL2 (MKM00), e HOL (Age94) usam lógica de alta-ordem.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 3. Lógicas Temporais para a Validação de Sistemas 59

3.1Lógicas Temporais

Lógicas temporais foram introduzidas por filósofos para o estudo darelação com o tempo, possuindo assim operadores temporais, a exemplodos operadores de F e P , que expressam futuro e passado, respectiva-mente. Recentemente, diversas lógicas temporais têm sido utilizadas paraa validação de propriedades acerca do comportamento de sistemas reativos(Pnu77, CGP99, Hol97). Sistemas reativos têm como caracterização básicaestados e transições. Estado é a descrição do sistema em um dado instantede tempo, ou seja, os valores associados as suas variáveis naquele instante.Transição é uma relação entre dois estados. Chamamos de computação umaseqüência infinita de estados, onde cada estado é obtido através de um estadoanterior e uma relação de transição entre eles.

A interpretação de lógicas temporais se dá, tradicionalmente, atravésde estrutura de Kripke, que captura a intuição do comportamento de umsistema reativo. Uma estrutura de Kripke é um conjunto de estados, umconjunto de transições entre estados e uma função, que rotula cada estadocom o conjunto de propriedades verdadeiras nele. Caminhos em estrutura deKripke são computações em sistemas reativos. Deve-se ainda considerar queexiste uma restrição na abordagem lógica: as relações de transições devemser totais. As estruturas de Kripke são simples e suficientes para capturar osaspectos mais relevantes do comportamento dos sistemas reativos.

A definição formal de estrutura de Kripke para lógica temporal é apresen-tada abaixo. A figura 3.1 apresenta uma representação da estrutura de Kripkeapresentada no exemplo 3.2, que tem um caráter apenas ilustrativo.

Definição 3.1 Uma estrutura de Kripke é definida por #S, So, R, L$, onde

– Um conjunto não-vazio de estados S.

– Um conjunto de estados iniciais So % S.

– Uma relação R % S & S total1, i.e., para todo estado s ' S existe umestado s! ' S tal que #s, s!$ ' R.

– Uma função de rótulos L : S ( 2!, onde " é o conjunto de proposições.

Exemplo 3.2 Exemplo de uma estrutura de Kripke K3.2 = #S, So, R, L$, onde

– S = {s, sa, sab}.

– So = {s}.1A restrição da relação R ser total é válida para lógicas temporais. Vale ressaltar que

diversas outras lógicas modais não possuem esta restrição.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 3. Lógicas Temporais para a Validação de Sistemas 60

– #s, sa$ ' R, #sa, s$ ' R, #s, sab$ ' R, #sa, sab$ ' R, #sab, sab$ ' R.

– L(s) = ), L(sa) = {a}, L(sab) = {a, b}.

Um caminho em uma estrutura de Kripke a partir de umestado s ' S é uma seqüencia " = s0, s1, . . . tal que s = s0 e *k +0, #sk, sk+1$ ' R. Referenciamos um caminho começando em um estado s comoum s-caminho. Denotamos "k, "0,k, "k," como o estado sk do caminho ", oprefixo s0, s1, . . . , sk de " e o sufixo sk, sk+1, . . . de ", respectivamente. Naestrutura K3.2 temos os seguintes caminhos a partir do estado s: s, sa, s, sa, . . .;s, sa, s, sa, . . . , sab, sab, . . .; s, sab, sab, . . ..

s

sabsa

!"#$

!"#$

!"#$

!

""""""""#

$$

"""""""""%

a a b

Figura 3.1: Estrutura de Kripke.

As propriedade dos sistemas reativos que desejamos verificar são usual-mente divididas em dois tipos: segurança (safety) que expressa que ‘nada ruimacontecerá’; e progresso (liveness) que expressa que ‘algo bom acontecerá’.Abaixo apresentamos alguns exemplos destas propriedades.

– Segurança (safety): ‘nada ruim acontecerá’.

– O sistema nunca irá entrar em deadlock.– Nunca dois processos entram na região crítica ao mesmo tempo.

– Progresso (liveness): ‘algo bom acontecerá’.

– Cada processo irá entrar na região crítica.– Toda requisição será atendida.

As propriedades a serem verificadas em um sistema reativo são expressascomo fórmulas, que especificam os comportamentos desejados, de uma lingua-gem lógica temporal.

As lógicas podem ser dividas em lógica temporal de tempo ramificadoe em lógica temporal de tempo linear. Tais lógicas se referem a noção deseqüências de estados que descrevem possíveis computações do sistema, e não

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 3. Lógicas Temporais para a Validação de Sistemas 61

s

sa

s sab sab

sab

!"#$

!"#$

!"#$

!"#$

!"#$

!"#$

&&&&&'

"""""%

((

()

**

*+ $

$

((

()

**

*+ $

a

a b a b

a b

Figura 3.2: Árvore de Computação Infinita.

a valores de tempos, ou a intervalos de tempos; uma vez que se deseja tratarde comportamentos de sistemas não-determinísticos que envolvem diferentescaminhos. Isto é, ou cada estado pode ter vários sucessores em termos deramificação, ou o comportamento é dado por um conjunto de caminhos quesão lineares.

Em lógica de tempo ramificado a multiplicidade de comportamentos podeser especificada explicitamente por uma propriedade de todos os próximosestados ou por uma propriedade do próximo estado, enquanto em lógica detempo linear, esta multiplicidade é expressa de forma implícita2.

A seguir iremos apresentar as lógicas CTL* e CTL, que são lógicas detempo ramificado, e a lógica LTL, que é um lógica de tempo linear. No fimdesta seção iremos fazer uma breve discussão sobre essas lógicas.

A lógica full Computation Tree Logic (CTL*) descreve propriedades deárvores de computações, que são obtidas a partir de um estado através dodesdobramento de uma estrutura de Kripke em uma árvore de computaçãoinfinita, como é ilustrado na árvore de computação apresentada na figura 3.2a partir do estado s da estrutura de Kripke apresentada na figura 3.1.

A linguagem lógica de CTL* é definida em duas partes: uma linguagemque expressa propriedades de estados como apresentada na gramática #s aseguir. Por exemplo, a fórmula E! significa que existe um caminho tal que afórmula ! vale, enquanto que a fórmula A! significa que em todos os caminhosa fórmula ! vale; e uma linguagem temporal como apresentado na gramática#p a seguir, expressando propriedades sobre um caminho. Os operadores X

(‘Next time’), F (‘in the Future’), G (‘Globally ’) e U (‘Until ’) são lidos daseguinte forma.

– X! significa ‘no próximo estado do caminho vale !’.2Através do conjunto dos caminhos lineares de uma estrutura.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 3. Lógicas Temporais para a Validação de Sistemas 62

– F! significa ‘em algum estado no caminho vale !’.

– G! significa ‘em todo estado no caminho vale !’.

– !U# significa ‘vale ! no caminho até que vale #’.

%! &! ! %! %!

%! %! &! ! %!

&! ! &! ! &! ! &! !

&! ! &! ! &# ! %!

(a) - X!.

(b) - F!.

(c) - G!.

(d) - (!U#).

Figura 3.3: Operadores temporais X, F, G e U .

Abaixo apresentamos a linguagem e a semântica de CTL*.

Definição 3.3 (Sintaxe de CTL*) Sejam " um conjunto de letras proposi-cionais e P ' " uma letra proposicional. A linguagem lógica de CTL* égerada pela seguinte BNF:

#s ::= P | (¬#s) | (#s , #s) | (#s - #s) | (#s ( #s) | (E#p) | (A#p)

#p ::= #s | (¬#p) | (#p,#p) | (#p-#p) | (#p ( #p) | (X#p) | (F#p) | (G#p) | (#p U #p)

Definição 3.4 (Semântica de CTL*) A definição de satisfação |= deCTL* é definida em duas partes.

– Se ! é uma fórmula da linguagem #s, escrevemos K |=s ! para dizerque a fórmula ! é satisfeita na estrutura K no estado s. A definição desatisfação é apresentada abaixo.

– K |=s P ./ P ' L(s).– K |=s (¬!) ./ NÃO K |=s !.– K |=s (! , #) ./ K |=s ! E K |=s #.– K |=s (! - #) ./ K |=s ! OU K |=s #.– K |=s (! ( #) ./ SE K |=s ! ENTÃO K |=s #.– K |=s (E!) ./ Existe um caminho " a partir de s tal que K |=! !.– K |=s (A!) ./ Para todo caminho " a partir de s vale que K |=! !.

– Se ! é uma fórmula da linguagem #p, escrevemos K |=! ! para dizerque a fórmula ! é satisfeita na estrutura K no caminho ". A definiçãode satisfação é apresentada abaixo.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 3. Lógicas Temporais para a Validação de Sistemas 63

– K |=! ! ./ se ! é uma fórmula da linguagem #s, K |=!0 !.– K |=! (¬!) ./ NÃO K |=! !.– K |=! (! , #) ./ K |=! ! E K |=! #.– K |=! (! - #) ./ K |=! ! OU K |=! #.– K |=! (! ( #) ./ SE K |=! ! ENTÃO K |=! #.– K |=! (X!) ./ K |=!1,! ! (veja a figura 3.3.a).– K |=! (F!) ./ Existe um k + 0 tal que K |=!k,! ! (veja a figura

3.3.b).– K |=! (G!) ./ Para todo k + 0 vale que K |=!k,! ! (veja a figura

3.3.c).– K |=! (!U#) ./ Existe k + 0 tal que K |=!k,! # e para todo

0 0 l < k vale que K |=!l,! ! (veja a figura 3.3.d).

Abaixo são apresentadas algumas fórmulas com suas relações de satisfa-ção para o exemplo 3.2.

– K3.2 |=s (E(G(¬b))), que pode ser lido como ‘existe uma caminho a partirde s tal que sempre não vale b’.

– K3.2 |=s (A(F a)), que pode ser lido como ‘para todos os caminhos apartir de s no futuro vale a’.

– K3.2 |=s,sab,sab,... (F (G(a , b))), que pode ser lido como ‘no caminhos, sab, sab, . . . vale no futuro que sempre vale a e b’.

– K3.2 1|=s,sa,s,sa,... (G a), que pode ser lido como ‘não vale no caminhos, sa, s, sa, . . . que sempre vale a’.

– K3.2 1|=s (A(G(a - b))), que pode ser lido como ‘não vale para todocaminho a partir de s que sempre vale a ou b’.

Duas lógicas que estão contidas e são diferentes de CTL* são a lógicaLinear-time Temporal Logic (LTL) (Pnu77) e a lógica Computation Tree Logic(CTL) (CE81), que são interpretados somente sobre caminhos e estados,respectivamente. A sintaxe e semântica de ambas são apresentadas abaixo,bem como algumas fórmulas para o exemplo 3.2.

Iremos delimitar os operadores temporais de CTL através de ‘[’ e ‘]’ com ointuito de deixar claro que temos apenas um operador temporal. Por exemplo,[EX] é apenas um operador, não podendo ser desmembrado no operador E

ou no operador X como no caso de CTL*. Os operadores de CTL podem serlidos como segue.

– [EX]! - ‘existe um caminho tal que no próximo estado vale !’.

– [AX]! - ‘para todo caminho no próximo estado vale !’.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 3. Lógicas Temporais para a Validação de Sistemas 64

– [EF ]! - ‘existe um caminho tal que no futuro vale !’.

– [AF ]! - ‘para todo caminho no futuro vale !’.

– [EG]! - ‘existe um caminho tal que sempre vale !’.

– [AG]! - ‘para todo caminho vale sempre !’.

– E(!U#) - ‘existe um caminho tal que vale ! até que vale #’.

– A(!U#) - ‘para todo caminho vale ! até que vale #’.

Definição 3.5 (Sintaxe de CTL) Sejam " um conjunto de letras proposi-cionais e P ' " uma letra proposicional. A linguagem lógica de CTL égerada pela seguinte BNF:

#s ::= P | (¬#s) | (#s , #s) | (#s - #s) | (#s ( #s) | ([EX]#s) | ([AX]#s)

| ([EF ]#s) | ([AF ]#s) | ([EG]#s) | ([AG]#s) | (E(#s U #s)) | (A(#s U #s))

Definição 3.6 (Semântica de CTL) Sejam " um conjunto de letras pro-posicionais, P uma letra proposicional em ", K = #S, So, R, L$ uma estruturade Kripke para ", s ' S um estado da estrutura K, e ! uma fórmula de CTL.Escrevemos K |=s ! para indicar que a fórmula ! é satisfeita no estado s daestrutura K. A definição de satisfação |= é como segue.

– K |=s P ./ P ' L(s).

– K |=s (¬!) ./ NÃO K |=s !.

– K |=s (! , #) ./ K |=s ! E K |=s #.

– K |=s (! - #) ./ K |=s ! OU K |=s #.

– K |=s (! ( #) ./ SE K |=s ! ENTÃO K |=s #.

– K |=s ([EX]!) ./ Existe um caminho " a partir de s tal que K |=!1 !

(veja a figura 3.4.a).

– K |=s ([AX]!) ./ Para todo caminho " a partir de s vale que K |=!1 !

(veja a figura 3.4.b).

– K |=s ([EF ]!) ./ Existe um caminho " a partir de s tal que existe umk + 0 tal que K |=!k

! (veja a figura 3.4.c).

– K |=s ([AF ]!) ./ Para todo caminho " a partir de s vale que existeum k + 0 tal que K |=!k

! (veja a figura 3.4.d).

– K |=s ([EG]!) ./ Existe um caminho " a partir de s tal que para todok + 0 vale que K |=!k

! (veja a figura 3.4.e).

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 3. Lógicas Temporais para a Validação de Sistemas 65

– K |=s ([AG]!) ./ Para todo caminho " a partir de s vale que para todok + 0 vale que K |=!k

! (veja a figura 3.4.f).

– K |=s (E(!U#)) ./ Existe um caminho " a partir de s tal que existek + 0 tal que K |=!k

! e para todo 0 0 l < k vale que K |=!l! (veja a

figura 3.4.g).

– K |=s (A(!U#)) ./ Para todo caminho " a partir de s vale que existek + 0 tal que K |=!k

! e para todo 0 0 l < k vale que K |=!l! (veja a

figura 3.4.h).

Assim como em diversas outras lógicas, alguns dos operadores de CTLsão definidos através dos outros. Por exemplo, os operadores ¬,(, [EX], [EG]

e EU definem os operadores ,,-, [AX], [EF ], [AF ], [AG] e AU como abaixo.Vale ressaltar que existem outros conjuntos de operadores, que expressam osdemais operadores.

• ! , # ./ ¬(! ( ¬#) • ! - # ./ (¬!) ( # • [AF ]! ./ ¬[EG](¬!)

• [AX]! ./ ¬[EX](¬!) • [EF ]! ./ E(2 U !) • [AG]! ./ ¬[EF ](¬!)

• A(!U#) ./ (¬E((¬#) U (¬! , ¬#))) , (¬[EG](¬#))

Quando utilizamos CTL, dizemos que o sistema é correto em relação auma propriedade se a propriedade é satisfeita na estrutura, que representa osistema, para todos os estados iniciais.

Abaixo são apresentadas algumas fórmulas com suas relações de satisfa-ção para o exemplo 3.2.

– K3.2 |=s ([EG](¬b)), que pode ser lido como ‘existe uma caminho a partirde s tal que sempre não vale b’.

– K3.2 |=s ([AF ] a), que pode ser lido como ‘para todo o caminho a partirde s no futuro vale a’.

– K3.2 |=s ([EF ]([AG](a,b))), que pode ser lido como ‘existe uma caminhoa partir de s tal que no futuro sempre vale a e b’.

– K3.2 1|=s ([EG] a), que pode ser lido como ‘não existe um caminho apartir de s tal que sempre vale a’.

– K3.2 1|=s ([AG](a-b)), que pode ser lido como ‘não vale para todo caminhoa partir de s que sempre vale a ou b’.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 3. Lógicas Temporais para a Validação de Sistemas 66

'()*

...'()*

...'()*

...'()*

...

'()*,

,,

,-

..../

+!,

,,

,-

..../

'()**

**

*+

((

(()

(a) - [EX]!

'()*

...'()*

...'()*

...'()*

...

+!,

,,

,-

..../

+!,

,,

,-

..../

'()**

**

*+

((

(()

(b) - [AX]!

+!...

'()*

...'()*

...'()*

...

'()*,

,,

,-

..../

'()*,

,,

,-

..../

'()**

**

*+

((

(()

(c) - [EF ]!

+!...

+!...

'()*

...'()*

...

'()*,

,,

,-

..../

+!,

,,

,-

..../

'()**

**

*+

((

(()

(d) - [AF ]!

+!...

'()*

...'()*

...'()*

...

+!,

,,

,-

..../

'()*,

,,

,-

..../

+!

**

**+

((

(()

(e) - [EG]!

+!...

+!...

+!...

+!...

+!,

,,

,-

..../

+!,

,,

,-

..../

+!

**

**+

((

(()

(f) - [AG]!

'()*

...'()*

...'()*

...'()*

...

+#,

,,

,-

..../

'()*,

,,

,-

..../

+!

**

**+

((

(()

(g) - E(!U#)

'()*

...'()*

...

+#...

+#...

+#,

,,

,-

..../

+!,

,,

,-

..../

+!

**

**+

((

(()

(h) - A(!U#)Figura 3.4: Operadores de CTL.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 3. Lógicas Temporais para a Validação de Sistemas 67

Definição 3.7 (Sintaxe de LTL) Sejam " um conjunto de letras proposi-cionais e P ' " uma letra proposicional. A linguagem lógica de LTL égerada pela seguinte BNF:

#p ::= P | (¬#p) | (#p,#p) | (#p-#p) | (#p ( #p) | (X#p) | (F#p) | (G#p) | (#p U #p)

Definição 3.8 (Semântica de LTL) Sejam " um conjunto de letras propo-sicionais, P uma letra proposicional em ", K = #S, So, R, L$ uma estruturade Kripke para ", " um caminho da estrutura K, e ! uma fórmula de LTL.Escrevemos K |=! ! para dizer que a fórmula ! é satisfeita na estrutura K nocaminho ". A definição de satisfação é apresentada abaixo.

– K |=! P ./ P ' L("0).

– K |=! (¬!) ./ NÃO K |=! !.

– K |=! (! , #) ./ K |=! ! E K |=! #.

– K |=! (! - #) ./ K |=! ! OU K |=! #.

– K |=! (! ( #) ./ SE K |=! ! ENTÃO K |=! #.

– K |=! (X!) ./ K |=!1,! ! (veja a figura 3.3.a).

– K |=! (F!) ./ Existe um k + 0 tal que K |=!k,! ! (veja a figura 3.3.b).

– K |=! (G!) ./ Para todo k + 0 vale que K |=!k,! ! (veja a figura3.3.c).

– K |=! (!U#) ./ Existe k + 0 tal que K |=!k,! ! e para todo 0 0 l < k

vale que K |=!l,! ! (veja a figura 3.3.d).

Abaixo são apresentadas algumas fórmulas com suas relações de satisfa-ção para o exemplo 3.2.

– K3.2 |=s,sab,sab,... ((¬(a- b))U(a, b)), que pode ser lido como ‘no caminhos, sab, sab, . . . vale não a ou b até que vale a e b’.

– K3.2 1|=s,sa,s,sa,... (G a), que pode ser lido como ‘não vale no caminhos, sa, s, sa, . . . que sempre vale a’.

– K3.2 |=s,sab,sab,... (F (G a)), que pode ser lido como ‘vale no caminhos, sab, sab, . . . que no futuro sempre vale a’.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 3. Lógicas Temporais para a Validação de Sistemas 68

Quando validamos sistemas reativos utilizando a lógica LTL, subenten-demos uma quantificação universal sobre todos os caminhos de uma estruturade Kripke. Assim, um sistema é considerado correto em relação a um proprie-dade se ela é satisfeita para todos os caminhos da estrutura a partir de todosos estados iniciais.

Na verdade, a lógica CTL* foi proposta em (EH86), como uma extensãodas duas lógicas CTL e LTL, com o intuito de estudar a relação entre estas duaslógicas em resposta ao artigo (Lam80), que afirmava que: uma lógica de tempolinear, a exemplo de LTL, expressa melhor algumas propriedades acerca desistemas concorrentes do que lógicas de tempo ramificado, a exemplo de CTL.

Em geral, na prova da correção de um sistema utilizamos o seguinteprincípio: ‘ao longo de qualquer caminho p será verdadeiro no futuro, ou serásempre falso’. Este princípio é facilmente expresso em LTL como a seguintefórmula (Fp) - (G(¬p)), que é sempre válida. Por outro lado, não há umafórmula equivalente em CTL, por exemplo, a fórmula ([AF ]p) - ([AG](¬p))

não é válida. A partir deste e outros argumentos conclui-se que, lógica comtempo linear é melhor para expressar propriedades de sistemas concorrentesdo que lógicas com tempo ramificado. Em (EH86), esta questão é reexaminada,e argumenta-se que este princípio pode ser facilmente expresso em CTL*, queé uma lógica de tempo ramificado, como (A((Fp) - (G(¬p)))).

Há ainda um enorme debate sobre qual lógica, CTL ou LTL, é melhorpara expressar propriedades sobre sistemas concorrentes. Contudo, as proprie-dades usualmente utilizadas na verificação de tais sistemas podem ser expressasem ambas as lógicas.

Diversos cálculos dedutivos corretos e completos existem para as lógicasCTL*, CTL e LTL, tais como: uma axiomatização para CTL* em (Rey01); umsistema de dedução natural para CTL* em (Ren04); uma axiomatização paraCTL em (Gol92); um sistema de dedução natural para CTL em (RH02); umsistema de resolução para CTL em (BF97, Bol00); um sistema de resoluçãopara LTL em (Fis91); entre outros sistemas.

A tabela apresentada na figura 3.5 resume a complexidade para oproblema da verificação de modelos e da prova automática de teoremasdas lógicas CTL*, LTL e CTL. Uma observação sobre a complexidade daverificação de modelos de LTL se faz necessária, é demonstrado em (LP85) quea verificação de modelos de LTL é PSPACE-Completo, porém ela é exponencialno tamanho da fórmula e linear no tamanho da estrutura. A partir daí, muitosargumentam (Hol97) que, geralmente, o tamanho da fórmula a ser verificadaé pequeno em comparação ao tamanho da estrutura. Assim, na prática averificação de modelos de LTL é realizada de forma eficiente.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 3. Lógicas Temporais para a Validação de Sistemas 69

Lógica Verificação de Modelos SatisfatibilidadeCTL* PSPACE-Completo (LP85) 2EXP-Completo (EH86)LTL PSPACE-Completo (LP85) PSPACE-Completo (SC85)CTL Linear (CES86) EXP-Completo (CE81)

Figura 3.5: Complexidade de CTL*, LTL e CTL.

3.2Verificação de Modelos em CTL

Sejam K = #S, So, R, L$ uma estrutura de Kripke, que representa umsistema reativo com estados finitos (S finito), e ! uma fórmula de CTL, queexpressa uma propriedade do sistema. O problema da verificação de modelosé encontrar o conjunto dos estados que satisfazem a fórmula !:

{s ' S | K |=s !}

Dizemos que o sistema satisfaz a propriedade se todos estados iniciais s ' So

estão neste conjunto.Um verificador de modelos é uma ferramenta que automatiza a formula-

ção acima. O processo de validação segue os três passos abaixo:

1. Especificar em CTL quais são as propriedades que o sistema deverá terpara que seja considerado correto. Por exemplo, podemos querer que osistema nunca entre em deadlock, ou ainda, que ele sempre alcance umdeterminado estado.

2. O segundo passo é a construção do modelo formal do sistema, que édefinido, geralmente, em uma linguagem de alto nível (a linguagem doverificador). O modelo deve capturar todas as propriedades essenciaisdo sistema para verificar a correção do mesmo, contudo, também deverápossuir abstrações de detalhes do sistema que não afetem a correçãodas propriedades a serem verificadas. Por exemplo, em protocolos decomunicações se está interessado em testar propriedade de quando umamensagem é recebida e não do conteúdo dela.

3. O terceiro e último passo é a própria execução do verificador de mode-los para validar as propriedades especificadas do sistema. Neste passo,já temos as propriedades e o modelo. Assim, aplicamos o verificador econseguimos garantir se o modelo do sistema possui ou não as proprie-dades desejadas. Caso todas as propriedades sejam verdadeiras, então osistema está correto. Caso não obedeça a alguma propriedade, então égerado um contra exemplo mostrando o porquê da não verificação dapropriedade. Desta forma, podemos detectar o erro e realizar a correção

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 3. Lógicas Temporais para a Validação de Sistemas 70

do modelo. Esse processo deve ser feito até que o sistema obedeça todasas propriedades, realizando assim um ajuste na especificação.

A seguir iremos apresentar um algoritmo para a verificação de modelosde CTL na seção 3.2.1, bem como o verificador de modelos Symbolic ModelVerifier (SMV) (McM93) na seção 3.2.2.

3.2.1Algoritmo com Representação Explícita

O algoritmo descrito nesta seção utiliza uma representação explícita deuma estrutura de Kripke K = #S, R, L$, através de um grafo, direcionado erotulado da seguinte forma. Os nós do grafo representam os estados S, osarcos definem a relação de transição R, e os rótulos associados com cada nódescrevem a função L : S ( 2!, onde " é um conjunto de proposições.

No problema da verificação de modelos de CTL estamos interessados emsaber o conjunto de estados de S que satisfazem a fórmula !. O algoritmoproposto (veja o algoritmo 1) opera rotulando cada estado s com o conjuntolabel(s) de sub-fórmulas de ! que são verdadeiros em s. Inicialmente, label(s) ésomente L(s), e então o algoritmo é executado uma série de passos (o númerode operadores em !). A cada passo sub-fórmulas com k 3 1 operadores sãoprocessadas. Quando uma fórmula é processada, a mesma é adicionada aolabel(s) do estado s se ela é verdadeira. Assim, K |=s ! ./ ! ' label(s).

Lembremos que as fórmulas de CTL podem ser expressas em termos de¬, -, [EX], [EG] e EU . Desta forma, é necessário tratarmos apenas estes casoscomo segue.

– Para o caso (¬!1) (veja o algoritmo 2), rotulamos os estados que não sãorotulados por !1. A complexidade é O(|S|).

– Para o caso (!1 ( !2) (veja o algoritmo 3), rotulamos os estados que nãosão rotulados por !1 ou são rotulados por !2. A complexidade é O(|S|).

– Para o caso [EX]!1 (veja o algoritmo 4), rotulamos os estados que temalgum sucessor rotulado por !1. A complexidade é O(|S| + |R|).

– Para o caso E(!1U!2) (veja o algoritmo 5), adicionamos E(!1U!2) a to-dos os estados rotulados com !2, e então adicionamos E(!1U!2) retroa-tivamente, utilizando a inversa da relação R, a todos os estados rotuladoscom !1 que podem ser alcançados por um caminho. A complexidade éO(|S| + |R|).

– Para o caso [EG]!1 (veja o algoritmo 6) temos os seguintes passos.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 3. Lógicas Temporais para a Validação de Sistemas 71

1. Construímos K! = #S !, R!, L!$ a partir de K = #S, R, L$, removendotodos os estados de S que não vale !1 e restringindo R e L.

2. Utilizamos o algoritmo do Tarjan (Tar72) para particionar o grafo#S !, R!$ em SCCs (Strongly Connected Components), onde um SCCé um subgrafo maximal C tal que todo nó em C é alcançável apartir de qualquer outro nó em C através de um caminho em C.Este algoritmo tem complexidade O(|S !| + |R!|).

3. Adicionamos [EG]!1 aos estados que pertencem aos SCCs não-triviais, onde um SCC é não-trivial se, e somente se, ele tem maisde um nó ou ele contém um nó relacionado com ele mesmo.

4. Por fim, adicionamos [EG]!1 retroativamente, utilizando a inversada relação R, a todos os estados rotulados com !1 que podem seralcançados por um caminho.

A complexidade de toda esta computação é O(|S| + |R|). Fundamentalpara a correção de tal algoritmo é o lema abaixo.

Lema 3.9 K |=s [EG]!1 ./ s ' S ! e existe um caminho em K! queleva o estado s a algum estado t em um SCC não-trivial de #S !, R!$.

A partir dos algoritmos acima temos o seguinte teorema.

Teorema 3.10 Existe um algoritmo para determinar se uma fórmula ! deCTL é satisfeita em um estado s de K = #S, R, L$, cuja complexidadealgorítmica é O(|!|& (|S| + |R|)).

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 3. Lógicas Temporais para a Validação de Sistemas 72

Algoritimo 1 procedure Check(!)while |!| + 1 do

if ! = (¬!1) thenCheck(!1)

CheckNOT (!1)

else if ! = (!1 ( !2) thenCheck(!1)

Check(!2)

CheckIMP (!1,!2)

else if ! = [EX]!1 thenCheck(!1)

CheckEX(!1)

else if ! = [EG]!1 thenCheck(!1)

CheckEG(!1)

else if ! = E(!1U!2) thenCheck(!1)

Check(!2)

CheckEU(!1,!2)

end ifend while

Algoritimo 2 procedure CheckNOT(!)for all s ' S do

if ! 1' label(s) thenlabel(s) := label(s) " {(¬!)}

end ifend for

Algoritimo 3 procedure CheckIMP((!1 ( !2)for all s ' S do

if !1 1' label(s) or !2 ' label(s) thenlabel(s) := label(s) " {(!1 ( !2)}

end ifend for

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 3. Lógicas Temporais para a Validação de Sistemas 73

Algoritimo 4 procedure CheckEX(!1)T := {s | !1 ' label(s)}while T 1= ) do

choose s ' T

T := T\{s}for all t such that #t, s$ ' R do

if [EX]!1 1' label(t) thenlabel(t) := label(t) " {[EX]!1}

end ifend for

end while

Algoritimo 5 procedure CheckEU(!1,!2)T := {s | !2 ' label(s)}for all s ' T do

label(s) := label(s) " {E(!1U!2)}end forwhile T 1= ) do

choose s ' T

T := T\{s}for all t such that #t, s$ ' R do

if E(!1U!2) 1' label(t) and !1 ' label(t) thenlabel(t) := label(t) " {E(!1U!2)}T := T " {t}

end ifend for

end while

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 3. Lógicas Temporais para a Validação de Sistemas 74

Algoritimo 6 procedure CheckEG(!1)S ! := {s | !1 ' label(s)}SCC := {C | C is a nontrivial SCC of S !}T := "C#SCC{s | s ' C}for all s ' T do

label(s) := label(s) " {[EG]!1}end forwhile T 1= ) do

choose s ' T

T := T\{s}for all t such that t ' S ! and #t, s$ ' R do

if [EG]!1 1' label(t) thenlabel(t) := label(t) " {[EG]!1}T := T " {t}

end ifend for

end while

3.2.2Symbolic Model Verifier (SMV)

Boa parte da pesquisa em verificação de modelos tem se concentradono desenvolvimento de algoritmos que usem uma representação dos sistemasde forma mais eficiente. Uma das técnicas que obteve relativo sucesso foi arepresentação através de Ordered Binary Decision Diagram (OBDD) (Bry92).OBDDs são representações canônicas para funções booleanas, que representamos sistemas reativos. OBDDs são freqüentemente muito mais compactas doque representações em forma normal conjuntiva ou disjuntiva, e elas podemser eficientemente manipuladas.

Iremos apenas descrever o funcionamento geral de OBDDs, uma vez quenão utilizaremos tal técnica nesta tese por motivos que ficarão claros em seçõesposteriores. No final desta seção, iremos apresentar a linguagem do verificadorde modelos Symbolic Model Verifier (SMV) (McM93) que foi o primeiro autilizar tal técnica para lógicas temporais.

Para a verificação de modelos utilizando OBDD, temos os seguintespassos.

1. Representar uma estrutura de Kripke (um sistema) através de umafórmula booleana. Isto é feito, utilizando o conjunto " de proposições,tipicamente booleanas, para representar a estrutura de Kripke, onde

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 3. Lógicas Temporais para a Validação de Sistemas 75

as possíveis combinações dos valores associados a cada variável v emV representam todos os possíveis estados da estrutura. A partir daí,podemos expressar um estado através de uma fórmula booleana. Noexemplo apresentado na figura 3.2, temos duas variáveis a e b, e seusvalores podem ser verdadeiro ou falso, assim temos quatro possíveisestados. Desta forma, podemos representar todos os possíveis estados,mas, por outro lado, não temos como representar as relações entreos estados utilizando tais variáveis. Para representarmos tal conceito,utilizamos um cópia V ! das variáveis de V , onde cada variável em v ' V

tem uma v! ' V ! correspondente no próximo estado. Por exemplo, aestrutura da figura 3.2 é representada pela seguinte fórmula.

!(¬A , ¬B , A! , ¬B!) - (A , ¬B , ¬A! , ¬B!) - (¬A , ¬B , A! ,B!)

- (A , ¬B , A! ,B!) - (A ,B , A! ,B!)

"

2. Construir a OBDD a partir de tal fórmula booleana. Uma OBDD é umarepresentação concisa de uma árvore de decisão binária que utiliza umaordenação nas variáveis V . A figura 3.6 abaixo representa uma árvore dedecisão binária para a fórmula (a1 4 b1) , (a2 4 b2). A partir daí, umaOBDD é construída unificando as sub-árvores que resultam no mesmovalor de verdade. Este processo é repetido até não haver nenhuma sub-árvore equivalente. Por exemplo, na figura 3.7.a temos a OBDD obtidaa partir da árvore 3.6 com ordenação a1 5 b1 5 a2 5 b2. Note queesta é uma representação muito mais concisa do que a OBDD obtidacom ordenação a1 5 a2 5 b1 5 b2 apresentada na figura 3.7.b. Defato, o tamanho da OBDD gerada depende fortemente da ordenaçãodas variáveis. Em (Bry92), é demonstrado que mesmo verificar que umaordenação é ótima é NP-Completo, e para alguns casos o tamanhoda OBDD é exponencial para qualquer que seja a ordenação. Diversasheurísticas são utilizadas para tentar achar uma boa ordenação.

3. Utilizar algoritmos simbólicos para a validação de propriedades. Estesalgoritmos manipulam as OBDDs e são baseados em computação deponto-fixo, nos quais os operadores temporais de CTL são definidosem função do menor ou maior ponto fixo. Veja (CGP99) para maioresdetalhes.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 3. Lógicas Temporais para a Validação de Sistemas 76

1 0 0 1 0 0 0 0 0 0 0 0 1 0 0 1

'()*b2

00

00

1111

'()*b2

00

00

1111

'()*b2

00

00

1111

'()*b2

00

00

1111

'()*b2

00

00

1111

'()*b2

00

00

1111

'()*b2

00

00

1111

'()*b2

00

00

1111

'()*a2

22

22

33

33

'()*a2

22

22

33

33

'()*a2

22

22

33

33

'()*a2

22

22

33

33

'()*b1

44

44

44

55

55

55

'()*b1

44

44

44

55

55

55

'()*a1

666666666666

777777777777

0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1

0 1 0 1 0 1 0 1

0 1 0 1

0 1

Figura 3.6: Árvore de decisão binária da fórmula (a1 4 b1) , (a2 4 b2).

'()*b2 '(

)*b2

'()*a2

'()*b1 '(

)*b1

'()*a1

'()*b2

((

((

77777777777

'()*b2

**

**

66666666666

'()*b188888888888888888

99

99

99

99

99

999

'()*b1

44

44

44

33

33

33

33

33

'()*b1

55

55

55

'()*b1

:::::::::::::::::

,,

,,

,,

,,

,,

'()*a2

22

22

33

33

'()*a2

22

22

33

33

'()*a1

44

44

44

55

55

55

,-

./1

)'

*(0

(a) - Ordem a1 5 b1 5 a2 5 b2. (b) - Ordem a1 5 a2 5 b1 5 b2.

,-

./1

)'

*(0

22

22

33

33

;;;;;;;;;;;;;;;

;;;;;;;;;;;;;;;;

<<

<<

<<

99

99

99

((

((

44

44

44

0 1

0 1 1 0

0 1

0 1 1 00

10

1

01

0 1 0 1 10

0 1 0 1

0 1

Figura 3.7: OBDD da fórmula (a1 4 b1) , (a2 4 b2).

Abaixo descrevemos as principais características da linguagem de espe-cificação de modelos do SMV.

– Módulos – O usuário pode decompor um sistema de estados finitos emmódulos, que encapsulam uma coleção de declarações: ‘VAR’ define asvariáveis do módulo, que podem ser booleanos, conjunto enumerado deconstantes ou instâncias de outros módulos; ‘INIT’ inicializa as variáveis;‘ASSIGN’ define as relações de transições; ‘FAIRNESS’ definem as

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 3. Lógicas Temporais para a Validação de Sistemas 77

fairness constraints, que são fórmulas em CTL3; ‘SPEC’ especificaçõesem CTL. Os módulos podem ser instanciados várias vezes, podemreferenciar variáveis de outros módulos e possuem parâmetros que podemser expressões, estados de outros módulos ou até mesmo instâncias demódulos.

– Sincronismo e Assincronismo (Interleaved) – módulos podem ser com-postos de forma síncrona ou assíncrona. Em composição síncrona, umpasso corresponde a um passo de cada módulo. Em composição assín-crona, cada passo corresponde a um passo de um único módulo. Se apalavra reservada ‘process ’ preceder uma instância de um módulo, as-sincronismo é usado. Caso contrário, a composição síncrona é assumida.Cada processo tem uma variável running que indica se o processo estáativo ou não4.

– Transições Não-Determinísticas – as transições de um estado em ummodelo podem ser determinísticas ou não-determinísticas. Transição não-determinística é usada para descrever modelos mais abstratos onde certosdetalhes são omitidos.

– Relações entre transições – as relações de transições de um módulopodem ser especificadas explicitamente em termos de relações bináriasentre o atual e o próximo estado das variáveis, ou implicitamente comoum conjunto de comandos de atribuições paralelas. Os comandos deatribuições paralelas definem o valor das variáveis no próximo estado emtermos dos valores no estado atual e são definidos através da declaração‘NEXT’ para cada atribuição.

Abaixo apresentamos um exemplo de uma especificação no SMV.

Exemplo 3.11 Apresentamos na figura 3.8 como, seria descrito na linguagemdo SMV, um programa que utiliza uma variável semáforo ( semaforo) paraimplementar exclusão mútua entre dois processo assíncronos. Será definido ummódulo usuário que terá uma variável estado que possui quatro estados: ocioso,o processo não quer entrar na região crítica; entrando, o processo quer entrarna região crítica; critica, o processo está utilizando a região crítica; e saindo, oprocesso não irá mais usar a região crítica. O módulo ‘main’ terá uma variávelsemáforo, que será inicializada com 0, e os dois usuários. Como os processos

3Fairness constraints são condições que são inseridas para garantir justiça aos caminhosem CTL. Um exemplo simples é o de duas avenidas que se entroncam. Suponha que somentepassem carros de uma das avenidas. Isto claramente não seria justo. Assim, deve-se garantirque os carros das duas avenidas possam passar no entroncamento.

4Se a condição de running for definido nas condições de fairness de um módulo significaráque o módulo não poderá ficar indefinidamente sem ser executado.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 3. Lógicas Temporais para a Validação de Sistemas 78

são assíncronos os usuários serão definidos com a palavra ‘process’. A fórmulaAG!(proc1.estado = critica & proc2.estado = critica) expressa que nenhum dosdois processos estão utilizando a região crítica ao mesmo instante. A fórmulaAG(proc1.estado = entrando 3 > AF (proc1.estado = critica)) significa quese um processo deseja entrar na região crítica em algum instante no futuro eleutilizará a região crítica.

MODULE mainVARsemaforo : boolean;proc1 : process usuario;proc2 : process usuario;ASSIGNinit(semaforo) :=0;SPECAG !(proc1.estado=critica & proc2.estado=critica)SPECAG(proc1.estado = entrando -> AF(proc1.estado = critica))MODULE usuarioVARestado : {ocioso, entrando, critica, saindo};ASSIGNinit(estado) := ocioso;next(estado) :=caseestado = ocioso : {ocioso,entrando};estado = entrando & !semaforo :critica;estado = critica : {critica, saindo};estado = saindo : ocioso;1 : estado;esac;next(semaforo) :=caseestado = entrando : 1;estado = saindo :0;1 : semaforo;esac;FAIRNESSrunning

Figura 3.8: Exclusão mútua na linguagem do SMV.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

4Lógicas para Jogos

Dentre as diversas lógicas existentes para raciocinar sobre jogos, es-colhemos apresentar as seguintes lógicas: Alternating-time Temporal Logic(ATL) (AHK02) e sua variante Counterfactual Alternating-time Temporal Lo-gic (CATL) (vdHJW05) que são interpretadas sobre modelos de jogos não-cooperativos, especificamente jogo extensivo; e Coalitional Game Logic (CGL)(ÅWvdH06) que é interpretada sobre modelos cooperativos, especificamentejogos de coalizão sem utilidades transferíveis.

Escolhemos essas lógicas por acreditarmos que elas são as mais repre-sentativas para modelar cada tipo de interação, ou seja, os modelos não-cooperativos e os cooperativos.

4.1Alternating-temporal logic (ATL)

Alternating-time Temporal Logic (ATL) (AHK02) é uma lógica interpre-tada sobre estruturas de jogos concorrentes que podem ser vistos como sistemasabertos, onde um sistema aberto é um sistema que interage com seu ambiente eo seu comportamento depende do estado do sistema assim como do ambiente.Os jogadores representam tanto os componentes individuais como também oambiente do sistema aberto. As transições dos estados são definidas atravésdas escolhas das ações dos jogadores, uma para cada jogador. A lógica ATLestende a lógica CTL permitindo que os operadores temporais sejam parame-trizados por um subconjunto dos jogadores. Abaixo apresentamos a linguagemnão-lógica, a sintaxe e semântica de ATL.

Definição 4.1 Uma linguagem não-lógica de ATL é um par !n, !", onden é um número natural maior do que 0, que representa o número de jogadores,e ! é um conjunto de letras proposicionais. Identificamos os jogadores com osnúmeros 1, ..., n.

Definição 4.2 Seja !n, !" uma linguagem não-lógica de ATL, p # ! eI $ {1, 2, ..., n} um conjunto de jogadores. A linguagem lógica de ATLé gerada pela seguinte BNF:

" ::= p | (¬") | ("%") | !!I""X" | !!I""G" | !!I""("U ")

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 4. Lógicas para Jogos 80

O operador !!I"" é um quantificador de caminho que é parametrizado peloconjunto de jogadores I. X (‘Next ’), G (‘Globally ’), e U (‘Until ’) são operadorestemporais similares a CTL. Os operadores &,' e !!""F são definidos atravésdos operadores de ATL de forma semelhante aos operadores de CTL.

Definição 4.3 Seja !n, !" uma linguagem não-lógica de ATL. Uma estru-tura de jogo concorrente é definida por C = !Q, Qo, !, a, "", onde:

– Um conjunto finito não-vazio Q de estados.

– Um conjunto Qo de estados iniciais.

– Para cada estado q # Q, associa-se um conjunto !(q) $ ! de proposiçõesverdadeiras no estado q. A função ! é chamada de função de rótulos.

– Para cada jogador i # {1, ..., n} e cada estado q # Q, associa-se umnúmero natural ai(q) ( 1 de ações disponíveis 1, ..., ai(q) no estado q

para o jogador i. Para cada estado q # Q, um perfil de ações para oestado q é uma n-upla !a1, ..., an" tal que 1 ) ai ) ai(q) para cadajogador i. Dado um estado q # Q, escrevemos A(q) para o conjunto{1, ..., a1(q)}*...*{1, ..., an(q)} de perfis de ações. A função A é chamadade função de ação.

– Para cada estado q # Q e cada n-upla de ações !a1, ..., an" # A(q),associa-se um estado "(q, !a1, ..., an") # Q que resulta quando cadajogador i # {1, ..., n} no estado q escolhe a ação ai. A função " é chamadade função de transição

O número de transições de uma estrutura de jogo concorrente é!

q!Q a1(q)* . . .* an(q), i.e., o número de perfis de ações da função A. Noteque este número não é limitado a n2 como em estruturas de Kripke, onde n éo número de estados da estrutura de Kripke.

Note que uma estrutura de jogo concorrente pode ser transformada emum jogo extensivo com informação quase perfeita da mesma forma que umaestrutura de Kripke é transformada em uma árvore infinita.

Um caminho de C é uma seqüência infinita # = q0, q1, q2, . . . de estados talque para todo k ( 0, existe uma n-upla de ações a # A(q), onde qk+1 = "(qk, a).Referenciamos um caminho começando em um estado q como um q-caminho.Denotamos #k e #0,k como o estado qk do caminho #, o prefixo q0, q1, . . . , qk de#, respectivamente.

Para apresentar a semântica de ATL, a noção de estratégia e outcomesde estratégias são definidos abaixo.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 4. Lógicas para Jogos 81

Definição 4.4 Uma estratégia para um jogador i é uma função si quemapeia cada seqüência finita de estados1 de # em um número natural tal quese o último estado de # é q, então si(#) ) ai(q). Para um conjunto de jogadoresI, denotamos SI como o conjunto de estratégias para os jogadores em I.

A noção de estratégia acima requer que o jogador tenha lembrançaperfeita (perfect recall) de todos os estados que aconteceram anteriormentea um dado estado. Na verdade, para o propósito da lógica ATL o conceitode estratégia pode ser definido para lembrança imperfeita (imperfect recall),i.e., uma função si : Q % N que mapeia cada estado em um número natural.Contudo, para a lógica ATL*, que é a lógica análoga a CTL* com os operadoresparametrizados como em ATL, o mesmo não é verdadeiro.

Definição 4.5 Sejam I um conjunto de jogadores, SI um conjunto de estra-tégias e q um estado. Definimos outcomes de SI a partir de q como sendoo conjunto #(q, SI) de q-caminhos que os jogadores em I podem forçar quandoeles usam as estratégias em SI . Assim, # = q0, q1, q2, . . . # #(q, SI), se q = q0 epara todo k ( 0, existe um perfil de ações !a1, . . . , ai, . . . , an" # A(#k) tal que,para cada jogador i # I, ai = si(#0,k) e "(#k, !a1, . . . , ai, . . . , an") = #k+1.

Definição 4.6 Sejam C = !Q,Qo, !,!, a, "" uma estrutura concorrentede jogo com linguagem não-lógica !n, !", I um subconjunto de jogadores{1, 2, . . . , n} e q um estado em Q. A definição formal de satisfação (|=) édefinida como segue:

– C |=q p +, p # !(q).

– C |=q ¬$ +, NÃO C |=q $.

– C |=q ($ % %) +, SE C |=q $, ENTÃO C |=q %.

– C |=q !!I""X$ +, existe um conjunto SI de estratégias, uma paracada jogador i # I, tal que em todos os caminhos # # #(q, SI) valeque C |=!1 $.

– C |=q !!I""G$ +, existe um conjunto SI de estratégias, uma para cadajogador i # I, tal que em todos os caminhos # # #(q, SI) e para todok ( 0 vale que C |=!k

$ .

– C |=q !!I""($U%) +, existe um conjunto SI de estratégias, uma paracada jogador i # I, tal que em todos os caminhos # # #(q, SI), existe umk ( 0 tal que C |=!k

% e para todo 0 ) j < k vale que C |=!j $.

1As seqüências finitas no contextos de jogos são os históricos não-terminais.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 4. Lógicas para Jogos 82

O quantificador de caminhos !!I"" de ATL coincide com o quantificadoresde caminhos E e A de CTL quando o conjunto I = {1, . . . , n} e I =

-, respectivamente. Desta forma, temos que [EX] e [AX] de CTL são osoperadores !!{1, . . . , n}""X e !!-""X, respectivamente.

Exemplo 4.7 Considere um sistema com dois processos, 1 e 2. O processo 1

atribui valor a uma variável booleana A. Quando A = false, então 1 deixao valor de A inalterado ou altera-o para true. Quando A = true o processo1 deixa o valor de A inalterado. De forma semelhante, o processo 2 atribuivalor a uma variável booleana B. Quando B = false, então 2 deixa o valor deB inalterado ou altera-o para true. Quando B = true, então 2 deixa o valorinalterado.

Modelamos a composição síncrona destes dois processos pela seguinteestrutura de jogo concorrente SAB = !Q,Qo,!, a, "" com linguagem não-lógica!n, !":

– n = 2. O jogador 1 representa o processo 1, e o jogador 2 o processo 2.

– Q = {q, qA, qB, qAB}. No estado q temos A = B = false, no estado qA

temos A = true e B = false, e de forma semelhante os estados qB eqAB têm interpretações similares.

– Qo = {q}.

– ! = {A,B}. Os valores das variáveis a serem observadas.

– !(q) = -,!(qA) = {A}, !(qB) = {B},!(qAB) = {A,B}.

– – a1(q) = a1(qB) = 2 e a1(qA) = a1(qAB) = 1. No estado q e qB, aação 1 do jogador 1 deixa o valor de A inalterado, e a ação 2 alterao valor de A. No estado qA e qAB, o jogador 1 tem apenas umaação, que deixa o valor de A inalterado.

– a2(q) = a2(qA) = 2 e a2(qB) = a2(qAB) = 1. Nos estados q e qA, aação 1 do jogador 2 deixa o valor de B inalterado, e a ação 2 alterao valor de B. Nos estados qB e qAB, o jogador 2 tem apenas umaação, que deixa o valor de B inalterado.

– . O estado q tem 4 sucessores : "(q, !1, 1") = q, "(q, !1, 2") = qB,"(q, !2, 1") = qA, "(q, !2, 2") = qAB.

. O estado qA tem dois sucessores: "(qA, !1, 1") = qA,"(qA, !1, 2") = qAB.

. O estado qB tem dois sucessores: "(qB, !1, 1") = qB,"(qB, !2, 1") = qAB.

. O estado qAB tem apenas um sucessor: "(qAB, !1, 1") = qAB.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 4. Lógicas para Jogos 83

q

qABqA qB

!"#$

!"#$

!"#$

!"#$

!

"#

! !!

!1, 1"

!1, 1"

!1, 1" !1, 1"

!1, 2" !2, 1"

!2, 2"!2, 1" !1, 2"

!

$$$$$$$$$%

&&&&&&&&&'

A A B B

Figura 4.1: Estrutura de jogo concorrente do exemplo 4.7.

Representamos esta estrutura na figura 4.1. A função " é representadapelas setas que são rotuladas pela ações. Por exemplo, "(q, !1, 1") = q é umaseta rotulada por !1, 1".

Abaixo apresentamos algumas fórmulas com suas relações de satisfaçãopara o exemplo 4.7.

– SAB |=q !!{2}""XB, pois o jogador 2 pode escolher a ação 2 para tornarB verdadeiro.

– SAB /|=q !!{2}""X(A = B), pois se o jogador 2 escolher a ação 1, então ojogador 1 pode escolher a ação 2 obtendo A /= B, mas, por outro lado,se o jogador 2 escolher a ação 2, então o jogador 1 pode escolher a ação1 obtendo novamente A /= B.

Somente recentemente uma axiomatização correta e completa foi apresen-tada para ATL (GvD06), cuja complexidade para o problema da satisfatibili-dade para uma fórmula $ com um número finito de jogadores é EXP-completo.Por outro lado, a verificação de modelos é P-Completo, e pode ser feita emO(m* |$|), onde m é o número de transições e |$| é o número de operadoresna fórmula $. O verificador de modelos Mocha (AHM+98) utiliza-se de OBDDpara uma representação implícita da estrutura concorrente.

Em (AHK02) é demonstrado que se os jogadores possuem informaçãoimperfeita, i.e., conhecem apenas alguns dos símbolos proposicionais !, averificação de modelos é indecidível. Em (Sch04) este resultado é estudado deforma mais detalhada, e demonstra-se que de fato jogo com lembrança perfeitaé indecidível, por outro lado jogo com lembrança imperfeita é decidível. Osdetalhes podem ser encontrados nos referidos artigos.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 4. Lógicas para Jogos 84

4.1.1Counterfactual ATL

A lógica Counterfactual ATL (vdHJW05) é uma extensão da lógica ATLque possui operadores modais (contra-factuais) Ci(si,$), que podem ser lidoscomo se fosse o caso do jogador i escolher a estratégia si, então $ valeria.Para exemplificar este operador, considere o exemplo “se Napoleão tivesseganho a guerra, então todos nós falaríamos francês”. Com estes operadoresé demonstrado como representar o conceito de equilíbrio de Nash.

Basicamente o que se faz é adicionar a linguagem símbolos para repre-sentar as estratégias que serão interpretados pelas estratégias dos jogadores,i.e, um símbolo si para uma estratégia para o jogador i será interpretado pelaestratégia si (definição 4.4). Abaixo iremos apresentar as extensões necessárias.

A linguagem não-lógica de ATL !n, !" é estendida para !n, !, S", ondeS = 0Si é um conjunto de símbolos de estratégias de todos os jogadoresi # {1, . . . , n}. Assim, a linguagem lógica de CATL é definida pela BNFabaixo

" ::= p | (¬") | ("%") | Ci(si, ") | !!I""X" | !!I""G" | !!I""("U ")

Uma estrutura de CATL é uma extensão de uma estrutura de jogo concorrenteC = !Q,Qo, !,!, a, "" definida por CA = !Q,Qo, !,!, a, ", &", onde & é ummapeamento dos termos de estratégias em estratégias.

Quando um jogador i decide por uma estratégia si, ele altera a estruturado jogo concorrente CA. Isto ocorre porque ele elimina algumas das possibili-dades da estrutura. Para capturar isto, define-se uma estrutura CAsi a partirda estrutura CA removendo as transições que diferem das estratégia si. Estaoperação pode ser feita em O(m), onde m é o número de transições de CA.

A semântica de CATL é exatamente como ATL com a adição do seguinteítem.

– CA |=q Ci(si,$) +, CA"(si) |=q $

A complexidade da verificação de modelos de CATL é igual a de ATL.Contudo, o problema da satisfatibilidade é desconhecido, assim como umaaxiomatização correta e completa.

Mostramos abaixo como os jogos estratégicos podem ser modelados nasestruturas de CATL, bem como o conceito de equilíbrio de Nash pode serexpresso em uma fórmula de CATL. Para tanto, devemos notar que umjogo estratégico # = !N, (Ai), (ui)" difere de uma estrutura de CATL pordois motivos: os jogos estratégicos dependem apenas das ações tomadas pelosjogadores e não pelo estado do sistema como em CATL; e os jogos estratégicostêm funções de utilidades.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 4. Lógicas para Jogos 85

Seja U o conjunto de todas as utilidades que possam ser atribuídas por#. Para representarmos as utilidades o que se faz é utilizar uma proposiçãoui ( u para cada utilidade u # U que será satisfeita em um estado q se, esomente se, i recebe ao menos u em q. Cada estado será a representação deum perfil de utilidades, e as relações de transições ocorrerão a partir de umestado q de acordo com os perfis de ações do jogo #. Abaixo formalizaremosa correspondência entre jogo estratégico e estrutura de CATL. Vale notarque iremos representar apenas parte da estrutura de CATL. Nós escrevemos# ! (CA, q) para denotar que o jogo # corresponde a (CA, q), no sentido que:

– O conjunto de jogadores é o mesmo do jogo #.

– Para cada perfil de utilidades !u1, . . . , un", temos um estado q"u1,...,un#.Note que podemos ter menos estados do que perfis de ações, uma vezque podemos ter o mesmo perfil de utilidades para dois perfis de açõesdiferentes.

– Os perfis de ações a # A do jogo # são executadas no estado q, i.e.A(q) = A.

– Um termo s para cada perfil de ações a # A do jogo # tal que &(s) = a.

– Para todo a # A(q) com q$ = "(q, a), temos que (ui ( u) # !(q$) se, esomente se, ui(a) ( u.

A figura 4.2 representa o jogo Batalha dos Sexos na sua forma matriciale na sua correspondência em estrutura de CATL. Note que só temos 3 estados,uma vez que no jogo só temos 3 perfis de utilidades diferentes. A interpretaçãoda figura 4.2.b é semelhante a interpretação das figuras de ATL.

B

S

B S

2,1

0,0

0,0

1,2

q"0,0#

q"2,1#q"1,2#

(a) - Jogo Estratégico (b) - Estrutura de CATL

!B, B"!S, S"

!B, S" !S, B"((()

***+

!"#$

u1 # 0

u2 # 0

!

!"#$

u1 # 0u1 # 1u2 # 0u2 # 1u2 # 2

!"#$

u1 # 0u1 # 1u1 # 2u2 # 0u2 # 1

Figura 4.2: Representações do jogo estratégico Batalha dos Sexos.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 4. Lógicas para Jogos 86

Abaixo iremos apresentar as fórmulas BR1 e BR2 que representam que asestratégias para s1 e s2, respectivamente, são ótimas. Daí, a representação deequilíbrio de Nash é dada pela conjunção destas duas fórmulas.

A fórmula BR1(s1, s2) pode ser lida como: se fosse o caso do jogador 2

escolher a estratégia s2, então a utilidade u que pode ser obtida pelo jogador1 é obtida com a estratégia s1. A leitura de BR2(s1, s2) é semelhante.

BR1(s1, s2) ::= C2

"s2,

"#

u!U

((!!{1}""X(u1 ( u)) % (C1(s1, !!-""X(u1 ( u))))

$$

BR2(s1, s2) ::= C1

"s1,

"#

u!U

((!!{2}""X(u2 ( u)) % (C2(s2, !!-""X(u2 ( u))))

$$

EN ::= BR1(s1, s2) &BR2(s1, s2)

A proposição abaixo pode ser encontrada em (vdHJW05).

Proposição 4.8 Sejam # um jogo estratégico, s um perfil de estratégias para#, (CA, q) uma estrutura de CATL correspondente ao jogo #, EN(s) a fórmulade equilíbrio de Nash como definido acima para o perfil de estratégias s.

s é um equilíbrio de Nash em # +, CA |=q EN(s)

A fórmula de equilíbrio de Nash para o jogo Batalha dos Sexos éapresentada a seguir.

EN(s1, s2) ::=

%

&&&&&&&&&&'

%

&&'C2

%

&&'s2,

%

&&'

((!!{1}""X(u1 ( 0)) % (C1(s1, !!-""X(u1 ( 0))))

& ((!!{1}""X(u1 ( 1)) % (C1(s1, !!-""X(u1 ( 1))))

& ((!!{1}""X(u1 ( 2)) % (C1(s1, !!-""X(u1 ( 2))))

(

))*

(

))*

(

))*

&

%

&&'C1

%

&&'s1,

%

&&'

((!!{2}""X(u2 ( 0)) % (C2(s2, !!-""X(u2 ( 0))))

& ((!!{2}""X(u2 ( 1)) % (C2(s2, !!-""X(u2 ( 1))))

& ((!!{2}""X(u2 ( 2)) % (C2(s2, !!-""X(u2 ( 2))))

(

))*

(

))*

(

))*

(

))))))))))*

A fórmula para equilíbrio de Nash tende a ser enorme, principalmente,devido a utilização de proposições para representar as utilidades do jogo. Parasimplificar considere um jogo com dois jogadores que possuem n ações cada,daí é fácil verificar que o número de proposições para representar as utilidadesé limitado superiormente a 2n2, enquanto que o tamanho da fórmula é limitadoa (8n31 1). Utilizando uma abordagem simbólica como OBDD, tal como a doverificador de modelos MOCHA, teríamos que o número de estados é limitado

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 4. Lógicas para Jogos 87

superiormente a 22(n2). É difícil ver como na prática esta abordagem seria bemsucedida mesmo para exemplos pequenos com n = 10, onde a complexidade nopior caso seria de 7999* 2200. Provavelmente por este motivo, verificadores demodelos, tal como o MOCHA, não são empregados na prática para encontraro conjunto de equilíbrio de Nash.

4.2Coalitional Game Logic (CGL)

A lógica Coalitional Game Logic (CGL) (ÅWvdH06) é uma lógica pararaciocinar sobre jogos de coalizão sem utilidades transferíveis. A linguagem deCGL contém operadores para representar as relações de preferências dos joga-dores, bem como operadores para expressar a cooperação entre os jogadores.Abaixo apresentamos a linguagem não-lógica, a sintaxe e semântica de CGL.

Definição 4.9 Uma linguagem não-lógica de CGL é definido por !n,X",onde n é um número natural maior do que 0, que representa o número dejogadores, e X é um conjunto de símbolos para as conseqüências. Os jogadoressão identificados pelos números 1, 2, . . . , n.

A linguagem lógica de CGL é definida em duas partes: uma linguagemde conseqüências como definido abaixo na gramática "o, que expressa aspropriedades das conseqüências. Por exemplo, a fórmula ¬w1 significa que aconseqüência não é w1; e uma linguagem de cooperação como definido abaixona gramática "c, que expressa as propriedades das relações de preferênciasdos jogadores sobre as conseqüências e, também, as propriedades das possíveiscooperações entre as coalizões. A fórmula w1 2i w2 significa que o jogador i

prefere w1 sobre w2 ou ele é indiferente, enquanto que a fórmula !!I""$ significaque a coalizão I pode escolher uma conseqüência tal que $ vale.

Definição 4.10 Sejam !n,X" uma linguagem não-lógica de CGL, w, w$ # X,i ) n e I $ {1, 2, ..., n} um conjunto de jogadores. A linguagem lógica deCGL é gerada pela seguinte BNF:

"o ::= w | (¬"o) | ("o % "o)

"c ::= (w 2i w$) | !!I"""o | (¬"c) | ("c % "c)

Os operadores &,' e 3i são definidos de forma usual.As fórmulas de CGL são interpretados sobre jogos de coalizão sem

utilidades transferíveis # = !N, X, v, (2i)" como definido na seção 2.7. Na

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 4. Lógicas para Jogos 88

definição da semântica de CGL estamos utilizando uma relação bijetora entreo conjunto de conseqüências X do jogo # e os símbolos X da linguagem não-lógica de CGL, na qual uma conseqüência w do jogo # é representada por umsímbolo w da linguagem não-lógica de CGL. O mesmo ocorre para os jogadorese o conjunto de coalizões.

Definição 4.11 Sejam # = !N, X, v, (2i)" um jogo de coalizão sem utilidadestransferíveis e !N,X" uma linguagem não-lógica de CGL para #. A definiçãode satisfação em CGL é apresentada da seguinte forma2:

1. A definição de satisfação de uma fórmula $ da linguagem definida pelagramática "o na conseqüência w do jogo # é como segue.

– # |=w w$ +, w = w$

– # |=w ¬$ +, NÃO # |=w $

– # |=w $ % % +, SE # |=w $ ENTÃO # |=w %

2. A definição de satisfação de uma fórmula $ da linguagem definida pelagramática "c no jogo # é como segue.

– # |= (w 2i w$) +, w 2i w$

– # |= ¬$ +, NÃO # |= $

– # |= $ % % +, SE # |= $ ENTÃO # |= %

– # |= !!I""$ +, 4w # v(I) tal que # |=w $

Uma axiomatização correta e completa de CGL é apresentada em(ÅWvdH06). A verificação de modelos é P-Completo enquanto que a satis-fatibilidade é NP-Completo, veja (ÅWvdH06).

Apesar do operador modal !!I"" de CGL parecer sintaticamente como operador modal !!I"" de ATL seus significados são bem distintos, umavez que CGL trata com jogos de coalizões e ATL com jogos extensivos.Uma questão interessante é saber se dado um jogo de coalizão existe umamapeamento em jogos concorrentes tal que as verdades sobre um jogo decoalizão são preservadas via mapeamento nas verdades do jogo concorrente.Em (ÅWvdH06) a lógica CL, que é um fragmento de ATL, e a lógica CGLsão utilizadas para demonstrar que isto não é verdadeiro para qualquer jogode coalizão.

Abaixo é apresentado uma fórmula para caracterizar quando uma conse-qüência w está no conceito de solução core. Para definirmos a fórmula abaixo

2Estamos utilizando um abuso de notação na medida em que temos uma relação bijetoraentre os símbolos para os jogadores/conseqüências e os jogadores/conseqüências no jogo.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 4. Lógicas para Jogos 89

é necessário que o conjunto de conseqüências seja finito. Desta forma, não po-demos por exemplo representar o conceito de core para jogos de coalizão comutilidades transferíveis, uma vez que o conjunto do mesmo é infinito.

Core(w) ::= !!N""w & ¬"

+

I%N

"+

w$!X

"(!!I""w$) &

#

i!I

(w$ 3i w)

$$$

A fórmula abaixo então significa que o core é não-vazio.

CNE ::=+

w!X

Core(w)

A proposição abaixo pode ser encontrada em (ÅWvdH06).

Proposição 4.12 O core de # é não-vazio +, # |= CNE.

É fácil verificar que o tamanho da fórmula acima é limitado em O(2|N |*|X|* |N |). Assim, verificar a existência de core é O(2|N |* |X|2* |N |) conside-rando que as operações !!I""w e 3i são feitas em O(1). Para exemplificarmoscomo esta fórmula se tornaria enorme mesmo em exemplos simples como oexemplo 2.31 que tem apenas 5 conseqüências e apenas 2 jogadores, a fórmulade Core(w) é apresentada abaixo. Assim, a fórmula CNE seria ainda cincovezes o tamanho da fórmula abaixo!!!

%

&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&'

!!N""w & ¬

%

&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&'

%

&&&&&&&&&'

,!!{1}""w1 & (w1 31 w)

-

',!!{1}""w2 & (w2 31 w)

-

',!!{1}""w3 & (w3 31 w)

-

',!!{1}""w4 & (w4 31 w)

-

',!!{1}""w5 & (w5 31 w)

-

(

)))))))))*

'

%

&&&&&&&&&'

,!!{2}""w1 & (w1 32 w)

-

',!!{2}""w2 & (w2 32 w)

-

',!!{2}""w3 & (w3 32 w)

-

',!!{2}""w4 & (w4 32 w)

-

',!!{2}""w5 & (w5 32 w)

-

(

)))))))))*

'

%

&&&&&&&&&'

,!!{1, 2}""w1 & (w1 31 w) & (w1 32 w)

-

',!!{1, 2}""w2 & (w2 31 w) & (w2 32 w)

-

',!!{1, 2}""w3 & (w3 31 w) & (w3 32 w)

-

',!!{1, 2}""w4 & (w4 31 w) & (w4 32 w)

-

',!!{1, 2}""w5 & (w5 31 w) & (w5 32 w)

-

(

)))))))))*

(

))))))))))))))))))))))))))))))))))))))))*

(

))))))))))))))))))))))))))))))))))))))))*

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

5Game Analysis Logic (GAL)

Modelamos e analisamos jogos utilizando uma lógica poli-sortida modalde primeira-ordem, chamada de Game Analysis Logic (GAL), baseada nalógica Computation Tree Logic (CTL) (CE81) (veja a seção 3.1 para maioresdetalhes sobre CTL). Um jogo é um modelo de GAL, chamado de estrutura deGAL, e uma análise é uma fórmula de GAL. Utilizaremos o termo análise aoinvés de solução, pois muitas vezes estaremos interessados em descrever umapropriedade sobre um jogo, sem que a mesma tenha relação com o conceito deracionalidade da Teoria dos Jogos.

Os jogos são descritos através de um conjunto de estados SE e umconjunto de ações CA. Para tal descrição, utilizamos uma linguagem deprimeira-ordem, cuja interpretação de um símbolo funcional ou predicativopode variar de acordo com o estado. Os estados representam as possíveisevoluções de um jogo, enquanto que as ações determinam o encadeamentodestas evoluções.

Um estado é definido por uma interpretação de primeira-ordem e umconjunto de jogadores, onde: 1 - A interpretação de primeira-ordem é utilizadapara representar as escolhas e as conseqüências das decisões dos jogadores.Por exemplo, um símbolo constante (de sort lista), cuja interpretação variaentre os estados, pode ser usado para designar o histórico dos jogadores atéum dado estado. 2- O conjunto dos jogadores representa os jogadores quedevem simultaneamente tomar uma decisão no estado1. Por exemplo, jogoscomo leilões, onde todos os jogadores podem submeter lances a cada instante,podem ser modelados, bem como jogos como xadrez, onde apenas um jogadorpode tomar decisões a cada momento. Podemos ainda definir estados ondenenhum dos jogadores pode tomar decisões. Isto pode ser interpretado comosituações onde o ambiente evolui desconsiderando as possíveis interferênciasdos jogadores.

Uma ação é simplesmente uma relação entre dois estados e1 e e2, na qualtodos os jogadores no estado e1 concordaram em mover para o estado e2. Esta

1Note que o conjunto dos jogadores em cada estado deve ser um subconjunto dos jogadoresdo jogo.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 5. Game Analysis Logic (GAL) 91

é uma visão extensional de como os jogadores tomam uma ação conjunta. Éclaro que isto pode ter uma visão intencional e pode ser expresso através deuma linguagem formal.

Apresentamos abaixo a definição formal de GAL, e como usual, chama-mos os conjuntos dos sorts, dos símbolos predicativos, dos símbolos funcionais,e dos jogadores como a linguagem não-lógica de GAL em contraste com alinguagem lógica que contém os quantificadores e conectivos.

Definição 5.1 Uma linguagem não-lógica de GAL é definida por!S, F, P, N", onde:

1. S é um conjunto não-vazio, chamado de conjunto dos sorts.

2. F é um conjunto, chamado de conjunto dos símbolos funcionais, tal que,para cada símbolo funcional é associado uma assinatura: w # s, ondew $ S! e s $ S.

Um símbolo funcional f com assinatura w # s é usualmente denotadopor: f : w # s. Se w é vazio, então f é chamado de símbolo constante.

3. P é um conjunto, chamado de conjunto dos símbolos predicativos, talque, para cada símbolo predicativo é associado uma assinatura: w, ondew $ S!. p : w denota o símbolo predicativo p com assinatura w. Se w évazio, então p é chamado de símbolo proposicional, ou proposição.

4. N é um conjunto, chamado de conjunto dos jogadores.

Definição 5.2 Seja !S, F, P, N" uma linguagem não-lógica de GAL. UmaEstrutura de GAL para esta linguagem não-lógica é definida por G =

!SE,SEo, CA, (Ds), (Ff,e), (Pp,e), (Ne)", onde:

1. SE é um conjunto não-vazio, chamado de conjunto dos estados.

2. SEo é um conjunto de estados iniciais, onde SEo % SE.

3. Para cada estado e $ SE, Ne é um subconjunto de N , que são osjogadores que tomam decisões no estado e.

4. CA % SE&SE, chamado de conjunto de ações do jogo, no qual se existepelo menos um jogador em um estado e1 (i.e. Ne1 '= (), então existe umestado e2 tal que !e1, e2" $ CA2.

2Esta relação não é total como no caso de CTL. Assim, em GAL podemos representarjogos que terminam.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 5. Game Analysis Logic (GAL) 92

5. Para cada sort s $ S, Ds é um conjunto não-vazio, chamado de domíniodo sort s3.

6. Para cada símbolo funcional f : w # s de F e para cada estado e $ SE,

Ff,e é uma função tal que Ff,e :

! "sk"w

Dsk

## Ds.

7. Para cada símbolo predicativo p : w de P e para cada estado e $ SE,

Pp,e é uma relação tal que Pp,e %! "

sk"wDsk

#.

Uma estrutura de GAL é de modelo finito se o conjunto de estadosSE e os domínios (Ds) são finitos. Caso contrário, ela é infinita.

Se os símbolos funcionais ou predicativos são interpretados da mesmaforma para todos os estados, então chamamos de interpretação rígida.

Para ilustrarmos os conceitos acima definidos, utilizaremos o seguinteexemplo.

Exemplo 5.3 (Jogo do Casamento) Um homem pode propor casamentoa uma mulher. Se ele não propor, então ambos ficarão solteiros. Caso eleproponha, a mulher pode aceitar ou recusar. Se ela recusar, ambos ficarãosolteiros. Contudo, se ela aceitar, o casal deve decidir de forma conjunta seeles permanecerão casados ou se eles se separarão. Note que a decisão sobrea separação ocorre, usualmente, quando ambos concordam com a separação,entretanto, isso pode envolver um processo longo e pode até mesmo ser deforma litigiosa.

Modelamos este exemplo como uma estrutura de GAL, na qual o homeme a mulher são os jogadores, que serão representados por h e m. Outroponto claro neste exemplo é que cada jogador possui um estado civil (solteiro,separado e casado), utilizaremos os símbolos ech e ecm para denotar o estadocivil do homem e da mulher, respectivamente. Como vemos neste exemplo tantoo estado civil do homem como o da mulher podem ser alterados no evoluirdas ações tomadas por cada jogador. Formalmente, temos a linguagem não-lógica deste jogo definida por !{EstadoCivil}, {ech :# EstadoCivil, ecm :#EstadoCivil}, (, {h,m}".

Para descrevermos este exemplo como uma estrutura de GAL, devemosinterpretar a linguagem não-lógica de modo a refletir as possíveis evoluçõesdeste jogo, bem como determinar quando e qual jogador deve tomar umadecisão. Dito isto, apresentamos abaixo a estrutura de GAL para este jogo.

3Em terminologia algébrica Ds é um carrier para o sort s.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 5. Game Analysis Logic (GAL) 93

Exemplo 5.4 Uma estrutura de GAL para o jogo definido noexemplo 5.3 com linguagem não-lógica !{EstadoCivil}, {ech :#EstadoCivil, ecm :# EstadoCivil}, (, {h,m}" é definida por!SE,SEo, CA, EstadoCivil, (eche , ecme)e"SE, (, (Ne)e"SE", onde

– SE = {e0, e1, e2, e3, e4, e5}.

– SEo = {e0}.

– CA = {!e0, e1", !e0, e2", !e1, e3", !e1, e4", !e3, e3", !e3, e4"}.

– EstadoCivil = {solteiro, casado, separado}.

– eche0= solteiro, eche1

= solteiro, eche2= solteiro, eche3

= casado,eche4

= solteiro, eche5= separado.

– ecme0= solteiro, ecme1

= solteiro, ecme2= solteiro, ecme3

= casado,ecme4

= solteiro, ecme5= separado.

– Ne0 = {h}, Ne1 = {m}, Ne2 = {}, Ne3 = {h,m}, Ne4 = {}, Ne5 = {}.

Podemos apresentar uma estrutura de GAL (ou parte dela) através deuma figura da seguinte forma. Um estado é representado por uma elipse,que possui um rótulo logo abaixo para a identificação do estado em questão.Uma ação do jogo é representada através de uma seta entre dois estados.Em geral, dentro de cada elipse denotamos a interpretação de primeira-ordempara aquele estado. Em particular, a interpretação de um símbolo constante s

é, usualmente, apresentada na forma s = d, onde d é o elemento do domíniodenotado pelo símbolo s no referido estado. O conjunto dos jogadores quedevem tomar decisões a cada estado é representado por um conjunto dentrode cada elipse. O domínio de cada sort é apresentado logo abaixo na figura.A figura 5.1 representa a estrutura de GAL apresentada no exemplo 5.4, ondetemos os seis estados representados por seis elipses, e as ações são representadaspelas seis setas entre os estados. Por exemplo, o estado e0 é representado pelaprimeira elipse de cima para baixo, cujos símbolos constantes ech e ecm sãointerpretados de acordo com a igualdade, ou seja, eles denotam os elementosdo domínio solteiro e solteiro, respectivamente. O conjunto {h} representadodentro desta elipse denota que apenas o homem deverá tomar uma ação, eneste caso, ele possui duas ações, que são representadas pelas duas setas quevão para as duas elipses, representando os estados e1 e e2.

Um caminho !(e) é uma seqüência (finita ou infinita) de estados, que podemser alcançados a partir do estado e através do conjunto de ações do jogo,e tem as seguintes propriedades: 1 - O primeiro elemento da seqüência é o

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 5. Game Analysis Logic (GAL) 94

!"

#$

ech = solteiroecm = solteiro

{h} e0!!!"

###$!"

#$

ech = solteiroecm = solteiro

{m} e1!!!"

###$

!"

#$

ech = solteiroecm = solteiro

{} e2

!"

#$

ech = casadoecm = casado

{h,m} e3

%

% !"

#$

ech = solteiroecm = solteiro

{} e4

!"

#$

ech = separadoecm = separado

{} e5

EstadoCivil = {solteiro, casado, separado}

Figura 5.1: Estrutura de GAL para o jogo do casamento.

estado e; 2- Se a seqüência é infinita !(e) = (ek)k"N, então )k * 0 temos que!ek, ek+1" $ CA; 3 - Se a seqüência é finita !(e) = (e0, . . . , el), então )k talque 0 + k < l temos que !ek, ek+1" $ CA, e não existe um estado e# tal que!el, e#" $ CA. O comportamento do jogo é caracterizado pelos seus caminhos(finitos e infinitos). Caminhos finitos terminam em um estado onde o jogoestá terminado, enquanto caminhos infinitos representam que o jogo nuncaterminará.

No exemplo 5.4, temos como caminhos a partir do estado e0 as seqüênciasfinitas: e0e2; e0e1e4; e0e1ek

3e5, com k finito e maior do que zero. E, apenas umcaminho infinito e0e1e3e3e3 . . .. Note que e0e1 não é um caminho a partir dee0.

Abaixo continuamos as definições formais de GAL, apresentando asintaxe, que define o conjunto de fórmulas de GAL, e a semântica, que provêsignificado as fórmulas em estruturas de GAL.

Definição 5.5 Seja !S, F, P,N" uma linguagem não-lógica de GAL. Oconjunto de termos de sort s (!s) é indutivamente definido como segue:

– Se xs é uma variável de sort s, então xs é um termo de !s;

– Se f é um símbolo functional de sort s, i.e., f : s1...sn # s $F , e t1, ..., tn são termos de sorts !s1 , ..., !sn, respectivamente, entãof(t1, ..., tn) é um termo de !s.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 5. Game Analysis Logic (GAL) 95

Definição 5.6 (Sintaxe de GAL) Seja !S, F, P, N" uma linguagem não-lógica, e t1, ..., tn termos de sorts s1, ..., sn, e t#1 um termo de sort s1, e P : s1...sn

um símbolo predicativo, e i um jogador, e x uma variável de sort s (ou de jo-gador). A linguagem lógica de GAL é gerada pela seguinte BNF:

" ::= , | i | P (t1, ..., tn) | (t1 - t#1) | (¬") | (" # ") | )x"

| [AX]" |E("U ") |A("U ")

As modalidades são similares as da lógica CTL e podem ser interpretadascomo segue.

1. [AX]" significa ‘para todo caminho no próximo estado "’.

2. E("U#) significa ‘existe um caminho " até que #’.

3. A("U#) significa ‘para todo caminho " até que #’.

As constantes lógicas .,/,0,1x, [AF ], [EF ], [AG], [EG] e [EX] são de-finidas pelas seguintes usuais abreviações.

• " / # 23 ¬(" # ¬#) • " . # 23 (¬" # #) • 0 23 ¬,• [EX]" 23 ¬[AX]¬" • [AF ]" 23 A(, U ") • [EF ]" 23 E(, U ")

• [AG]" 23 ¬E(, U ¬") • [EG]" 23 ¬A(, U ¬") • 1x"(x) 23 ¬)x¬"(x)

Os outros operadores modais podem ser lidos da seguinte forma.

1. [EX]" significa ‘existe um caminho tal que no próximo estado "’.

2. [EF ]" significa ‘existe um caminho tal que no futuro "’.

3. [AF ]" significa ‘para todo caminho no futuro "’.

4. [EG]" significa ‘existe um caminho onde sempre "’.

5. [AG]" significa ‘para todo caminho sempre "’.

Para apresentarmos a semântica de GAL, definimos abaixo o conceito defunção de valoração de sort.

Definição 5.7 Seja G = !SE,SEo, CA, (Ds), (Ff,e), (Pp,e), (Ne)" uma estru-tura de GAL, onde s $ S, f $ F, p $ P e e $ SE. Uma função de valo-ração para o sort s neste modelo G é um mapeamento $s que atribui paracada variável livre xs de sort s algum membro de $s(xs) de domínio Ds destaestrutura.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 5. Game Analysis Logic (GAL) 96

Como usamos termos, estendemos toda função de valoração $s para umafunção $̄s de estado e termo para elemento de domínio do sort s. Quando asfunções de valorações não forem necessárias, nós as omitiremos.

Definição 5.8 Seja !s um conjunto de termos de sort s, Ds o domínio dosort s, $s uma função de valoração de s, uma função $̄s : SE & !s # Ds édefinido como segue:

1. para cada variável xs de sort s, $̄s(e, xs) = $s(xs).

2. para cada símbolo funcional f : s1...sn # s de sort s (onde t1 $!s1 , ..., tn $ !sn) , $̄s(e, f(t1, ..., tn)) = Ff,e($̄s1(e, t1), ..., $̄sn(e, tn)).

Definição 5.9 (Semântica de GAL) Seja G = !SE,SEo, CA, (Ds),

(Ff,e), (Pp,e), (Ne)" uma estrutura de GAL, ($s) funções de valoração, e" uma fórmula de GAL, onde s $ S, f $ F, p $ P e e $ SE. EscrevemosG, ($s) |=e " para indicar que o estado e satisfaz a fórmula " na estrutura Gcom funções de valoração ($s). A definição formal de satisfação |= é definidacomo segue:

– G, ($s) |=e ,– G, ($s) |=e i 23 i $ Ne

– G, ($s) |=e p(ts11 , ..., tsn

n ) 23 !$̄s1(e, ts11 ), ..., $̄sn(e, tsn

n )" $ Pp,e

– G, ($s) |=e (ts1 - ts2) 23 $̄s(e, ts1) = $̄s(e, ts2)

– G, ($s) |=e ¬" 23 NÃO G, ($s) |=e "

– G, ($s) |=e (" # #) 23 SE G, ($s) |=e " ENTÃO G, ($s) |=e #

– G, ($s) |=e [AX]" 23 )e# $ SE tal que !e, e#" $ CA vale G, ($s) |=e! "

(veja a figura 5.2.a).

– G, ($s) |=e E(" U #) 23 existe um caminho finito (ou infinito) !(e) =

(e0e1e2...ei) e existe um k * 0 tal que G, ($s) |=ek# e para todo 0 + j < k

vale que G, ($s) |=ej " (veja a figura 5.2.b).

– G, ($s) |=e A(" U #) 23 para todos os caminhos finitos (e infinitos)!(e) = (e0e1e2...ei), existe um k * 0 tal que G, ($s) |=ek

# e para todo0 + j < k vale que G, ($s) |=ej " (veja a figura 5.2.c).

– G, ($s,$sk) |=e )xsk

" 23 para todo d $ Dsktal que G, ($s,$sk

(xsk|d)) |=e

", onde $sk(xsk

|d) é uma função que é exatamente como $skexceto por

uma coisa: No lugar da variável xskassume-se o valor d. Isto pode ser

expresso na seguinte equação:

$s(xsk|d)(y) =

$$s(y), se y '= xsk

d, se y = xsk

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 5. Game Analysis Logic (GAL) 97

...

...

...

...

...

...

...

...

...

...

...

...

(a) - [AX]" (b) - E(" U#) (c) - A(" U#)

Figura 5.2: Conectivos modais de GAL.

Quando uma fórmula " não for satisfeita no estado e de uma estrutura G comfunções de valorações ($s), escreveremos G, ($s) '|=e ".

Exemplificaremos as definições acima utilizando novamente a estruturaGcas do exemplo 5.4. Abaixo apresentaremos algumas fórmulas que são satis-feitas na estrutura Gcas para uma dada função de valoração $ em um estadode Gcas.

– Gcas,$ |=e0 ecm - v, onde $(v) = solteiro

– Gcas,$ |=e0 ecm - v, onde $(v) = solteiro

– Gcas,$ |=e3 ecm - v, onde $(v) = casado

– Gcas,$ |=e0 [EG]ecm - v, onde $(v) = solteiro.

– Gcas,$ |=e3 [AG](ecm - v . ecm - v2), onde $(v) = casado e $(v2) =

separado.

– Gcas,$ |=e0 [EF ][EG]ecm - v, onde $(v) = casado.

– Gcas,$ |=e0 [AG]ecm - ech

Uma fórmula " é dita verdadeira para uma estrutura G comfunções de valorações ($s) se, e somente se, para todo estado e $ SE valeG, ($s) |=e ". Escreveremos G, ($s) |= " para dizer que a fórmula " é verdadeirapara o modelo G com funções de valorações ($s). Como podemos verificar afórmula [AG]ech - ecm, que significa que o homem e a mulher sempre terão omesmo estado civil, é verdadeira para o modelo Gcas.

Uma fórmula " é dita satisfatível se, e somente se, existe uma estruturaG e existem funções de valorações ($s) tal que existe um estado e $ SE talque G, ($s) |=e ". Usualmente chama-se a estrutura G de modelo de ".

Por outro lado, dizemos que uma fórmula " é válida se, e somente se,para todas as estruturas G e para todas as funções de valorações ($s) temos

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 5. Game Analysis Logic (GAL) 98

que para todo estado e $ SE vale G, ($s) |=e ". Escreveremos |= " para dizerque a fórmula " é válida.

Dizemos que uma fórmula " é conseqüência lógica de um conjunto defórmulas # se, e somente se, para todas as estruturas G e para todas as funçõesde valorações ($s) se para toda fórmula # $ # vale que G, ($s) |= #, então valeque G, ($s) |= ".

Em (PMT02), é demonstrado que não existe um sistema dedutivo corretoe completo para a lógica CTL com sua extensão de primeira-ordem. A idéia detal resultado é semelhante à apresentada em (GHR94), na qual a aritméticapode ser definida em tal lógica. Como CTL de primeira-ordem pode ser definidoem GAL, concluímos que não existe um sistema correto e completo para GAL.Todavia, é possível definir um sistema correto e não-completo que seja capazde provar algumas propriedades interessantes de jogos, tal como a existênciade equilíbrio de Nash de estratégias mistas em jogo estratégico. Contudo, atéeste ponto do trabalho isto ainda não foi realizado.

5.1Propriedades de GAL

Nesta seção iremos apresentar propriedades gerais de GAL, e aindadiscutiremos como GAL se comporta em relação a algumas das dificuldadesusualmente encontradas em lógicas modais de primeira-ordem. Para maioresdetalhes sobre os problemas de lógicas modais de primeira-ordem veja (FM99).

Inicialmente, demonstraremos que sempre que pelo menos um jogadordeve tomar uma decisão, ele a tomará, ou seja, existe sempre um próximoestado.

|=! %

i"Ni

## [EX],

Prova. Sejam G uma estrutura de GAL qualquer e e um estado qualquer de G.

G |=e

! %i"N

i

#

Por definição de |= temos pelo menos um jogador no estado e, e peloitem 4 da definição de estrutura de GAL temos que existe um estado e1 talque !e, e1" $ CA. E como , é verdadeiro em todos os estados concluímos que

=3 [EX], !

5.1.1Quantificação De Re e De dicto

Uma das principais dificuldades de lógicas modais de primeira-ordem é ainteração entre os quantificadores e os operadores modais. Para exemplificar,

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 5. Game Analysis Logic (GAL) 99

considere um predicado Livre interpretado rigidamente. Para expressar apropriedade de que em algum dia todos os indivíduos serão livres, temos asseguintes possibilidades em GAL.

)x[EF ]Livre(x) (5-1)

[EF ])xLivre(x) (5-2)

A fórmula 5-1 significa que para cada indivíduo existe um futuro ondeele será livre. Note que isso não implica que os indivíduos serão livres simul-taneamente. Por outro lado, a fórmula 5-2 significa que existe um futuro ondetodos os indivíduos serão simultaneamente livres. Note que as fórmulas nãosão equivalentes, e como iremos mostrar a fórmula [EF ])xLivre(x) implicaem )x[EF ]Livre(x), mas não o contrário.

Quando o quantificador aparece na fórmula antes do operador modal,chamamos de quantificação De Re como no caso da fórmula 5-1. Por outrolado, quando a quantificação ocorre logo após o operador modal, chamamosde quantificação De Dicto, a exemplo da fórmula 5-2.

Abaixo apresentamos uma situação onde De Re não implica em De Dicto.

1x[AG]Presidente(x) (5-3)

[AG]1xPresidente(x) (5-4)

A fórmula 5-3 significa que existe uma pessoa que será sempre pre-sidente, enquanto que a fórmula 5-4 significa que sempre haverá um pre-sidente. Neste caso temos que a fórmula 1x[AG]Presidente(x) implica em[AG]1xPresidente(x), mas não o contrário.

As relações entre quantificações De Re e De Dicto para os conectivosmodais de GAL são apresentados a seguir. As provas são apresentadas noapêndice A.

Por simplicidade adotaremos que temos apenas um sort s. Seja G =

!SE,SEo, CA,Ds, (Ff,e), (Pp,e), (Ne)" uma estrutura de GAL com linguagemnão-lógica !{s}, F, P, N", e $s uma função de valoração de sort s, e "(x) e #(x)

fórmulas de GAL com a variável livre x de sort s, onde s $ S, f $ F, p $ P

e e $ SE.De re implica em De dicto

1. 1x[EX]"(x) # [EX]1x"(x)

2. 1x[AX]"(x) # [AX]1x"(x)

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 5. Game Analysis Logic (GAL) 100

3. 1x[EF ]"(x) # [EF ]1x"(x)

4. 1x[AF ]"(x) # [AF ]1x"(x)

5. 1x[EG]"(x) # [EG]1x"(x)

6. 1x[AG]"(x) # [AG]1x"(x)

7. 1xE("(x)U#(x)) # E(1x"(x)U1x#(x))

8. 1xA("(x)U#(x)) # A(1x"(x)U1x#(x))

9. )x[AX]"(x) # [AX])x"(x)

10. )x[AG]"(x) # [AG])x"(x)

De dicto implica em De re

1. [EX]1x"(x) # 1x[EX]"(x)

2. [EF ]1x"(x) # 1x[EF ]"(x)

3. [EX])x"(x) # )x[EX]"(x)

4. [AX])x"(x) # )x[AX]"(x)

5. [EF ])x"(x) # )x[EF ]"(x)

6. [AF ])x"(x) # )x[AF ]"(x)

7. [EG])x"(x) # )x[EG]"(x)

8. [AG])x"(x) # )x[AG]"(x)

9. E()x"(x)U)x#(x)) # )xE("(x)U#(x))

10. A()x"(x)U)x#(x)) # )xA("(x)U#(x))

Abaixo apresentamos as relações entre De Re e De Dicto que não sãoválidas em GAL. Para cada propriedade apresentamos um modelo. Estes mo-delos estão representados na figura 5.3, onde os estados são representados peloscírculos, que possuem a interpretação dos predicados. As setas representam asações do jogo. O domínio por sua vez, é apresentado pelo conjunto logo abaixoda estrutura. Dentro de cada estado tem-se a relação dos predicados tal que!a" $ P se, e somente se, temos dentro do circulo P (a).4 Por exemplo, na fi-gura 5.3.a temos dois estados s1 e s2, com apenas uma ação (uma seta entre osestados s1 e s2) e com domínio {a, b}. E ainda, temos que Ga,$s(x|a) |=s1 "(x)

e Ga,$s(x|b) '|=s1 "(x).4Vale a pena lembrar que P(a) não é uma fórmula, e sim uma notação para dizer que

!a" $ P em um estado.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 5. Game Analysis Logic (GAL) 101

1. [AX]1x"(x) # 1x[AX]"(x)

No modelo Gb da figura 5.3.b temos que Gb,$s '|=s1 [AX]1x"(x) #1x[AX]"(x). Note que Gb,$s(x|a) "s2 "(x), e por definição de |= temosGb "s2 1x"(x). De forma semelhante, temos Gb,$s "s3 1x"(x). Assim,por definição de |= temos que Gb,$s "s1 [AX]1x"(x). Note ainda queGb,$s(x|a) '|=s1 [AX]"(x) uma vez que em Gb,$s(x|a) '|=s3 "(x). De formaanáloga temos que Gb,$s(x|b) '|=s1 [AX]"(x). Assim, por definição de |=temos que Gb '|=s1 1x[AX]"(x).

2. )xE("(x)U#(x)) # E()x"(x)U)x#(x))

Na figura 5.3.a é apresentado uma estrutura de GAL que invalida estafórmula. Veja que no estado s1 a fórmula )xA("(x)U#(x)) é satisfeita,enquanto que a fórmula A()x"(x)U)x#(x)) não é, pois )x(#(x)) e)x("(x)) não são satisfeitas em s1.

3. )xA("(x)U#(x)) # A()x"(x)U)x#(x))

Note que o mesmo modelo apresentado na figura 5.3.a também invalidaestá fórmula por motivos semelhantes.

4. E(1x"(x)U1x#(x)) # 1xE("(x)U#(x))

No modelo Gc da figura 5.3.c temos que Gc,$s |=s1 E(1x"(x)U1x#(x)).Contudo, não existe um elemento do domínio (nem a e nem b) tal queGc,$s |=s1 1xE("(x)U#(x))

5. A(1x"(x)U1x#(x)) # 1xA("(x)U#(x)) Note que o mesmo modeloapresentado na figura 5.3.c também invalida está fórmula por motivossemelhantes.

6. )x[EX]"(x) # [EX])x"(x) No modelo Gb da figura 5.3.b temos queGb,$s |=s1 )x[EX]"(x). Contudo, não existe um estado s acessível apartir de s1 (i.e !s1, s" $ CA) tal que Gb,$s |=s )x"(x).

7. )x[EF ]"(x) # [EF ])x"(x) Por razões semelhantes o modelo Gb dafigura 5.3.b invalida esta fórmula no estado s1.

8. [AF ]1x"(x) # 1x[AF ]"(x) O modelo Gb da figura 5.3.b invalida estafórmula no estado s1.

9. [EG]1x"(x) # 1x[EG]"(x) O modelo Gd da figura 5.3.d invalida estafórmula no estado s1.

10. [AG]1x"(x) # 1x[AG]"(x) O modelo Gc da figura 5.3.c invalida estafórmula no estado s1.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 5. Game Analysis Logic (GAL) 102

11. )x[AF ]"(x) # [AF ])x"(x) O modelo Gb da figura 5.3.b invalida estafórmula no estado s1.

12. )x[EG]"(x) # [EG])x"(x) O modelo Gd da figura 5.3.d invalida estafórmula no estado s1.

"$!#

%

"$!#

s1

s2

!(a)"(b)

"(a)

D = {a, b}

(a) - Ga

"$!#

"$!#

"$!#

&&

&'

((

()

!(a) !(b)

s1

s2 s3

D = {a, b}

(b) - Gb

"$!#

%

"$!#

s1

s2

!(a)

"(b)

D = {a, b}

(c) - Gc

"$!#

!(a)!(b)

"$!#

"$!#

&&

&'

((

()

!(a) !(b)

s1

s2 s3

D = {a, b}

(b) - Gd

Figura 5.3: Estruturas de GAL

A figura 5.4 resume as implicações entre De Re e De Dicto. Observe quea quantificação existencial da implicação entre De Re e De Dicto é semprepossível, e que a quantificação universal da implicação entre De Dicto e De Reé também sempre possível.

5.1.2Interpretação de Termos

De forma semelhante ao problema da interação entre os quantificadorese os operadores modais, a interpretação de termos também é problemática emcontextos modais. Para vermos isto, considere o seguinte exemplo clássico.

O número de planetas é necessariamente ímpar. (5-5)

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 5. Game Analysis Logic (GAL) 103

De Re # De Dicto De Dicto # De Re De Re # De Dicto De Dicto # De Re1x 1x )x )x

[EX] Sim Sim Não Sim[AX] Sim Não Sim Sim[EF] Sim Sim Não Sim[AF] Sim Não Não Sim[EG] Sim Não Não Sim[AG] Sim Não Sim SimEU Sim Não Não SimAU Sim Não Não Sim

Figura 5.4: Relação entre De Re e De Dicto em GAL

O exemplo acima pode ter diferentes leituras de acordo com a interpretaçãoDe Re ou De Dicto. Seja c um símbolo constante para representar o número deplanetas e I : N um símbolo predicativo que é interpretado como o predicadoímpar. A fórmula que expressa 5-5 em GAL é a seguinte.

[AG]I(c) (5-6)

Até recentemente o número de planetas era igual a 9. Na leitura De Re, temosque o número 9 é sempre ímpar. O que de fato é verdade. Por outro lado, aleitura De Dicto diz que o número designado pela interpretação do símbolo c

(o número de planetas em cada possível mundo) é sempre ímpar. Isto não éverdade. Atualmente, o número de planetas foi reduzido para 8, pois Plutãonão é mais considerado um planeta.

Como vemos neste exemplo, a interpretação dos termos de acordo comDe Re e De Dicto tem diferentes significados. Em (FM99), um mecanismo deescopo é utilizado no contexto de lógicas modais de primeira-ordem para tratardeste problema. Vale a pena ressaltar que este problema é ainda mais acentuadocom lógicas modais com domínio variável, devido a falta de designação.

Em GAL optamos por uma interpretação De Dicto dos termos, i.e., ainterpretação ocorre “após” a interpretação dos operadores modais. Por outrolado, gostaríamos de ressaltar que, em alguns casos particulares, podemossimular a interpretação De Re utilizando uma quantificação existencial DeRe. A fórmula abaixo exemplifica esta simulação para o exemplo apresentadoacima.

1x(x = c / ([AG]"(x)))

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 5. Game Analysis Logic (GAL) 104

5.2Propriedades de alguns tipos de jogos

Nesta seção iremos apresentar como podemos expressar algumas proprie-dades de tipos de jogos, tais como: jogos simultâneos para todos os jogadores;jogos com alternância dos jogadores; jogos com horizonte finito.

Um jogo onde todos os jogadores tomam decisões de forma simultâneatem a seguinte propriedade.

[EX], #&

'

i"N

i

(

Podemos expressar através de fórmulas de GAL jogos onde há alternânciaentre as jogadas dos diversos jogadores. Antes de generalizarmos, apresentare-mos uma versão simplificada para jogos com dois jogadores, tais como o jogoda velha e xadrez. Considere dois jogadores, representados por 1 e 2, e que# represente o ‘ou exclusivo’ (conectivo xor). Um jogo de dois jogadores comalternância é definido pela seguinte fórmula.

(1 # 2) / (1 # [AX]2) / (2 # [AX]1)

Um jogo com alternância entre n-jogadores é definido através da seguintefórmula.

(1 # 2 # 3 . . . # n) /&

n$1'

i=1

(i # [AX]i + 1)

(/ (n # [AX]1)

Jogos limitados com um número k máximo de ações seguidas (cada estadotem no máximo k sucessores5) são definidos da seguinte forma6:

&&k)

i=1

[EX]i,(/ ¬[EX]k+1,

(# ¬[EX],

Para um jogo com apenas duas jogadas temos a seguinte fórmula.

(([EX], . [EX][EX],) / ¬[EX][EX][EX],) # ¬[EX],5Note que k pode ser 0, ou seja, jogo sem nenhum próximo estado.6Aqui estamos nos referindo ao número máximo de ações que podem ser tomadas a partir

de um estado, e não ao número de possíveis ações de um jogo.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 5. Game Analysis Logic (GAL) 105

Jogos com horizontes finitos7 são definidos por

[AF ](¬[EX],)

De forma semelhante ao problema da não definibilidade de modelos finitosem lógica de primeira-ordem, podemos demonstrar que não se consegue definiruma propriedade que represente um jogo ter um número finito arbitrário deações. Daí, temos que também não conseguimos definir quando os jogos sãoinfinitos.

5.3Verificação de Modelos em GAL

Nesta seção apresentamos um algoritmo para um verificador de modelospara GAL. Na seção 5.3.1, declaramos o problema de verificação de modelospara GAL, e apresentamos um algoritmo. Na seção 5.3.2 apresentamos oprotótipo que foi desenvolvido como um framework em Java, e apresentamosum exemplo simples de como utilizar o framework para definir e analisar umjogo.

5.3.1Algoritmo para Verificação de Modelos em GAL

Na seqüência, declaramos o problema da verificação de modelos paraGAL, e apresentamos um algoritmo para a verificação de modelos, onderestringimos os jogos a modelos finitos8, que utilizam funções e predicadosdecidíveis.

Sejam G = !SE,SEo, CA, (Ds), (Ff,e), (Pp,e), (Ne)" uma estrutura deGAL de modelo finito com linguagem não-lógica !S, F, P, N", e ($s) funçõesde valoração, e " uma fórmula de GAL. O problema da verificação de modelospara GAL é encontrar o conjunto de estados que satisfazem a fórmula ".

{e $ SE | G, ($s) |=e "}

O algoritmo para solucionar o problema da verificação de modelos usauma representação explícita da estrutura de GAL como um grafo rotulado edirecionado. Os nós representam os estados SE, os arcos no grafo provêem oconjunto de ações CA, e os rótulos associados a cada nó descrevem o conjunto

7Um jogo é dito de horizonte finito se o maior caminho do jogo é finito, i.e., todos oscaminhos são finitos. Note que podemos ter a partir de um estado um número infinito depróximos estados.

8Lembre-se que mesmo em modelos finitos podemos ter caminhos infinitos, isto é, ocomportamento de um jogo pode ser infinito.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 5. Game Analysis Logic (GAL) 106

dos jogadores e a interpretação de primeira-ordem. O algoritmo também utilizaas seguintes funções D : S # Ds, N : SE # Ne, F : F & SE # Ff,e eP : P & SE # Pp,e com a finalidade de prover uma representação implícitados domínios (Ds), do conjunto dos jogadores Ne, das funções (Ff,e) e dasrelações (Pp,e), respectivamente. Desta forma, estas funções só serão avaliadassob demanda.

O algoritmo é similar ao algoritmo da verificação de modelos de CTL(CGP99) (veja a seção 3.2.1), e opera rotulando cada estado e $ SE como conjunto de label(e) de sub-fórmulas de ", que são verdadeiras em e.Inicialmente, o algoritmo utiliza as funções de valorações para atribuir àsvariáveis livres elementos dos domínios dos sorts (veja o algoritmo 7). A partirdaí, o algoritmo inicializa o conjunto de rótulos de cada estado label(e) comovazio9, e então vai por uma série de passos (o número de operadores em "). Acada passo sub-fórmulas com k 4 1 operadores são processadas. Quando umafórmula é processada, a mesma é adicionada ao label(e) do estado e se ela éverdadeira. Assim, G, ($s) |=e " 23 " $ label(e).

Como as fórmulas de GAL são representadas em termos de i, P (t1, ..., tn),(t1-t#1), (¬"), ("#"), 1x", [AX]", E("U "), A("U "), é suficiente apresen-tar estes casos. Os casos (¬"), ("#"), [AX]", E("U ") e A("U ") são simi-lares ao algoritmo de CTL (veja a seção 3.2.1 para maiores detalhes). Abaixomostramos os algoritmos dos outros procedimentos. Vale relembrar que paragarantir a terminação do algoritmo é necessário que as funções e predicadossejam decidíveis. Utilizamos a notação $̄s1(e, t

s11 ) como a função que interpreta

o termo ts11 no estado e, e tomamos sua complexidade como um limite superior

na implementação de $̄s1 levando em conta a interpretação em todos os esta-dos. Referimos a este limite superior como |$̄s1(e, t

s11 )|. Utilizamos a notação

"[x 5 d] como a função que substitui todas as ocorrências de x por d em ".

– Caso ($s) |= ": O procedimento Sigma (veja o algoritmo 7) substituitodas as variáveis livres por elementos de acordo com as funções devalorações ($s) na fórmula ".

Algoritimo 7 procedure Sigma(($s),")for all s $ S do

for all free variable of sort s xs do" := "[xs 5 $(xs)]

end forend for

9O algoritmo de verificação de modelos de CTL começa com o conjunto de label(e)como o conjunto de proposições verdadeiras em e. No nosso algoritmo, nós só avaliamos ospredicados e funções sob demanda.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 5. Game Analysis Logic (GAL) 107

– Caso i: O procedimento verifyPlayer (veja o algoritmo 8) rotula todosos estados e $ SE com o jogador i se o jogador i pertence ao conjuntode jogadores no estado e. Este procedimento requer O(|SE|).

Algoritimo 8 procedure verifyPlayer(i)for all e $ SE do

if i $ N (e) thenlabel(e) := label(e) 6 {i}

end ifend for

– Caso p(ts11 , ..., tsn

n ): O procedimento verifyPredicate (veja o algoritmo 9)rotula todos os estados e $ SE no qual a interpretação do predicadop com os termos interpretados ts1

1 , ..., tsnn em e é verdadeiro em e. Este

procedimento requer O((|$̄s1(e, ts11 )|+ ... + |$̄sn(e, tsn

n )|)& |SE|). 10

Algoritimo 9 procedure verifyPredicate(p(ts11 , ..., tsn

n ))for all e $ SE do

if !$̄s1(e, ts11 ), ..., $̄sn(e, tsn

n )" $ P(p, e) thenlabel(e) := label(e) 6 {p(ts1

1 , ..., tsnn )}

end ifend for

– Caso ts11 -ts1

2 : O procedimento verifyEquality (veja o algoritmo 10) rotulatodos os estados e $ SE no qual a interpretação dos termos ts1

1 e ts12 são

iguais. Aqui utilizamos novamente a notação $̄s1(e, ts11 ), e a complexidade

é O((|$̄s1(e, ts11 )|+ |$̄sn(e, ts1

2 )|)& |SE|).

Algoritimo 10 procedure verifyEquality(ts11 -ts1

2 )for all e $ SE do

if $̄s1(e, ts11 ) = $̄s1(e, t

s12 ) then

label(e) := label(e) 6 {ts11 -ts1

2 }end if

end for

– Caso 1xsk!: O procedimento verifyExists (veja o algoritmo 11) rotulatodos os estados e $ SE, onde a fórmula " com todas as ocorrências davariável xsk

substituída por pelo menos um dos elementos do domínio dosort sk é verdadeiro. Este procedimento requer O(|Dsk

|& |SE|).

Assim, a complexidade algorítmica é relacionada com: 1- O tamanho dosdomínios; 2- O tamanho do conjunto dos estados; 3- O tamanho do conjunto

10Note que todas as avaliações dos termos e predicados são feitos em todos os estados esuas complexidades podem não ser polinomiais.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 5. Game Analysis Logic (GAL) 108

Algoritimo 11 procedure verifyExists(1xsk")

for all d $ D(sk) doT := {e | "[xsk

5 d] $ label(e)}for all e $ T do

if 1xsk" '$ label(e) then

label(e) := label(e) 6 {1xsk"}

end ifend for

end for

das ações; 4- A complexidade das funções e predicados em cada estado; 5- Otamanho da fórmula.

Consideramos abaixo uma versão simplificada de GAL com o intuito deuma apresentação mais simples da complexidade do algoritmo. A linguagemnão-lógica tem apenas um sort D e apenas um predicado p : D. Seja GS umaestrutura de GAL finita, onde: 1- O predicado p é interpretado rigidamente esua complexidade é O(p) ;2- O tamanho do conjunto do domínio de D é |D|; 3-O tamanho do conjunto de estados é |SE|; 4- O tamanho do conjunto de açõesé |CA|. Seja " uma fórmula de GAL para esta linguagem, onde "T e "D sãoos números de conectivos e de quantificadores na fórmula ", respectivamente.A complexidade algorítmica para verificar " em GS é

O(|D|!D & |"T |& ((|SE|&O(p)) + |CA|))

5.3.2Game Analysis Logic Verifier (GALV)

Desenvolvemos um verificador de modelos para GAL, chamado de GameAnalysis Logic Verifier (GALV), conforme o algoritmo descrito na seção an-terior. Optamos por desenvolver o GALV como um framework na linguagemJava por acreditarmos que assim, teríamos uma maior facilidade no desenvol-vimento de aplicações para jogos, podendo utilizar as diversas bibliotecas exis-tente para Java. O protótipo está disponível no sítio http://www.tecmf.inf.puc-rio.br/DaviRomero. Diversos exemplos que são apresentados neste trabalho fo-ram implementados no GALV, discutiremos estes exemplos em mais detalhesno capítulo 8.

A tela principal do GALV é apresentada abaixo. Nesta tela, o jogo davelha, onde todas as possíveis combinações das ações do jogo são consideradas,é inicializado no GALV. A propriedade [AF ](WinX . Draw), expressandoque o jogador ‘x’ sempre vencerá ou empatará, é verificada automaticamentede forma bem eficiente (apenas 0.32 segundo). Esta propriedade é falsa para

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 5. Game Analysis Logic (GAL) 109

este jogo, uma vez que existe um caminho, onde o jogador ‘o’ pode ganhar.A ferramenta pode gerar um contra-exemplo para esta fórmula, isto é, umcaminho que leva o jogador ‘o’ à vitória.

Figura 5.5: Tela principal do GALV com o exemplo do jogo da velha.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

6Teoria dos Jogos em GAL

Neste capítulo, relacionaremos os modelos da Teoria dos Jogos às estrutu-ras de GAL, e os conceitos de soluções às fórmulas de GAL. Apesar da maioriados conceitos da Teoria dos Jogos poder ser modelada utilizando apenas ascaracterísticas de primeira-ordem de GAL, optamos por representar as conse-qüências das ações tomadas em cada tipo interação através de estados. Assim,por exemplo, em jogos estratégicos, temos que cada perfil de ações é repre-sentado por um estado. Para referenciarmos e denotarmos as ações tomadas,utilizaremos símbolos (ai :! Ai), um para cada jogador i " N , que têm suasinterpretações variando de acordo com o perfil de ações que o estado representa.A partir daí, as fórmulas para os conceitos de soluções são definidas utilizandoestes símbolos. A idéia de tal caracterização é encapsular as conseqüências dasinterações por estados, objetivando um melhor entendimento sobre os jogos.

Este capítulo é dividido da seguinte forma: a seção 6.1 apresenta os jogosestratégicos como estruturas de GAL, bem como os conceitos de equilíbrio deNash, de ótimo de Pareto, e de equilíbrio de Nash de estratégias mistas comofórmulas de GAL; a seção 6.2 provê duas versões de estruturas de GAL para osjogos extensivos, e ainda as fórmulas de GAL para cada versão dos conceitos deequilíbrio de Nash e de subjogo perfeito. Uma versão está relacionada à versãomatricial de um jogo extensivo, enquanto que a outra está relacionada à versãoextensiva; os jogos extensivos com informação quase perfeita e imperfeitasão apresentados nas seções 6.3 e 6.4, respectivamente; os jogos de coalizõescom utilidades transferíveis e o seu principal conceito de solução, core, sãorepresentados em GAL na seção 6.5. Alguns diferentes conceitos de soluçõessão também apresentados; nas duas seções posteriores dois novos modelos sãodesenvolvidos e representados em GAL com a finalidade de ilustrar como GALse adapta a novos tipos de jogos e pode prover novos conceitos de soluçõesde forma intuitiva; e, por fim, na seção 6.8 modelamos jogos de coalizões semutilidades transferíveis.

As provas dos teoremas, que garantem as correspondências entre a Teoriados Jogos e GAL, são apresentadas no apêndice B, objetivando uma leituramais suave deste capítulo.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 111

6.1Jogo Estratégico em GAL

Um jogo estratégico ! = #N, (Ai), (ui)$ pode ser modelado em umaestrutura G! de GAL da seguinte forma. Cada perfil de ações a = (ai) "!

i!N Ai (do jogo estratégico !) é mapeado em um estado a (da estrutura deG!), onde, para cada jogador i " N , o símbolo ai :! Ai designa neste estadoa ação ai do jogador i (do perfil a que originou o estado), em outras palavras,o símbolo ai é interpretado de forma não-rígida e sua interpretação dependedo perfil que originou o estado. As funções de utilidades são definidas comono jogo estratégico e suas interpretações são rígidas1. A relação % é definidacom o seu significado usual. Como jogo estratégico é um jogo de apenas umlance, o conjunto inicial dos estados é o conjunto dos estados do jogo, e nenhumjogador pode fazer uma escolha em cada estado, ou seja Ne = &. Desta forma, oconjunto de ações da estrutura de GAL é o conjunto vazio. A definição formalé apresentada abaixo.

Definição 6.1 Um jogo estratégico ! = #N, (Ai), (ui)$ é mapeado em umaestrutura de GAL como segue.

A linguagem não-lógica é definida por #S, F, P, N$, onde

– S = {(Ai), R}, temos um sort R para representar as utilidades e paracada jogador i " N um sort Ai.

– F = {(ai), (ui)}, temos, para cada jogador i " N , um símbolo ai :! Ai

e um símbolo funcional ui :!

i!N Ai ! R.

– P = {%}, um símbolo predicativo %: R' R.

– N = N , o conjunto de jogadores do jogo !.

A estrutura de GAL G! = #SE,SEo, CA, (DAi ,DR)i!N , (ai,e, ui)i!N,e!SE,

(%), (Ne)e!SE$, onde

– SE = A, o conjunto de estados é o conjunto dos perfis de estratégiasA =

!i!N Ai do jogo estratégico !.

– SEo = A.

– CA = &, o jogo não possui evolução.

– Cada domínio DAi é interpretado como o conjunto Ai do jogo !; e odomínio DR é interpretado como o conjunto de todos os possíveis valoresdas utilidades de !. Note que este conjunto é finito se o jogo é finito.

1Lembre-se que em uma interpretação rígida a interpretação é a mesma em todos osestados.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 112

– Cada símbolo ai é interpretada no estado e " SE como a ação do jogadori de acordo com o perfil de ações a = #a1, . . . , ai, . . . , an$ do jogo ! queoriginou o estado e, i.e. ai,e = ai.

– Cada símbolo funcional ui é interpretado como a função de utilidade ui

do jogo ! de forma rígida.

– O símbolo predicativo % é interpretado de forma rígida como o predicadomaior ou igual.

– Ne = &, pois o jogo não tem evolução.

Iremos utilizar um abuso de notação e representar um jogo estratégico#N, (Ai), (ui)$ como a seguinte estrutura de GAL #A,A, &, (Ai, R), (ai,a, ui),

(%), &$ com linguagem não-lógica #(Ai, R),(ai :! Ai, ui : A ! R), (%: R' R),

N$, onde A =!

i!N Ai é o conjunto dos perfis de estratégias, i é um jogador,e ai,a = ai para cada a = #a1, . . . , ai, . . . , an$ " A.

Para exemplificar, considere o exemplo 2.2, Batalha dos Sexos, apresen-tado na seção 2.1. Representamos novamente este jogo nesta seção utilizando asua forma matricial na figura 6.1.a. A linguagem não-lógica para este jogo es-tratégico é #{A1, A2, R}, {a1 :! A1, a2 :! A2, u1 : A1'A2 ! R, u2 : A1'A2 !R}, (%: R'R), {1, 2}$. A estrutura de GAL para esta linguagem não-lógica éGBoS = #A,A, &, (A1, A2, R), (a1,a, a2,a, u1, u2), (%), &$, onde

– A = {#B, B$, #B, S$, #S, B$, #S, S$}

– A1 = A2 = {B, S} e R = {0, 1, 2}

– u1(B,B) = 2, u1(B, S) = 0, u1(S, B) = 0, u1(S, S) = 1,u2(B,B) = 1, u2(B, S) = 0, u2(S, B) = 0, u2(S, S) = 2.

– a1,"B,B# = B, a2,"B,B# = B, a1,"B,S# = B, a2,"B,S# = S,a1,"S,B# = S, a2,"S,B# = B, a1,"S,S# = S, a2,"S,S# = S

Na figura 6.1.b, apresentamos parte da estrutura de GAL para esteexemplo. Os estados são representados pelos círculos que são rotulados com operfil de ações da qual cada estado foi originado. As interpretações dos símbolos(ai) são apresentadas dentro dos círculos. Os domínios são apresentados pelosconjuntos logo abaixo dos círculos. Nesta figura, não apresentamos a definiçãodas funções de utilidades. Por exemplo, o perfil de ações #B,B$ é mapeada emum círculo rotulado com #B, B$ no qual os símbolos a1 e a2 são interpretadascomo B e B, respectivamente.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 113

B

S

B S

2,1

0,0

0,0

1,2

(a) - Representação Matricial

!"#$a1 = Ba2 = B

#B,B$ !"#$a1 = Ba2 = S

#B, S$

!"#$a1 = Sa2 = B

#S, B$ !"#$a1 = Sa2 = S

#S, S$

R = {0, 1, 2}A1 = A2 = {B,S}

(b)( GBoS Estrutura de GAL

Figura 6.1: Jogo estratégico Batalha dos Sexos.

6.1.1Fórmula de Equilíbrio de Nash

Expressamos equilíbrio de Nash através de uma fórmula de GAL, tal queesta fórmula é satisfeita em um estado se, e somente se, o perfil de ações, queo estado representa, é um equilíbrio de Nash.

Sejam #A,A, &, (Ai, R), (ai,a, ui), (%), &$ uma estrutura de GAL comlinguagem não-lógica #(Ai, R) , (ai :! Ai, ui : A ! R) , (%: R ' R), N$, e(vAi) variáveis de sorts (Ai), onde i " N , a " A e n é o número de jogadoresem N . Uma fórmula de equilíbrio de Nash Equilibrium é definida comosegue.

"i!N)vAi(ui(a1, . . . , an) % ui(a1, . . . , vAi , . . . , an))

Para jogos com dois jogadores, como no exemplo 2.2, Batalha dos Sexos,temos a seguinte fórmula de equilíbrio de Nash.

()vA1(u1(a1, a2) % u1(vA1 , a2))) * ()vA2(u2(a1, a2) % u2(a1, vA2)))

Abaixo iremos demonstrar que #B, B$ é um equilíbrio de Nash. Destaforma, temos que a fórmula de GAL descrita acima é satisfeita no estado#B, B$. Sejam !A1 e !A2 funções de valorações para os sorts A1 e A2, respec-tivamente.

GBoS ,!A1 , !A2 |="B,B# )vA1(u1(a1, a2) % u1(vA1 , a2)) * )vA2(u2(a1, a2) % u2(a1, vA2))

+,def GBoS ,!A1 ,!A2 |="B,B# )vA1(u1(a1, a2) % u1(vA1 , a2)) (veja 6-1)

E GBoS ,!A1 ,!A2 |="B,B# )vA2(u2(a1, a2) % u2(a1, vA2)) (veja 6-2).

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 114

GBoS ,!A1 , !A2 |="B,B# )vA1(u1(a1, a2) % u1(vA1 , a2)) (6-1)

+,def )d1 " {B, S} temos que

GBoS ,!A1(vA1 |d1),!A2 |="B,B# u1(a1, a2) % u1(vA1 , a2)

+,def )d1 " {B, S} temos que

u1(!̄A1(vA1 |d1)(#B,B$, a1), !̄A2(#B,B$, a2)) %u1(!̄A1(vA1 |d1)(#B, B$, vA1), !̄A2(#B, B$, a2))

+,def )d1 " {B, S} temos que

u1(B, B) % u1(!̄A1(vA1 |d1)(#B, B$, vA1), B)

+,def u1(B,B) % u1(B, B) e u1(B,B) % u1(S, B)+,def 2 % 2 e 2 % 0

GBoS ,!A1 , !A2 |="B,B# )vA2(u2(a1, a2) % u2(a1, vA2)) (6-2)

+,def )d2 " {B, S} temos que

GBoS ,!A1 ,!A2(vA2 |d2) |="B,B# u2(a1, a2) % u2(a1, vA2)

+,def )d2 " {B, S} temos que

u2(!̄A1(#B, B$, a1), !̄A2(vA2 |d2)(#B,B$, a2)) %u2(!̄A1(#B,B$, a1), !̄A2(vA2 |d2)(#B, B$, vA2))

+,def )d2 " {B, S} temos que

u2(B, B) % u2(B, !̄A2(vA2 |d2)(#B, B$, vA2))

+,def u2(B,B) % u2(B, B) e u2(B,B) % u2(B, S)+,def 1 % 1 e 1 % 0

Abaixo é apresentado o teorema que garante o mapeamento de equilíbriode Nash, tal como descrito acima. A prova do mesmo é encontrada na seçãoB.1.1 (página 204) do apêndice B.

Teorema 6.2 Sejam ! um jogo estratégico, a$ = (a$i ) um perfil de ações de !,G! uma estrutura de GAL para ! como definido na seção 6.1, e " uma fórmulade Equilíbrio de Nash como definido acima.

a$ é um equilíbrio de Nash em ! +, G! |=a! "

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 115

Podemos utilizar apenas as características de uma linguagem de primeira-ordem para caracterizar o conceito de equilíbrio de Nash. Abaixo apresentamosuma fórmula que é verdadeira se, e somente se, existe um perfil de ações queé um equilíbrio de Nash. Note que a fórmula abaixo não é dependente de umaestrutura temporal.

G! |= -v$A1. . . v$An

# "i!N)vAi(ui(v

$A1

, . . . , v$An) % ui(v

$A1

, . . . , vAi , . . . , v$An

))

$

6.1.2Fórmula de Ótimo de Pareto

A idéia da representação de ótimo de Pareto como uma fórmula de GALé semelhante a definição da fórmula de equilíbrio de Nash apresentada na seção6.1.1.

Sejam (vAi) variáveis de sorts (Ai). Define-se uma fórmula de ótimode Pareto como segue.

¬

%

&&'-vA1 . . . -vAn

%

&&'

# "i!N

ui(vA1 , . . . , vAn) % ui(a1, . . . , an)

$*

# (i!N

ui(vA1 , . . . , vAn) > ui(a1, . . . , an)

$

)

**+

)

**+

Para um jogo estratégico de dois jogadores, como no exemplo 2.3, Dilemado Prisioneiro, temos a seguinte fórmula de equilíbrio de Pareto.

¬,-vA1-vA1

,(u1(vA1 , vA2) % u1(a1, a2) * u2(vA1 , vA2) % u2(a1, a2))*

(u1(vA1 , vA2) > u1(a1, a2) . u2(vA1 , vA2) > u2(a1, a2))

--

Para o exemplo 2.3, Dilema do Prisioneiro, temos que a fórmula acimaé satisfeita no estado #NC,NC$.

Abaixo é apresentado o teorema que garante o mapeamento de ótimode Pareto, tal como descrito acima. A prova do mesmo é encontrada na seçãoB.1.2 (página 205) do apêndice B.

Teorema 6.3 Sejam ! um jogo estratégico, a$ = (a$i ) um perfil de estratégiasde !, G! uma estrutura de GAL para ! como definido na seção 6.1, e " umafórmula de ótimo de Pareto como definido acima.

a$ é um ótimo de Pareto em ! +, G! |=a! "

Assim como na seção 6.1.1, podemos utilizar apenas lógica de primeira-ordem para caracterizar ótimo de Pareto.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 116

6.1.3Fórmula de Equilíbrio de Nash de Estratégias Mistas

Como o conceito de equilíbrio de Nash de estratégias mistas utiliza, paracada jogador i " N , um conjunto de estratégias mistas "Ai , um conjunto deestratégias degeneradas #Ai , e uma função de utilidade Ui calculada em funçãode um perfil de estratégias mistas (#i), adicionamos estes conjuntos e funçõesà estrutura de GAL de um jogo estratégico. Dito isto, definimos um jogoestratégico como #A,A, &, (Ai, "Ai , #Ai , R), (ai,a, ui, Ui), (%), &$ com linguagemnão-lógica #(Ai, R), (ai :! Ai, ui : A ! R, Ui : " ! R),(%: R ' R), N$, ondeA =

!i!N Ai é o conjunto dos perfis de ações, i é um jogador, e " =

!i!N

"Ai ,

e para cada a = #a1, . . . , ai, . . . , an$ " A, temos ai,a = ai.Como o conceito de equilíbrio de estratégias mistas é definido sobre as

estratégias mistas e não utilizamos símbolos para representá-los a cada estado,utilizamos variáveis livres para caracterizar equilíbrio de Nash de estratégiasmistas. Assim, a fórmula de equilíbrio de Nash de estratégia mistas, que temvariáveis livres v"Ai , é um equilíbrio de Nash de estratégias mistas se, e somentese, existem funções de valorações !"Ai que tornam a fórmula verdadeira.

Sejam (v"Ai) variáveis de sorts ("Ai), e (v#Ai

) variáveis de sorts (#Ai),uma fórmula de equilíbrio de Nash de estratégias mistas é definidocomo segue.

"i!N)v#Ai

(Ui(v"A1, . . . , v"An

) % Ui(v"A1, . . . , v#Ai

, . . . , v"An))

Note que aqui estamos utilizando apenas a linguagem de primeira-ordemde GAL.

Para jogos com dois jogadores como no exemplo 2.2, Batalha dos Sexos,temos a seguinte fórmula de equilíbrio de Nash.

,()v#A1

(U1(v"A1, v"A2

) % U1(v#A1, v"A2

)))*

()v#A2(U2(v"A1

, v"A2) % U2(v"A1

, v#A2)))

-

No exemplo 2.2, Batalha dos Sexos, a estrutura de GAL GBoS (veja afigura 6.1.b) com as funções de valoração !"A1

e !"A2, onde !"A1

(v"A1) =

#23 ,

13$ e !"A2

(v"A2) = #1

3 ,23$ temos que

GBoS ,!"A1,!"A2

|=

%

' ()v#A1(U1(v"A1

, v"A2) % U1(v#A1

, v"A2)))*

()v#A2(U2(v"A1

, v"A2) % U2(v"A1

, v#A2)))

)

+

+,def GBoS ,!"A1,!"A2

|= )v#A1(U1(v"A1

, v"A2) % U1(v#A1

, v"A2)) (prova 6-3)

E GBoS ,!"A1,!"A2

|= )v#A2(U2(v"A1

, v"A2) % U2(v"A1

, v#A2)) (prova 6-4)

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 117

GBoS ,!"A1,!"A2

|= )v#A1(U1(v"A1

, v"A2) % U1(v#A1

, v"A2)) (6-3)

+,def )d1 " {#1, 0$, #0, 1$} temos que

GBoS ,!"A1(v#A1

|d1),!"A2|= (U1(v"A1

, v"A2) % U1(d1, v"A2

))

+,def )d1 " {#1, 0$, #0, 1$} temos que

U1./

23 , 1

3

0,/

13 , 2

3

01% U1

.d1,

/13 , 2

3

01

+,def U1./

23 , 1

3

0,/

13 , 2

3

01% U1

.#1, 0$,

/13 , 2

3

01E U1

./23 , 1

3

0,/

13 , 2

3

01%

U1.#0, 1$,

/13 , 2

3

01

GBoS ,!"A1,!"A2

|= )v#A2(U2(v"A1

, v"A2) % U2(v"A1

, v#A2)) (6-4)

+,def )d2 " {#1, 0$, #0, 1$} temos que

GBoS ,!"A1,!"A2

(v#A2|d2) |= (U2(v"A1

, v"A2) % U2(v"A1

, v#A2))

+,def )d2 " {#1, 0$, #0, 1$} temos que

U2./

23 , 1

3

0,/

13 , 2

3

01% U2

./23 , 1

3

0, d2

1

+,def U2./

23 , 1

3

0,/

13 , 2

3

01% U2

./23 , 1

3

0, (1, 0)

1E U2

./23 , 1

3

0,/

13 , 2

3

01%

U2./

23 , 1

3

0, #0, 1$

1

Abaixo é apresentado o teorema que garante o mapeamento de equilíbriode Nash de estratégias mistas, tal como descrito acima. A prova do mesmo éencontrada na seção B.1.3 (página 206) do apêndice B.

Teorema 6.4 Sejam ! um jogo estratégico, # $ = (# $i ) um perfil de estratégiasmistas, G! um estrutura de GAL para ! como definido na seção 6.1.3, (!"Ai

)

funções de valorações de sorts ("Ai), e " uma fórmula de equilíbrio de Nashde estratégias mistas como definido acima.

(# $i ) é um equilíbrio de estratégias mistas em !

+, G!, (!"Ai) |= ", onde cada !"Ai(v"Ai

) = # $i

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 118

6.2Jogo Extensivo com Informação Perfeita em GAL

Abaixo serão apresentados duas versões de jogo extensivo com informa-ção perfeita em estruturas de GAL. Na primeira versão, seguimos a idéia dejogo estratégico como estrutura de GAL (seção 6.1), e cada estado é repre-sentado por um perfil de estratégias para cada jogador. Na segunda versão,apresentamos uma versão mais natural de um jogo extensivo no qual cadaestado é representado por um histórico. Em ambos os casos, os conceitos desoluções de equilíbrio de Nash e de subjogo perfeito são definidos através defórmulas de GAL.

6.2.1Versão Matricial em GAL de Jogo Extensivo

Na primeira versão, a idéia de representar um jogo extensivo cominformação perfeita2 como estrutura de GAL segue o caso de jogo estratégicocomo estrutura de GAL apresentado na seção 6.1. Esta representação estárelacionada a versão matricial de um jogo extensivo com informação perfeita.Assim, modelamos cada perfil de estratégias s como um estado s, no qual, paracada jogador i, um símbolo si :! Si é utilizado para representar a estratégia dojogador i, e sua interpretação depende da estratégia si. Por exemplo, o perfil deestratégias ##A$, #L$$ no exemplo 2.10 é mapeado no estado ##A$, #L$$, onde ossímbolos s1 e s2 são as estratégias #A$ e #L$, respectivamente. Representamostambém cada conjunto das estratégias Si de cada jogador i " N , o conjuntodos históricos H, o conjunto dos históricos terminais T, e o conjunto doshistóricos não-terminais NT. As funções P,ui,O e Oh são definidas comono jogo extensivo, e suas interpretações são rígidas.

Definição 6.5 Um jogo extensivo com informação perfeita ! = #N,P, H, (ui)$é mapeado em uma estrutura de GAL como segue.

– A linguagem não-lógica é definida por #S, F, P, N$

– S = {(Si), H, T, NT, R}, temos um sort H para os históricos, T

para os terminais, NT para os não-terminais, R para as utilidades,e, para cada jogador i " N , um sort Si.

– F = {P, (ui), (si), O, Oh}, os símbolos funcionais P : NT ! N ,O :

!i!N Si ! T , Oh : H'

!i!N Si ! T , e para cada jogador i " N

um símbolo si :! Si e um símbolo funcional ui :!

i!N Si ! R.– P = {%}, um símbolo predicativo %: R' R.

2Para ver a definição de jogo extensivo com informação perfeita, veja a seção 2.2 (página33).

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 119

– N = N , o conjunto de jogadores de !.

– A estrutura de GAL G! = #SE,SEo, CA, (DSi ,DH ,DT ,DNT ,DR)i!N ,

(P, ui, si,e, O, Oh)i!N,e!SE, (%), (Ne)e!SE$, onde

– SE = S, o conjunto dos estados é o conjunto dos perfis deestratégias de !.

– SEo = S, pois nesta versão a evolução do jogo não ocorre naestrutura temporal de G!.

– CA = &, pois nesta versão a evolução do jogo não ocorre naestrutura temporal de G!.

– Cada domínio DSi é o conjunto das estratégias Si do jogo !; odomínio DH é o conjunto dos históricos de !; o domínio DT é oconjunto dos históricos terminais de !; o domínio DNT é o conjuntodos históricos não-terminais de !; o domínio DR é o conjunto detodo os possíveis valores das utilidades do jogo !. Note que esteconjunto é finito, se o jogo for finito.

– Cada símbolo si é interpretado no estado e " SE como a es-tratégia do jogador i de acordo com o perfil de estratégias s =

#s1, . . . , si, . . . , sn$ do jogo ! que originou o estado e, i.e. si,e = si;As funções P, ui, O, Oh são interpretadas de forma rígida comoas funções do jogo !.

– O predicado % é interpretado de forma rígida como no jogo !.– Ne = &, pois nesta versão a evolução do jogo não ocorre na estrutura

temporal de G!.

Iremos utilizar um abuso de notação, e representar um jogo extensivocom informação perfeita #N, P,H, (ui)$ como a seguinte estrutura de GAL#S, S, &, (Si, H, T, NT, R), (P, ui, si,s, O, Oh), (%), &$ com linguagem não-lógica#(Si, H, T, NT, R) , (P : NT ! N, ui : T ! R, si :! Si, O : S ! T, Oh :

H ' S ! T ) , (%: R' R), N$Abaixo apresentamos o jogo extensivo do exemplo 2.10 como uma estru-

tura de GAL para jogo extensivo na versão matricial. Como esta representaçãoé mais parecida com a forma matricial do jogo extensivo, apresentamos na fi-gura 6.2 a forma matricial deste jogo, bem como parte da estrutura de GALdefinida abaixo.

Exemplo 6.6 A estrutura de GAL para o exemplo 2.10 é definida por#S, S, &, (S1, S2, H, T,NT, R), (P, u1, u2, s1,s, s2,s, O, Oh), ( % ), &$ com lin-guagem não-lógica #(S1, S2, H, T, NT, R), (P : NT ! {1, 2}, u1 : S1 ' S2 !R, u2 : S1 ' S2 ! R, s1 :! S1, s2 :! S2, O : S1 ' S2 ! T, Oh : H ' S1 ' S2 !T ), (%: R' R), {1, 2}$ onde

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 120

#A$

#B$

#L$ #R$

0,0

1,2

2,1

1,2

(a) - Representação Matricial

!"#$

s1 = "A#

s2 = "L#

##A$, #L$$ !"#$

s1 = "A#

s2 = "R#

##A$, #R$$

!"#$

s1 = "B#

s2 = "L#

##B$, #L$$ !"#$

s1 = "B#

s2 = "R#

##B$, #R$$R = {0, 1, 2}

S1 = {#A$, #B$}, S2 = {#L$, #R$}(b)- Estrutura de GAL G6.6

Figura 6.2: Jogo extensivo do exemplo 2.10

– S = {##A$, #L$$, ##A$, #R$$, ##B$, #L$$, ##B$, #R$$}.

– S1 = {#A$, #B$} e S2 = {#L$, #R$}.

– H = {&, (A), (B), (A,L), (A,R)}.

– T = {(B), (A,L), (A, R)}.

– NT = {&, (A)}.

– R = {0, 1, 2}.

– P(&) = 1 e P((A)) = 2.

– s1,""A#,"L## = A, s1,""A#,"R## = A, s1,""B#,"L## = B, s1,""B#,"R## = B

s2,""A#,"L## = L, s2,""A#,"R## = R, s2,""B#,"L## = L, s2,""B#,"R## = R.

– O(#A$, #L$) = (A,L), O(#A$, #R$) = (A,R),O(#B$, #L$) = (B), O##B$, #R$$ = (B).

– Oh(&, #A$, #L$) = (A,L), Oh((A), #A$, #L$) = (A,L),Oh((A, L), #A$, #L$) = (A,L), Oh((A,R), #A$, #L$) = (A,R),Oh((B), #A$, #L$) = (B), Oh(&, #A$, #R$) = (A,R),Oh((A), #A$, #R$) = (A,R), Oh((A,L), #A$, #R$) = (A,L),Oh((A, R), #A$, #R$) = (A,R), Oh((B), #A$, #R$) = (B),Oh(&, #B$, #L$) = (B,L), Oh((A), #B$, #L$) = (A,L),Oh((A, L), #B$, #L$) = (A,L), Oh((A, R), #B$, #L$) = (A, R),Oh((B), #B$, #L$) = (B), Oh(&, #B$, #R$) = (B, R),Oh((A), #B$, #R$) = (A,R), Oh((A, L), #B$, #R$) = (A, L),Oh((A, R), #B$, #R$) = (A,R), Oh((B), #B$, #R$) = (B).

– u1((B)) = 1, u1((A,L)) = 0, u1((A,R)) = 2

u2((B)) = 2, u2((A,L)) = 0, u2((A,R)) = 1

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 121

6.2.2Fórmula de Equilíbrio de Nash para a Versão Matricial

A representação de equilíbrio de Nash para jogo extensivo é similar aocaso de equilíbrio de Nash para jogo estratégico apresentada na seção 6.1.1. Afórmula de equilíbrio de Nash para jogo extensivo na versão matricialé definida da seguinte forma.

Sejam (vSi) variáveis de sorts (Si).

"i!N)vSi(ui(O(s1, . . . , sn)) % ui(O(s1, . . . , vSi , . . . , sn)))

A fórmula de equilíbrio de Nash para um jogo com dois jogadores, comono exemplo 6.6, é definida da seguinte forma.

)vS1(u1(O(s1, s2)) % u1(O(vS1 , s2))) * )vS2(u2(O(s1, s2)) % u2(O(s1, vS2)))

Assim, para o exemplo 6.6 a fórmula definida acima é satisfeita nos estados##A$, #R$$ e ##B$, #L$$. Desta forma, temos que

G6.6 |=""A#,"R##)vS1(u1(O(s1, s2)) % u1(O(vS1 , s2)))*)vS2(u2(O(s1, s2)) % u2(O(s1, vS2)))

G6.6 |=""B#,"L##)vS1(u1(O(s1, s2)) % u1(O(vS1 , s2)))*)vS2(u2(O(s1, s2)) % u2(O(s1, vS2)))

Abaixo é apresentado o teorema que garante o mapeamento de equilíbriode Nash, tal como descrito acima. A prova do mesmo é encontrada na seçãoB.2.1 (página 207) do apêndice B.

Teorema 6.7 Sejam ! um jogo extensivo com informação perfeita, s$ = (s$i )

um perfil de estratégias para !, G! uma estrutura de GAL na versão matricialpara ! como definido na seção 6.2.1, e " uma fórmula de equilíbrio de Nashpara G! como definido acima.

Um perfil de estratégias s$ é um equilíbrio de Nash para ! +, G! |=s! "

6.2.3Fórmula de Equilíbrio de Subjogo Perfeito para a Versão Matricial

A idéia de representar equilíbrio de subjogo perfeito para jogo extensivona versão matricial é similar ao caso de representar equilíbrio de Nash parajogo estratégico apresentada na seção 6.1.1. A fórmula de equilíbrio desubjogo perfeito para jogo extensivo na versão matricial é definida daseguinte forma.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 122

Sejam vNT uma variável de sort NT , e (vSi) variáveis de sorts (Si).

)vNT

# "i!N

P (vNT ) = i ! )vSi (ui(Oh(vNT , s1, . . . , sn)) % ui(Oh(vNT , s1, . . . , vSi , . . . , sn)))

$

A fórmula de equilíbrio de subjogo perfeito para um jogo com doisjogadores, como no exemplo 6.6, é definida da seguinte forma.

)vNT

,(P (vNT ) = 1 ! )vS1(u1(Oh(vNT , s1, s2)) % u1(Oh(vNT , vS1 , s2))))*

(P (vNT ) = 2 ! )vS2(u1(Oh(vNT , s1, s2)) % u1(Oh(vNT , s1, vS2))))

-

Assim, para o exemplo 6.6 a fórmula definida acima é satisfeita no estado##A$, #R$$. Desta forma, temos que

G6.6 |=""A#,"R##)vNT

,(P (vNT ) = 1 ! )vS1(u1(Oh(vNT , s1, s2)) % u1(Oh(vNT , vS1 , s2))))*

(P (vNT ) = 2 ! )vS2(u1(Oh(vNT , s1, s2)) % u1(Oh(vNT , s1, vS2))))

-

Abaixo é apresentado o teorema que garante o mapeamento de equilíbriode subjogo perfeito, tal como descrito acima. A prova do mesmo é encontradana seção B.2.2 (página 208) do apêndice B.

Teorema 6.8 Sejam ! um jogo extensivo com informação perfeita, s$ = (s$i )

um perfil de estratégias para !, G! uma estrutura de GAL na versão matricialpara ! como definido na seção 6.2.1, e " uma fórmula de equilíbrio de subjogoperfeito para G! como definido acima.

Um perfil de estratégias s$ é um equilíbrio de subjogo perfeito para !

+, G! |=s! "

6.2.4Versão Extensiva em GAL de Jogo Extensivo

Podemos modelar um jogo extensivo com informação perfeita ! =

#N, H, P, (ui)$ em GAL de uma forma mais intuitiva, onde a estrutura deGAL é representada pela sua forma extensiva. Cada histórico h " H (do jogoextensivo) é representado por um estado h, no qual o símbolo h :! H denotao histórico h, que originou o estado, do jogo extensivo !. O conjunto de açõesda estrutura de GAL é determinado pelas ações a partir de cada histórico não-terminal. A função P determina o jogador que faz a escolha a cada estado,i.e. Nh = {P (h)}. Os conjuntos das estratégias (Si) dos jogadores, e ainda asfunções O e Oh, são definidos na estrutura de GAL, e têm suas interpretaçõesrígidas definidas como no jogo extensivo !. Formalmente, temos a definiçãoabaixo.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 123

Definição 6.9 Um jogo extensivo ! = #N, H, P, (ui)$ é mapeado em umaestrutura de GAL na versão extensiva como segue.

– A linguagem não-lógica é definida por #S, F, P, N$, onde

– S = {H, T, (Si), R}, temos o sort H para os históricos, T para oshistóricos terminais, o sort R para as utilidades e, para cada jogadori " N , um sort Si.

– F = {h, (ui), O,Oh}, temos os símbolos funcionais O :!

i!N Si !T , Oh : H '

!i!N Si ! T , o símbolo h :! H, e, para cada jogador

i " N , um símbolo funcional ui : T ! R.– P = {%}, um símbolo predicativo %: R' R.– N = N , o conjunto de jogadores de !.

– A estrutura de GAL G! = #SE,SEo, CA, (DSi ,DH ,DR)i!N ,

(he, ui, O, Oh)i!N,e!SE, (%), (Ne)e!SE$, onde

– SE = H, o conjunto dos estados é o conjunto dos históricos de !.– SEo = {&}, o estado inicial é o estado representado pelo histórico&.

– Para todo histórico h de ! e toda ação a " A(h) tal que (h, a) " H,temos que #h, (h, a)$ " CA.

– Cada domínio DSi é o conjunto das estratégias Si do jogador i de!; o domínio DH é o conjunto dos históricos de !; o domínio DT éo conjunto dos históricos terminais de !; e, finalmente, o domínioDR é o conjunto de todos os possíveis valores das utilidades de !.Perceba que este conjunto é finito, se o jogo é finito.

– O símbolo h é interpretado no estado e " SE como o histórico h dojogo ! que originou o estado e, i.e. he = h; As funções ui, O, Oh

são interpretadas rigidamente como as funções do jogo !.– O predicado % é interpretado de forma rígida como no jogo !.– Ne = {P (h)}, a função P do jogo ! determina qual jogador toma

uma decisão no estado e " SE, onde o estado e foi originado dohistórico h.

Iremos utilizar um abuso de notação e representar um jogoextensivo ! = #N, P,H, (ui)$ como a seguinte estrutura de GAL#H,Ho, CA, (H, T, Si, R), (hh, ui, O, Oh), ( % ),(Nh)$ com linguagem não-lógica #(H, T, Si, R) , (h :! H, ui : T ! R, O : S ! T, Oh : H ' S ! T )

, (%: R' R), N$.Abaixo apresentamos o jogo extensivo do exemplo 2.10 como estrutura

de GAL para jogo extensivo na versão extensiva. Na figura 6.3, apresentamos

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 124

0,0 2,1

1,2

A B

L R

%1!

!!!"

##

##$%2!

!!"#

##$

(a) - Representação Extensiva (b) - Estrutura de GAL G6.10

&'

()h = &

{1}%%%&

'''(&&

'()h = (A)

{2}))))*

++++,(B)(A)&

'()h = (A,L)

{}(A,L) (A, R)

&'

()h = (A,R)

{}

&'

()h = (B)

{}

S1 = {#A$, #B$}, S2 = {#L$, # R$}, R = {0, 1, 2}H = {&, (A), (B), (A, L), (A,R)}T = {(B), (A,L), (A, R)}

Figura 6.3: Exemplo 2.10.

a forma extensiva deste jogo, bem como parte da estrutura de GAL definidaabaixo.

Exemplo 6.10 A estrutura de GAL para o exemplo 2.10 é definido por#H,Ho, CA, (H,T, S1, S2, R), (hh, u1, u2, O,Oh), ( % ), (Nh)$ com linguagemnão-lógica #(H, T, S1, S2, R), (h :! H, u1 : T ! R, u2 : T ! R, O : S1 ' S2 !T,Oh : H ' S1 ' S2 ! T ), (%: R' R), {1, 2}$ onde

– H = {&, (A), (B), (A,L), (A,R)}.

– Ho = {&}.

– CA = {#&, (A)$, #&, (B)$, #(A), (A,L)$, #(A), (A,R)$}.

– S1 = {#A$, #B$} e S2 = {#L$, #R$}.

– T = {(B), (A,L), (A, R)}.

– R = {0, 1, 2}.

– h% = &, h(A) = (A), h(B) = (B), h(A,L) = (A, L), h(A,R) = (A,R).

– O(#A$, #L$) = (A,L), O(#A$, #R$) = (A,R),O(#B$, #L$) = (B), O(#B$, #R$) = (B).

– Oh(&, #A$, #L$) = (A,L), Oh((A), #A$, #L$) = (A,L),Oh((A, L), #A$, #L$) = (A,L), Oh((A,R), #A$, #L$) = (A,R),Oh((B), #A$, #L$) = (B), Oh(&, #A$, #R$) = (A,R),Oh((A), #A$, #R$) = (A,R), Oh((A,L), #A$, #R$) = (A,L),Oh((A, R), #A$, #R$) = (A,R), Oh((B), #A$, #R$) = (B),Oh(&, #B$, #L$) = (B,L), Oh((A), #B$, #L$) = (A,L),Oh((A, L), #B$, #L$) = (A,L), Oh((A, R), #B$, #L$) = (A, R),Oh((B), #B$, #L$) = (B), Oh(&, #B$, #R$) = (B, R),

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 125

Oh((A), #B$, #R$) = (A,R), Oh((A, L), #B$, #R$) = (A, L),Oh((A, R), #B$, #R$) = (A,R), Oh((B), #B$, #R$) = (B).

– u1((B)) = 1, u1((A,L)) = 0, u1((A,R)) = 2

u2((B)) = 2, u2((A,L)) = 0, u2((A,R)) = 1

– N% = {1}, N(A) = {2}, N(B) = N(A,L) = N(A,R) = {}

6.2.5Fórmula de Equilíbrio de Nash para a Versão Extensiva

Nesta versão a representação de equilíbrio de Nash difere da fórmulade equilíbrio de Nash apresentada na seção 6.2.2. Como em cada estadonão fazemos referência as estratégias dos jogadores (não existem símbolos emcada mundo para representá-los), utilizamos variáveis livres para caracterizarequilíbrio de Nash. Assim, a fórmula de equilíbrio de Nash, que tem variáveislivres (v$Si

), uma para cada jogador i, é um equilíbrio de Nash se, e somentese, existem funções de valorações (!Si) que tornam a fórmula verdadeira.

Sejam ! um jogo extensivo com informação perfeita, G! uma estruturade GAL para ! como definido em 6.2.4, (v$Si

) variáveis de sorts (Si) e (vSi)

variáveis de sorts (Si). Uma fórmula de equilíbrio de Nash para G! édefinida como segue.

"i!N)vSi

.ui(O(v$S1

, . . . , v$Sn)) % ui(O(v$S1

, . . . , vSi , . . . , v$Sn

))1

Para o exemplo 6.10, temos a seguinte fórmula de equilíbrio de Nashverdadeira para as funções de valorações !S1 e !S2 , onde !S1(v

$S1

) = #A$ e!S2(v

$S2

) = #R$.

G6.10,!S1 ,!S2 |=,)vS1

.u1(O(v$S1

, v$S2)) % u1(O(vS1 , v

$S2

))1*

)vS2

.u2(O(v$S1

, v$S2)) % u2(O(v$S1

, vS2))1

-

O mesmo ocorre quando as funções de valoração !S1 e !S2 atribuem #B$e #L$, respectivamente, ou seja, !S1(v

$S1

) = #B$ e !S2(v$S2

) = #L$.Abaixo é apresentado o teorema que garante o mapeamento de equilíbrio

de Nash, tal como descrito acima. A prova do mesmo é encontrada na seçãoB.3.1 (página 210) do apêndice B.

Teorema 6.11 Sejam ! um jogo extensivo com informação perfeita, s$ = (s$i )

um perfil de estratégias para !, G! uma estrutura de GAL na versão extensivapara ! como definido na seção 6.2.4, (!Si) funções de valorações de sorts (Si),e " uma fórmula de equilíbrio de Nash para G! como definido acima.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 126

Um perfil de estratégias (s$i ) é um equilíbrio Nash para !

+, G!, (!Si) |= ", onde cada !Si(v$Si

) = s$i

6.2.6Fórmula de Equilíbrio de Subjogo Perfeito para a Versão Extensiva

A idéia para representar equilíbrio de subjogo perfeito segue a idéia daseção 6.2.5, onde utilizamos variáveis livres para caracterizar equilíbrio deNash. O argumento utilizado é semelhante, pois não temos símbolos pararepresentar as estratégias a cada estado. Assim, a fórmula de equilíbrio desubjogo perfeito, que tem variáveis livres (v$Si

), uma para cada jogador i " N , éum equilíbrio de subjogo perfeito se e somente se existem funções de valorações(!Si) que satisfazem a fórmula a partir do estado inicial & (i.e. em todos ossubjogos).

Sejam ! um jogo extensivo com informação perfeita, e G! uma estruturade GAL como definido na seção 6.2.4, e (vSi) variáveis de sorts (Si) e (v$Si

)

variáveis de sorts (Si). Uma fórmula de equilíbrio de subjogo perfeitopara G! é definida como segue.

[AG]

# "i!N

i ! )vSi

.ui(Oh(h, v$S1

, . . . , v$Sn)) % ui(Oh(h, v$S1

, . . . , vSi , . . . , v$Sn

))1$

Note que a fórmula interna ao operador modal [AG] representa que seum jogador tem que tomar uma decisão, então está é ótima no subjogo dohistórico h, levando em consideração as estratégias dos outros jogadores. Ooperador modal [AG] aplicado a esta fórmula representa que cada decisão decada jogador em cada subjogo é ótima.

Para o exemplo 6.10, temos a seguinte fórmula de equilíbrio de subjogoperfeito satisfeita no histórico inicial com as funções de valorações !S1 e !S2 ,onde !S1(v

$S1

) = #A$ e !S2(v$S2

) = #R$.

G6.10, !S1 ,!S2 |=% [AG]

,1 ! )vS1

.u1(Oh(h, v$S1

, v$S2)) % u1(Oh(h, vS1 , v

$S2

))1*

2 ! )vS2

.u2(Oh(h, v$S1

, v$S2)) % u2(Oh(h, v$S1

, vS2))1

-

Abaixo é apresentado o teorema que garante o mapeamento de equilíbriode subjogo perfeito, tal como descrito acima. A prova do mesmo é encontradana seção B.3.2 (página 211) do apêndice B.

Teorema 6.12 Sejam ! um jogo extensivo com informação perfeita, s$ = (s$i )

um perfil de estratégias para !, G! uma estrutura de GAL na versão extensivapara ! como definido na seção 6.2.4, (!Si) funções de valorações de sorts (Si),e " uma fórmula de equilíbrio de subjogo perfeito para G! como definido acima.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 127

Um perfil de estratégias (s$i ) é um equilíbrio de subjogo perfeito para !

+, G!, (!Si) |=% ", onde cada !Si(v$Si

) = s$i

6.2.7Quantificando em Jogos Extensivos

Nesta seção, iremos nos focar nas definições de equilíbrio de Nash (EN)e equilíbrio de subjogo perfeito (ESP) para jogos extensivos com informaçãoperfeita, com o intuito de analisarmos as diferentes formas de quantificação.Para tal análise, iremos utilizar as definições de jogos extensivos em GAL naversão matricial e na versão extensiva.

O conceito de solução de EN requer que a estratégia de cada jogadorseja ótima, dadas as estratégias dos outros jogadores. O conceito de soluçãode ESP requer que a estratégia de cada jogador seja ótima em cada instantedo jogo, dadas as estratégias dos outros jogadores. Na definição do conceitode ESP, temos uma descrição explícita da estrutura do jogo, enquanto que emEN a estrutura do jogo não é referenciada. As definições de EN para jogosextensivos desconsideram, assim, a estrutura do jogo. Podemos ver isto bemclaramente na citação abaixo do livro A course in Game Theory, que é um doslivros mais citados de Teoria dos Jogos.

“The first solution concept [nash equilibrium] we define for an extensivegame ignores the sequential structure of the games; it treats the strategies aschoices that are made once and for all before play begins.”(OR94, pages 93)

Iremos demonstrar que isto não é verdadeiro, ou seja, que o conceito deequilíbrio de Nash para jogos extensivos considera a estrutura seqüencial dojogo. Iremos nesta seção caracterizar EN através da estrutura do jogo. Ditode forma simples, o conceito de EN para um jogo extensivo requer que asestratégias sejam ótimas no caminho que ocorre quando cada jogador seguea sua estratégia, desconsiderando assim a racionalidade dos jogadores noshistóricos que não ocorrem neste caminho. Na verdade, veremos em seçõesposteriores que tal caracterização é também válida para jogos com informaçãoimperfeita e quase perfeita.

Alguns autores (FT91, Ros06) comentam, a exemplo da citação abaixo,sobre o conceito de caminho no conceito de equilíbrio de Nash, porém suasdefinições formais são apresentadas da forma usual.

“We also saw that some of these Nash Equilibria may rely on “emptythreats” of suboptimal play at histories that are not expected to occur - that is,at histories o! the path of the equilibrium.”(FT91, pages 72)

Vejamos o exemplo apresentado na figura 6.4 abaixo. Em Teoria dosJogos, costuma-se dizer que a solução ##B$, #R$$, que é um equilíbrio de Nash,

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 128

não é razoável na medida em que se o jogador 2 tiver que tomar uma decisãono histórico não-terminal (A), então ele obterá uma melhor utilidade casomude sua estratégia para #L$, obtendo uma utilidade de 3 ao invés de 1, queé o equilíbrio. Assim, ele tem um incentivo para desviar do equilíbrio. Apesardisso ser usualmente aceito pelos teóricos de jogos, argumentamos que se osjogadores racionalizam suas estratégias somente ao longo do histórico terminal,que resultará das estratégias escolhidas, então o conceito de equilíbrio de Nashé razoável.

A caracterização do conceito de EN, como acima exposto, parece maisrelacionada a visão dos conceitos soluções como uma descrição do compor-tamento de agentes racionais (ou humanos), enquanto que a interpretação doconceito de ESP a uma prescrição ou conselho para os jogadores em como agir.

Voltemos ao exemplo da figura 6.4 para demonstrar que a solução##B$, #R$$ é razoável quando os jogadores racionalizam como acima exposto.Para vermos isto, considere que o jogador 1 tenha escolhido a ação B nohistórico inicial, então o jogo alcançará o estado terminal (B), e o jogo estaráterminado. Notemos que se o jogador 2 não for racional nos históricos que nãosão alcançados ao longo do histórico terminal (B), então ele pode tomar aestratégia #R$, que resultará em uma utilidade pior para o jogador 1, tornandoassim a escolha da estratégia #B$ melhor do que a estratégia #A$. Desta forma,os jogadores racionalizam ao longo dos históricos & e (B), que são os históricosque ocorrem a partir do perfil de estratégias ##B$, #R$$.

L RA 3,2 1,1B 2,1 2,1

(a) - Representação Extensiva (b) - Representação Matricial

3, 2 1, 1

2, 1

A B

L R

%1!

!!!"

##

##$%2!

!!"#

##$

Figura 6.4: Exemplo de um jogo extensivo.

Estamos argumentando o seguinte: o critério de racionalidade sobre oshistóricos, que nunca são alcançáveis, não é condição necessária para que umasolução seja considerada razoável. No exemplo da figura 6.5 abaixo, que éum jogo de soma zero3, isto fica ainda mais aparente, pois neste caso temosduas soluções de EN: ##B$, #L$$ e ##B$, #R$$. Ambos os perfis de estratégias

3Jogo de soma zero é um jogo que um jogador ganha e o outro perde, a exemplo doxadrez e do jogo da velha.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 129

conduzem a mesma solução, que é o histórico terminal (B). Assim, o jogador 2

é indiferente à estratégia adotada no histórico (A), uma vez que este históriconunca será alcançado.

L RA 1,-1 -1,1B 1,-1 1,-1

(a) - Representação Extensiva (b) - Representação Matricial

1,(1 (1, 1

1,(1

A B

L R

%1!

!!!"

##

##$%2!

!!"#

##$

Figura 6.5: Exemplo de um jogo extensivo de soma zero.

Agora voltemos as considerações sobre as definições de equilíbrio deNash e de subjogo perfeito para jogo extensivo com informação perfeita. Asdefinições 6.13 e 6.14 são relativas a equilíbrio de subjogo perfeito, enquantoque as definições 6.15 e 6.16 são relativas a equilíbrio de Nash. Note o enfoqueem negrito dado a quantificação das estratégias. Iremos caracterizar estasdefinições através de fórmulas de GAL para a versão matricial e a versãoextensiva. As definições abaixo quantificam sobre os caminhos de um jogoextensivo. Embora não possamos expressar de uma forma direta o conceitode caminho na versão matricial, uma vez que não temos operadores sobrecaminhos, podemos tentar simulá-lo através de uma quantificação universalsobre os históricos.

Definição 6.13 (Versão De Dicto) Um equilíbrio de subjogo perfeitopara um jogo extensivo com informação perfeita #N,H, P, (ui)$ é um perfil deestratégias s$ tal que para todo jogador i " N e para todo histórico não-terminalh " H para o qual P (h) = i, temos que

ui(Oh(h, s$1, . . . , s$n)) % ui(Oh(h, s$1, . . . , si, . . . , s

$n))

para toda estratégia si " Si.

Definição 6.14 (Versão De Re) Um equilíbrio de subjogo perfeito paraum jogo extensivo com informação perfeita #N,H, P, (ui)$ é um perfil deestratégias s$ tal que para todo jogador i " N , para toda estratégia si " Si

e para todo histórico não-terminal h " H para o qual P (h) = i, temos que

ui(Oh(h, s$1, . . . , s$n)) % ui(Oh(h, s$1, . . . , si, . . . , s

$n)).

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 130

Definição 6.15 (Versão De Dicto) Um equilíbrio de Nash para um jogoextensivo com informação perfeita ! = #N, H, P, (ui)$ é um perfil de estratégiass$ tal que para todo jogador i e para todo histórico não-terminal h " H ao longodo histórico terminal que resulta do perfil de estratégias s$ (i.e. h " O(s$)) parao qual P (h) = i, temos que

ui(Oh(h, s$1, . . . , s$n)) % ui(Oh(h, s$1, . . . , si, . . . , s

$n)),

para toda estratégia si " Si.

Definição 6.16 (Versão De Re) Um equilíbrio de Nash para um jogoextensivo com informação perfeita ! = #N, H, P, (ui)$ é um perfil de estratégiass$ tal que para todo jogador i, para toda estratégia si " Si e para todohistórico não-terminal h " H ao longo do histórico terminal que resulta doperfil de estratégias s$ (i.e. h " O(s$)) para o qual P (h) = i, temos que

ui(Oh(h, s$1, . . . , s$n)) % ui(Oh(h, s$1, . . . , si, . . . , s

$n)).

A definição 6.13 foi caracterizada na versão matricial na seção 6.2.3 comoa fórmula 6-5 abaixo; e na versão extensiva na seção 6.2.6 como a fórmula 6-6abaixo.

)vNT

# "i!N

P (vNT )= i ! )vSi (ui(Oh(vNT , s1, . . . , sn)) % ui(Oh(vNT , s1, . . . , vSi , . . . , sn)))

$

(6-5)

[AG]

# "i!N

i ! )vSi

.ui(Oh(h, v$S1

, . . . , v$Sn)) % ui(Oh(h, v$S1

, . . . , vSi , . . . , v$Sn

))1$

(6-6)

A fórmula 6-6 equivale a fórmula 6-8 abaixo devido a equivalência entrea quantificação universal De Re e De Dicto do operador [AG] (veja a seção5.1.1). As fórmulas 6-7 e 6-8 caracterizam a definição 6.14. Por outro lado,a fórmula 6-5 equivale a fórmula 6-7 abaixo, pois a quantificação universalsobre cada estratégia pode ser colocada anteriormente à quantificação universalsobre os históricos não-terminais, uma vez que eles quantificam sobre domíniosdiferentes. Assim, do ponto de vista da representação matricial e extensiva, asdefinições 6.13 e 6.14 são equivalentes.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 131

)vS1 . . .)vSn)vNT

#"i!N

P (vNT )= i ! (ui(Oh(vNT , s1, . . . , sn)) % ui(Oh(vNT , s1, . . . , vSi , . . . , sn)))

$

(6-7)

)vS1 . . . )vSn [AG]

# "i!N

i !.ui(Oh(h, v$S1

, . . . , v$Sn)) % ui(Oh(h, v$S1

, . . . , vSi , . . . , v$Sn

))1$

(6-8)

Para ilustrar, considere novamente o exemplo da figura 6.4 (página 128).A fórmula abaixo caracteriza equilíbrio de subjogo perfeito para a versãomatricial e é satisfeita apenas no estado ##A$, #L$$.

G! |=""A#,"L##)vNT

,(P (vNT )= 1! )vS1(u1(Oh(vNT , s1, s2)) % u1(Oh(vNT , vS1 , s2))))*

(P (vNT )= 2! )vS2(u1(Oh(vNT , s1, s2)) % u1(Oh(vNT , s1, vS2))))

-

Na versão extensiva, a fórmula de equilíbrio de subjogo perfeito abaixo ésatisfeita apenas para as funções de valorações !S1 e !S2 , onde !S1(v

$S1

) = #A$e !S2(v

$S2

) = #L$.

G!,!S1 ,!S2 |=% [AG]

,1 ! )vS1

.u1(Oh(h, v$S1

, v$S2)) % u1(Oh(h, vS1 , v

$S2

))1*

2 ! )vS2

.u2(Oh(h, v$S1

, v$S2)) % u2(Oh(h, v$S1

, vS2))1

-

Agora iremos caracterizar a definição 6.15 como fórmulas de GAL paraa versão matricial e para a versão extensiva. Esta definição supõe que osjogadores têm suas racionalidades limitadas no sentido que eles só racionalizamsuas estratégias ao longo dos históricos não-terminais resultantes das suasestratégias, desconsiderando assim a racionalidade nos outros pontos do jogo.Esta solução difere de equilíbrio de subjogo perfeito na medida em que elaconsidera apenas parte dos subjogos, e não todos como no caso de subjogoperfeito.

Na versão matricial não temos como expressar o conceito de caminho,então a fórmula de equilíbrio de Nash é definida através de uma quantifica-ção universal sobre os históricos não-terminais, no entanto, considerando asracionalidades dos jogadores somente nos históricos que resultam quando cadajogador segue sua estratégia. A caracterização é como segue abaixo.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 132

)vNT

%

&'vNT " O(s1, . . . , sn) !

# "i!N

P (vNT ) = i ! )vSi (ui(Oh(vNT , s1, . . . , sn)) % ui(Oh(vNT , s1, . . . , vSi , . . . , sn)))$

)

*+

(6-9)

Um perfil de estratégias s é um equilíbrio de Nash se, e somente se, a fórmula6-9 é satisfeita no estado que representa este perfil de estratégias. Mais a frenteiremos demonstrar que esta fórmula caracteriza equilíbrio de Nash.

Por outro lado, na versão extensiva temos como expressar caminhoatravés do operador [EG]. Dito isto, a caracterização é como segue.

[EG]

%

&'h " O(v$S1

, . . . , v$Sn) *

# "i!N

i ! )vSi

.ui(Oh(h, v$S1

, . . . , v$Sn)) % ui(Oh(h, v$S1

, . . . , vSi , . . . , v$Sn

))1$

)

*+

(6-10)

Um perfil de estratégias s = (si) é um equilíbrio de Nash se, e somente se, afórmula 6-10 é satisfeita no histórico inicial &, onde cada !Si(v

$Si

) = si. Mais afrente iremos demonstrar que esta fórmula caracteriza equilíbrio de Nash.

Para ilustrar, considere novamente o exemplo da figura 6.4 (página 128).A fórmula que caracteriza equilíbrio de Nash para a versão matricial é satisfeitano estado ##A$, #L$$ e no estado ##B$, #R$$. Assim, temos que

G! |=""A#,"L## )vNT

%

&&'

vNT " O(s1, s2) !,

(P (vNT ) = 1 ! )vS1(u1(Oh(vNT , s1, s2)) % u1(Oh(vNT , vS1 , s2))))*

(P (vNT ) = 2 ! )vS2(u1(Oh(vNT , s1, s2)) % u1(Oh(vNT , s1, vS2))))

-

)

**+

G! |=""B#,"R## )vNT

%

&&'

vNT " O(s1, s2) !,

(P (vNT ) = 1 ! )vS1(u1(Oh(vNT , s1, s2)) % u1(Oh(vNT , vS1 , s2))))*

(P (vNT ) = 2 ! )vS2(u1(Oh(vNT , s1, s2)) % u1(Oh(vNT , s1, vS2))))

-

)

**+

Na versão extensiva a fórmula de equilíbrio de Nash é satisfeita no históricoinicial quando: !S1(v

$S1

) = #A$ e !S2(v$S2

) = #L$; !S1(v$S1

) = #B$ e !S2(v$S2

) =

#R$. Assim, temos que

G!,!S1 ,!S2 |=% [EG]

,h "O(v$S1

, v$S2)*

,1 ! )vS1

.u1(Oh(h, v$S1

, v$S2)) % u1(Oh(h, vS1 , v

$S2

))1*

2 ! )vS2

.u2(Oh(h, v$S1

, v$S2)) % u2(Oh(h, v$S1

, vS2))1

--

A fórmula 6-9 equivale a fórmula 6-11 abaixo, pois a quantificaçãouniversal sobre cada estratégia pode ser colocada anteriormente à quantificaçãouniversal sobre os históricos não-terminais, uma vez que eles quantificam sobredomínios diferentes.

Mostramos na seção 5.1.1 que, para a quantificação universal do operador

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 133

[EG], temos que De Dicto implica em De Re. Assumindo que a fórmula 6-10(a prova será apresentada a seguir) representa EN, temos que se uma soluçãoé um EN, então ela satisfaz a fórmula 6-10 (versão De Dicto). Daí, usando aimplicação de De Dicto em De Re, temos que esta solução também satisfaz afórmula 6-12 (versão De Re). Por outro lado, não temos que De Re implicaDe Dicto, assim uma solução pode satisfazer a fórmula 6-12 (versão De Re)e não satisfazer a fórmula 6-10 (versão De Dicto), ou seja, a solução podenão ser um EN. Como conseqüência, a fórmula 6-12 (versão De Re) parecenão definir o conceito de EN. Contudo, isto não ocorre. A justificativa é queo operador [EG] não está escolhendo um caminho qualquer, e sim o caminhodefinido pelas estratégias. Resumidamente, temos que ambas as fórmulas 6-10e 6-12 representam o conceito de EN.

)vS1 . . .)vSn)vNT

%

&'vNT " O(s1, . . . , sn) !

# "i!N

P (vNT ) = i ! (ui(Oh(vNT , s1, . . . , sn)) % ui(Oh(vNT , s1, . . . , vSi , . . . , sn)))$

)

*+

(6-11)

)vS1 . . .)vSn [EG]

%

&'h " O(v$S1

, . . . , v$Sn) *

# "i!N

i !.ui(Oh(h, v$S1

, . . . , v$Sn)) % ui(Oh(h, (v$S1

, . . . , vSi , . . . , v$Sn

)))1$

)

*+

(6-12)

Uma última observação se faz necessária: as fórmulas a seguir são semel-hantes as fórmulas que caracterizam EN, contudo, as mesmas não restringem aracionalidade a apenas os históricos no caminho das estratégias, e sim a qual-quer caminho a partir do histórico inicial. Para os exemplos 6.5 e 6.4 as soluçõesde EN coincidem. Daí, surge a questão: essas fórmulas representam EN? Noexemplo do dilema do prisioneiro apresentado na figura 6.6 abaixo, vemos queestas fórmulas não representam EN, uma vez que as soluções ##C$, #NC,C$$ e##NC$, #C, NC$$ são satisfeitas na estrutura de GAL que representa este jogo.

De fato, em EN, a racionalidade está limitada aos históricos que ocorremno caminho das estratégias, e não a qualquer caminho. Para ver que a solução##C$, #NC, C$$ é um ‘falso’ EN veja que no estado inicial, onde o jogador1 toma uma decisão, a melhor coisa a fazer é escolher C, pois ele obterá4 em vez de 0. Por outro lado, no estado que representa o histórico (NC),a melhor escolha para o jogador 2 é C, pois ele obterá 4 ao invés de 3,caso ele escolhesse NC. Assim, temos que os caminhos &, (NC), (NC, NC)

e &, (NC), (NC,C) validam a solução. Contudo, vale observar, como ditoacima, que estes caminhos não são o caminho que, de fato, ocorre, que é

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 134

&, (C), (C, NC). Em outras palavras, a racionalidade do jogador 2 é testada noestado (NC) e não no estado que, de fato, ocorre (C). De forma semelhante,podemos demonstrar que a solução ##NC$, #C, NC$$ não é um EN.

[EG]

# "i!N

i ! )vsi

.ui(Oh(h, v$s1

, . . . , v$sn)) % ui(Oh(h, (v$s1

, . . . , vsi , . . . , v$sn

)))1$

(6-13)

)vs1 . . . )vsn [EG]

# "i!N

i !.ui(Oh(h, v$s1

, . . . , v$sn)) % ui(Oh(h, (v$s1

, . . . , vsi , . . . , v$sn

)))1$

(6-14)

#C$

#NC$

#C, C$ #C,NC$ #NC, C$ #NC, NC$

2,2 2,2 4,0 4,0

0,4 3,3 0,4 3,3

(a) - Jogo Estratégico (b) - Jogo Extensivo

2,2 4,0 0,4 3,3

C NC

C NC C NC

%1!

!!!"

##

##$%2!

!!"#

##$

%2!

!!"#

##$

Figura 6.6: Dilema do Prisioneiro na versão extensiva com informação perfeita.

Concluímos por dizer que as alternativas de quantificação De Re e DeDicto para os principais conceitos de soluções, equilíbrio de Nash e equilíbriode subjogo perfeito, para jogos extensivos são equivalentes.

Apresentamos abaixo os teoremas que garantem os mapeamentos deequilíbrio de Nash e equilíbrio de subjogo perfeito como descrito nesta seção.As provas dos mesmos são encontradas, respectivamente, nas seções B.4.2 eB.4.3 (páginas 215 e 217) do apêndice B. Fundamental, para tais provas é olema apresentado a seguir que garante a correção das definições de equilíbriode Nash 6.15 e 6.16, cuja prova é encontrada na seção B.4.1 (página 214) doapêndice B.Lema 6.2.7 As seguintes asserções são equivalentes.

1. Para todo jogador i " N temos que ui(O(s$1, . . . , s$n)) %

ui(O(s$1, . . . , si, . . . , s$n)) para todo si " Si.

2. Para todo h " O(s$1, . . . , s$n) para o qual P (h) = i vale que

ui(Oh(h, s$1, . . . , s$n)) % ui(Oh(h, s$1, . . . , si, . . . , s$n)) para todo si " Si.

3. Para todo si " Si e para todo h " O(s$1, . . . , s$n) para o qual P (h) = i

vale que ui(Oh(h, s$1, . . . , s$n)) % ui(Oh(h, s$1, . . . , si, . . . , s$n)).

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 135

Teorema 6.17 Sejam ! um jogo extensivo, s$ = (s$i ) um perfil de estratégiaspara !, G! a estrutura de GAL na versão matricial para ! como definidona seção 6.2.1, "1 a fórmula 6-9 de equilíbrio de Nash na versão De Dicto,"2 a fórmula 6-11 de equilíbrio de Nash na versão De Re, $1 a fórmula 6-5de equilíbrio de subjogo perfeito na versão De Dicto, e $2 a fórmula 6-7 deequilíbrio de subjogo perfeito na versão De Re.

1. Um perfil de estratégias s$ é um EN para ! +, G! |=s! "1.

2. Um perfil de estratégias s$ é um EN para ! +, G! |=s! "2.

3. Um perfil de estratégias s$ é um ESP para ! +, G! |=s! $1.

4. Um perfil de estratégias s$ é um ESP para ! +, G! |=s! $2.

Teorema 6.18 Sejam ! um jogo extensivo, s$ = (s$i ) um perfil de estratégiaspara !, G! a estrutura de GAL na versão extensiva para ! como definidona seção 6.2.4, "1 a fórmula 6-10 de equilíbrio de Nash na versão De Dicto,"2 a fórmula 6-12 de equilíbrio de Nash na versão De Re, $1 a fórmula 6-6de equilíbrio de subjogo perfeito na versão De Dicto, e $2 a fórmula 6-8 deequilíbrio de subjogo perfeito na versão De Re.

1. Um perfil de estratégias s$ é um EN para ! +, G!, (!Si) |=% "1, ondecada !Si(v

$Si

) = s$i .

2. Um perfil de estratégias s$ é um EN para ! +, G!, (!Si) |=% "1, ondecada !Si(v

$Si

) = s$i .

3. Um perfil de estratégias s$ é um ESP para ! +, G!, (!Si) |=% $1, ondecada !Si(v

$Si

) = s$i .

4. Um perfil de estratégias s$ é um ESP para ! +, G!, (!Si) |=% $2, ondecada !Si(v

$Si

) = s$i .

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 136

6.2.8Outras soluções para Jogos Extensivos

O que faremos nesta seção é propor soluções alternativas para jogosextensivos, e caracterizarmos através de exemplos quando estas soluções são“razoáveis” ou não. Novamente, uma solução é razoável se ela requer algum tipode racionalidade dos jogadores, no sentido que os jogadores ao tomarem suasdecisões utilizam algum processo de otimização, mesmo que este seja parcial.

Iremos considerar dois tipos de soluções: soluções que utilizam o conceitode estratégias4, como no caso de equilíbrio de subjogo perfeito; e ainda, soluçõesque se baseiam apenas nas seqüências de ações tomadas pelos jogadores(históricos terminais). Estas últimas soluções têm a finalidade de caracterizarjogadores que possuem limitações quando racionalizam sobre as possíveissoluções. Assim, ao invés de racionalizar sobre todas as possíveis estratégias,eles consideram apenas suas ações e conseqüências durante seus planos deações.

Para exemplificarmos estes conceitos, considere o jogo extensivo comomostrado na figura 6.7 na sua versão extensiva e matricial. Para este jogo, ojogador 1 tem duas estratégias #A$ e #B$, e o jogador 2 tem duas estratégias #L$e #R$. Utilizando os conceito de soluções para estratégias temos as seguintespossíveis soluções: ##A$, #L$$; ##A$, #R$$; ##B$, #L$$; e ##B$, #R$$. Note que nasolução ##B$, #L$$ o jogador 2 especificou uma ação que nunca irá se realizar,uma vez que o jogador 1 escolheu B no histórico inicial, terminando assim, ojogo no histórico terminal (B). O mesmo fato ocorre na solução ##B$, #R$$.Desta forma, algumas das soluções que iremos propor consideram apenasas seqüências das ações tomadas pelos jogadores, sem que eles tenham quedefinir ações que nunca são alcançáveis. No jogo da figura 6.7, temos apenasas soluções (B), (A,L) e (A,R), que são os históricos terminais, como soluçõesque se baseiam apenas nas seqüências das ações.

Os exemplos utilizados nesta seção estão apresentados na forma extensivae matricial de jogos extensivos com informação perfeita, contudo, quando apre-sentarmos as soluções, estaremos nos referindo a definição de jogos extensivoem GAL na versão extensiva, que foi apresentada na seção 6.2.4. Escolhemosapresentar os jogos desta forma para evitar uma notação mais densa.

Abaixo apresentamos diversos conceitos de soluções, que serão represen-tados como fórmulas de GAL, para jogos extensivos. A cada fórmula apresen-taremos uma explicação do que cada fórmula significa, bem como exemplosque ajudam a caracterizar quando estes conceitos são “razoáveis” ou não. Os

4Uma estratégia de um jogador i é uma função que atribui uma ação à cada históriconão-terminal h para o qual P (h) = i.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 137

L RA 3,2 1,1B 2,1 2,1

(a) - Representação Extensiva (b) - Representação Matricial

3, 2 1, 1

2, 1

A B

L R

%1!

!!!"

##

##$%2!

!!"#

##$

Figura 6.7: Exemplo de um jogo extensivo.

exemplos estão apresentados na figura 6.8, onde temos uma estrutura exten-siva representada do lado esquerdo, cujas utilidades estão definidas através dasvariáveis u1, u2 e u3, cujos valores são apresentados na tabela no lado direitoda figura. Cada linha da tabela representa as utilidades de cada exemplo. Noexemplo 1, as utilidades dos jogadores 1 e 2 para o histórico terminal (A,L),que é representado com u1 na figura, são 2 e 3, respectivamente, enquanto queno exemplo 3 são 2 e 1, respectivamente.

Exemplo u1 u2 u3

1 2,3 3,2 4,42 2,3 5,5 4,43 2,1 3,3 5,54 2,3 3,3 5,55 2,1 1,2 1,16 3,2 1,1 2,1

(a) - Representação Extensiva (b) - Utilidades

u1 u2

u3

A B

L R

%1!

!!!"

##

##$%2!

!!"#

##$

Figura 6.8: Exemplos de um jogo extensivo com diferentes utilidades.

– Uma solução (perfil de estratégias) (s$i ) é um ótimo de Pareto (OP)se não existe uma solução (si) tal que ela seja melhor para um jogadore, para todos os outros, ela não seja pior. Isto é expresso na seguintefórmula de GAL.

¬

%

&&'-vS1 . . .-vSn

%

&&'

# "i!N

ui(O(vS1 , . . . , vSn)) % ui(O(v$S1, . . . , v$Sn

))

$*

# (i!N

ui(O(vS1 , . . . , vSn)) > ui(O(v$S1, . . . , v$Sn

))

$

)

**+

)

**+

Esta fórmula deve ser verdadeira com cada !Si(v$Si

) = s$i .

No exemplo 2, temos como solução única ##A$, #R$$ que coincide como único equilíbrio de subjogo perfeito, apesar dos conceitos não terem

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 138

relações. No exemplo 3, temos duas soluções, que são ##B$, #L$$ e##B$, #R$$, como ótimos de Pareto.

– Uma solução (perfil de estratégias) (s$i ) é um ótimo de Pareto desubjogo perfeito (OPSP) se para cada instante, não existe uma outrasolução (si) tal que ela seja melhor para um jogador e, para todos osoutros, suas utilidades não sejam piores. Isto é expresso na seguintefórmula de GAL.

[AG]

%

&&'¬-vS1 . . . -vSn

%

&&'

# "i!N

ui(Oh(h, vS1 , . . . , vSn)) % ui(Oh(h, v$S1, . . . , v$Sn

))

$*

# (i!N

ui(Oh(h, vS1 , . . . , vSn)) > ui(Oh(h, v$S1, . . . , v$Sn

))

$

)

**+

)

**+

Esta fórmula deve ser verdadeira com cada !Si(v$Si

) = s$i .

Assim como no conceito de equilíbrio de subjogo perfeito, podemosrequerer que a solução de ótimo de Pareto seja válida em todos ossubjogos. Desta forma, se os jogadores tomam suas decisões a partir doconceito de ótimo de Pareto, então, no exemplo 3, temos que a solução##B$, #L$$ não é um ótimo de Pareto de subjogo perfeito. Para ver isto,observe que no histórico não-terminal (A) existe um perfil de estratégias,por exemplo ##B$, #R$$, onde os jogadores obtêm melhores utilidades (i.e.3 e 3 ao invés de 2 e 1).

A interpretação do conceito de OPSP é que: os jogadores irão cooperarnas suas estratégias, enquanto eles obtêm melhores ou iguais utilidades.

– Uma solução (perfil de estratégias) (s$i ) é um ótimo de Pareto dejogadores de subjogo perfeito (OPJSP), se para cada vez que umjogador i tome uma decisão, então não exista uma outra estratégia paraele tal que ela seja melhor para o jogador i e, para todos os outros, elanão seja pior. Isto é expresso na seguinte fórmula de GAL.

[AG]

%

&&'2

i!N

i ! ¬-vSi

%

&&'

.ui(Oh(h, v$S1

, . . . , vSi , . . . , v$Sn

)) > ui(Oh(h, v$S1, . . . , v$Sn

))1*

,"

j!N\{i}uj(Oh(h, v$S1

, . . . , vSi , . . . , vsn$)) % uj(Oh(h, v$S1

, . . . , v$Sn))

-

)

**+

)

**+

Esta fórmula deve ser verdadeira com cada !Si(v$Si) = s$i . No exemplo 4, a

única solução de OPSP é ##A$, #R$$. Por outro lado, no histórico (A) ojogador 2, que deve tomar uma decisão, é indiferente às suas estratégias,uma vez que ele obterá a mesma utilidade, então a solução ##A$, #L$$ étambém um ótimo de Pareto de jogadores de subjogo Perfeito.

A interpretação do conceito de OPJSP é que: cada jogador irá cooperarcom os demais, enquanto ele obtém uma utilidade melhor ou igual.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 139

Solução Exemplo 1 Exemplo 2 Exemplo 3EN ##B$, #L$$ e ##B$, #R$$ ##A$, #R$$ e ##B$, #L$$ ##B$, #L$$ e ##B$, #R$$ESP ##B$, #L$$ ##A$, #R$$ ##B$, #R$$OP ##B$, #L$$ e ##B$, #R$$ ##A$, #R$$ ##B$, #L$$ e ##B$, #R$$OPSP ##B$, #L$$ e ##B$, #R$$ ##A$, #R$$ ##B$, #R$$OPJSP ##B$, #L$$ e ##B$, #R$$ ##A$, #R$$ ##B$, #R$$Solução Exemplo 4 Exemplo 5 Exemplo 6EN ##B$, #L$$ e ##B$, #R$$ ##A$, #R$$ e ##B$, #R$$ ##A$, #L$$ e ##B$, #R$$ESP ##B$, #L$$ e ##B$, #R$$ ##A$, #R$$ e ##B$, #R$$ ##A$, #L$$OP ##B$, #L$$ e ##B$, #R$$ ##A$, #R$$ e ##A$, #L$$ ##A$, #L$$OPSP ##B$, #R$$ ##A$, #R$$ e ##A$, #L$$ ##A$, #L$$OPJSP ##B$, #L$$ e ##B$, #R$$ ##A$, #R$$ e ##A$, #L$$ ##A$, #L$$

Figura 6.9: Tabela das soluções (estratégias) do exemplo 6.8.

A tabela da figura 6.9 resume as soluções dos conceitos acima citadospara os jogos do exemplo 6.8. Vale notar que a composição destes conceitospode conduzir a soluções mais razoáveis, no sentido de tratarmos o problemade quando temos várias soluções para o mesmo conceito. Isto pode ser vistoclaramente no exemplo 5 da figura 6.8. O conceito de ESP prevê as solu-ções ##A$, #R$$ e ##B$, #R$$, enquanto que para OPSP temos como soluções##A$, #R$$ e ##A$, #L$$. Perceba que em ambos os casos temos duas soluções,enquanto se requerermos que ambos os conceitos sejam válidos, teremos apenasa solução ##A$, #R$$.

Abaixo iremos apresentar versões dos conceitos acima, que não conside-ram as estratégias dos jogadores, e sim as seqüências de ações que resultamem um histórico terminal. Como conseqüência, as soluções propostas terão ra-cionalidades limitadas, no sentido de que os jogadores só racionalizam sobreas ações tomadas e suas possíveis conseqüências a partir de cada ação. Assim,as fórmulas abaixo não farão referência às estratégias, e sim aos históricos ter-minais. Como não estaremos fazendo referência nas fórmulas as estratégias, asfunções O e Oh não serão utilizadas. Utilizaremos um predicado T que diz seum histórico é terminal ou não. Em vez dos quantificadores ) e - aplicados àsestratégias, utilizaremos os operadores modais [AG] e [EF ], respectivamente.

– Uma solução (histórico terminal) ht é um equilíbrio de subjogoperfeito tal que cada decisão tomada, em cada histórico h, é ótimanos históricos terminais a partir de h. Este conceito pode ser expresso naseguinte fórmula de GAL.

[AG]

,2

i!N

i ! [AG] (T (h) ! (ui(t) % ui(h)))

-

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 140

Esta fórmula deve ser verdadeira para !H(t) = ht para todos os estados.

– Uma solução (histórico terminal) ht é um equilíbrio de Nash desubjogo se cada decisão tomada, em cada histórico h ao longo dohistórico ht, é ótima nos históricos terminais a partir de h. Este conceitopode ser expresso na seguinte fórmula de GAL.

[EG]

,h " t *

,2

i!N

i ! [AG] (T (h) ! (ui(t) % ui(h)))

--

Esta fórmula deve ser verdadeira para !H(t) = ht no histórico inicial,i.e., em todos os estados do caminho de ht.

– Uma solução (histórico terminal) ht é um ótimo de Pareto se não existeuma solução h tal que ela seja melhor para um jogador e, para todos osoutros, ela não seja pior. Isto é expresso na seguinte fórmula de GAL.

¬-vH

,(T (vH) !

,,2

i!N

ui(vH) % ui(t)

-*

,3

i!N

ui(vH) > ui(t)

---

Esta fórmula deve ser verdadeira para !H(t) = ht.

– Uma solução (histórico terminal) ht é um ótimo de Pareto de SubjogoPerfeito se a cada instante, não existe uma solução h tal que ela sejamelhor para um jogador e, para todos os outros, ela não seja pior. Isto éexpresso na seguinte fórmula de GAL.

[AG]¬,

[EF ]

,T (h) !

,,2

i!N

ui(h) % ui(t)

-*

,3

i!N

ui(h) > ui(t)

----

Esta fórmula deve ser verdadeira para !H(t) = ht.

– Uma solução (histórico terminal) ht é um ótimo de Pareto de joga-dores de subjogo perfeito se a cada instante e para cada vez que umjogador i tome uma decisão, então não existe uma solução tal que elaseja melhor para o jogador i e, para todos os outros, ela não seja pior.Isto é expresso na seguinte fórmula de GAL.

[AG]

%

&&'2

i!N

i ! ¬[EF ]

%

&&'T (h) !

%

&&'

(ui(h) > ui(t)) *,

"j!N\{i}

uj(h) % uj(t)

-

)

**+

)

**+

)

**+

Esta fórmula deve ser verdadeira para !H(t) = ht.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 141

6.2.9Definindo funções utilizando aspectos modais e de primeira-ordem

Apesar de termos lógica de primeira-ordem e podermos utilizar funçõessobre as estruturas temporais, gostaríamos de demonstrar que podemos definiralgumas dessas funções levando em consideração a estrutura seqüencial de umjogo extensivo com informação perfeita como definido na seção 6.2.4. Iremosilustrar isto definindo uma fórmula que expressa a maximização do mínimoque um jogador pode obter a cada instante.

Lembre-se que h é um símbolo que é interpretado a cada estado comoo histórico até aquele estado. Primeiramente, representaremos abaixo umafórmula Mini com uma variável livre vMini , que representa o valor da menorutilidade do jogador i a partir de um estado.

Mini(vMini) ::=

,[EF ](T (h) * vMini = ui(h))

* [AG] (T (h) ! vMini / ui(h))

-

Note que, se quantificarmos existencialmente a fórmula acima, a mesma seráverdadeira para todos os estados, e o valor atribuído a esta variável varia deacordo com cada estado.

A fórmula abaixo representa então a maximização do mínimo que umjogador pode ganhar.

MaxMini(vMaxMini) ::=

%

&&'

(T (h) * ui(h) = vMaxMini)

!,

[EX]-vMini (Mini(vMini) * vMaxMini = vMini)

* [AX]-vMini (Mini(vMini) * vMaxMini % vMini)

-

)

**+

6.3Jogo Extensivo com Informação Quase Perfeita em GAL

Um jogo extensivo com informação quase perfeita é representado emGAL de forma semelhante a jogo extensivo com informação perfeita na versãoextensiva. Por este motivo, iremos apenas mostrar o exemplo do dilema doprisioneiro em GAL como apresentado no exemplo 6.19 abaixo (veja a figura6.10.b) e jogo extensivo com informação quase perfeita (veja figura a 6.10.a).As mesmas fórmulas que foram consideradas nas seções anteriores para jogoextensivo valem aqui5. Assim, temos abaixo que as fórmulas de equilíbrio deNash e equilíbrio de subjogo perfeito são satisfeitas apenas com as funções de

5Lembre-se que nem sempre temos uma solução para os conceitos de equilíbrio de Nashe de subjogo perfeito, a exemplo do jogo Matching Pennies.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 142

valorações !S1 e !S2 , onde !S1(v$S1

) = #C$ e !S2(v$S2

) = #C$.

G!,!S1 ,!S2 |=% )vS1)vS2 [EG]

,h " O(v$S1

, v$S2) *

,1 !

.u1(Oh(h, v$S1

, v$S2)) % u1(Oh(h, vS1 , v

$S2

))1*

2 !.u2(Oh(h, v$S1

, v$S2)) % u2(Oh(h, v$S1

, vS2))1

--

G!,!S1 ,!S2 |=% [AG]

,1 ! )vS1

.u1(Oh(h, v$S1

, v$S2)) % u1(Oh(h, vS1 , v

$S2

))1*

2 ! )vS2

.u2(Oh(h, v$S1

, v$S2)) % u2(Oh(h, v$S1

, vS2))1

-

(a) - Jogo Extensivo (b) - Estrutura de GAL

S1 = S2 = {#C$, #NC$}, R = {0, 2, 3, 4}H = {&, (#C, C$), (#C,NC$), (#NC, C$), (#NC, NC$)}T = {(#C, C$), (#C,NC$), (#NC, C$), (#NC, NC$)}

&'

()h = $

{1, 2}

##

##$

!!

!!"

--

--

---.

//

//

///0

h = ("C, C#){}

&'

()h = ("C, NC#)

{}

&'

()h = ("NC, C#)

{}

&'

()h = ("NC, NC#)

{}

&'

()

&

(#C, C$) (#C,NC$) (#NC, C$) (#NC, NC$)

2,2 4,0 0,4 3,3

*+,-

{1,2}

"C, C# "C, NC# "NC, C# "NC, NC#

11111112

33

33

3334

55

55

5556

77

77

77

78

Figura 6.10: Dilema do Prisioneiro como Jogo Extensivo com InformaçãoQuase Perfeita.

Exemplo 6.19 A estrutura de GAL para o exemplo do Dilema do Prisioneirona versão de Jogo Extensivo com Informação Quase Perfeita é definido comosegue.

– A linguagem não-lógica é #S, F, P,N$, onde

– S = {H, T, S1, S2, R}, os sorts H, T, S1, S2, R para os históricos, osterminais, as estratégias e as utilidades.

– F = {h, u1, u2, O, Oh}, temos os símbolos funcionais h :! H,u1 : T ! R, u2 : T ! R, O : S1'S2 ! T e Oh : H 'S1'S2 ! T .

– P = {%,"}, temos os símbolos predicativos %: R' R e ": H ' T .– N = {1, 2}.

– A estrutura de GAL é #SE,SEo, CA, (DH ,DT ,DS1 ,DS2 ,DR),

(he, u1, u2, O,Oh)e!SE, (%,"), (Ne)e!SE$, onde

– SE = {&, (#C, C$), (#C,NC$), (#NC,C$), (#NC, NC$)}.– SEo = {&}.– CA = {#&, (#C, C$)$, #&, (#C, NC$)$, #&, (#NC, C$)$, #&, (#NC,NC$)$}.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 143

– DS1 = DS2 = {#C$, #NC$}.– DR = {0, 2, 3, 4}.– DH = {&, (#C, C$), (#C,NC$), (#NC, C$), (#NC, NC$)}.– DT = {(#C,C$), (#C, NC$), (#NC, C$), (#NC,NC$)}.– h% = &, h("C,C#) = (#C, C$), h("C,NC#) = (#C, NC$),

h("NC,C#) = (#NC, C$), h("NC,NC#) = (#NC,NC$).– u1((#C, C$)) = 2, u2((#C,C$)) = 2,

u1((#C, NC$)) = 4, u2((#C,NC$)) = 0,u1((#NC, C$)) = 0, u2((#NC, C$)) = 4,u1((#NC, NC$)) = 3, u2((#NC, NC$)) = 3.

– N% = {1, 2}, N("C,C#) = N("C,NC#) = N("NC,C#) = N("NC,NC#) = {}.– O(#C$, #C$) = (#C,C$),

O(#C$, #NC$) = (#C,NC$),O(#NC$, #C$) = (#NC, C$),O(#NC$, #NC$) = (#NC, NC$).

– Oh(&, #C$, #C$) = (#C,C$),Oh(&, #C$, #NC$) = (#C,NC$),Oh(&, #NC$, #C$) = (#NC, C$),Oh(&, #NC$, #NC$) = (#NC, NC$),Oh((#C,C$), #C$, #C$) = (#C, C$),Oh((#C,C$), #C$, #NC$) = (#C, C$),Oh((#C,C$), #NC$, #C$) = (#C, C$),Oh((#C,C$), #NC$, #NC$) = (#C, C$),Oh((#C,NC$), #C$, #C$) = (#C, NC$),Oh((#C,NC$), #C$, #NC$) = (#C, NC$),Oh((#C,NC$), #NC$, #C$) = (#C, NC$),Oh((#C,NC$), #NC$, #NC$) = (#C, NC$),Oh((#NC, C$), #C$, #C$) = (#NC,C$),Oh((#NC, C$), #C$, #NC$) = (#NC,C$),Oh((#NC, C$), #NC$, #C$) = (#NC,C$),Oh((#NC, C$), #NC$, #NC$) = (#NC,C$),Oh((#NC, NC$), #C$, #C$) = (#NC,NC$),Oh((#NC, NC$), #C$, #NC$) = (#NC,NC$),Oh((#NC, NC$), #NC$, #C$) = (#NC,NC$),Oh((#NC, NC$), #NC$, #NC$) = (#NC,NC$).

– & " (#C,C$), & " (#C,NC$), & " (#NC, C$), & " (#NC, NC$),(#C,C$) " (#C,C$), (#C,NC$) " (#C,NC$),(#NC, C$) " (#NC, C$), (#NC, NC$) " (#NC, NC$).

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 144

6.4Jogo Extensivo com Informação Imperfeita em GAL

Um jogo extensivo com informação imperfeita é representado em GAL deforma semelhante a jogo extensivo com informação perfeita na versão extensiva.A única diferença é que o conjunto de estratégias é definido levando em contaos conjuntos de informações. As mesmas fórmulas que foram consideradas nasseções anteriores para jogo extensivo valem aqui. Lembre-se que nem sempretemos uma solução para os conceitos de equilíbrio de Nash e de subjogoperfeito, a exemplo do jogo Matching Pennies. Na seção 6.4.1, apresentaremosos conceitos de equilíbrio de estratégias mistas e comportamentais.

O exemplo do dilema do prisioneiro na versão de jogo extensivo cominformação imperfeita apresentado na figura 6.11.a é modelado na estruturade GAL (veja a figura 6.11.b) do exemplo 6.20 abaixo. Assim, abaixo temosque as fórmulas de equilíbrio de Nash e equilíbrio de subjogo perfeito sãosatisfeitas apenas para as funções de valorações !S1 e !S2 , onde !S1(v

$S1

) = #C$e !S2(v

$S2

) = #C$.

G!,!S1 ,!S2 |=% )vS1)vS2 [EG]

,h " O(v$S1

, v$S2) *

,1 !

.u1(Oh(h, v$S1

, v$S2)) % u1(Oh(h, vS1 , v

$S2

))1*

2 !.u2(Oh(h, v$S1

, v$S2)) % u2(Oh(h, v$S1

, vS2))1

--

G!,!S1 ,!S2 |=% [AG]

,1 ! )vS1

.u1(Oh(h, v$S1

, v$S2)) % u1(Oh(h, vS1 , v

$S2

))1*

2 ! )vS2

.u2(Oh(h, v$S1

, v$S2)) % u2(Oh(h, v$S1

, vS2))1

-

(a) - Jogo Extensivo (b) - Estrutura de GAL

2,2 4,0 0,4 3,3

C NC

C NC C NC

%1!

!!!"

##

##$%2!

!!"#

##$

- - - - - - - %2!

!!"#

##$

S1 = S2 = {#C$, #NC$}, R = {0, 2, 3, 4}

$

(C) (NC)

(C, C) (C, NC) (NC, C) (NC, NC)

&'

()&

'()

&'

()

h = $

{1}

h = (C)

{2}

h = (NC)

{2}

##

#$

!!

!"

###$

!!!"

###$

!!!"

h = (C, C)

{}

&'

()h = (C, NC)

{}

&'

()h = (NC, C)

{}

&'

()h = (NC, NC)

{}

&'

()

Figura 6.11: Dilema do Prisioneiro como Jogo Extensivos com InformaçãoImperfeita.

Exemplo 6.20 A estrutura de GAL para o exemplo do Dilema do Prisioneirona versão de Jogo Extensivo com Informação Imperfeita é definido como segue.

– A linguagem não-lógica é #S, F, P,N$, onde

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 145

– S = {H, T, S1, S2, R}, os sorts H, T, S1, S2, R para os históricos, osterminais, as estratégias e as utilidades.

– F = {h, u1, u2, O, Oh}, temos os símbolos funcionais h :! H,u1 : T ! R, u2 : T ! R, O : S1'S2 ! T e Oh : H 'S1'S2 ! T .

– P = {%,"}, temos os símbolos predicativos %: R' R e ": H ' T .– N = {1, 2}.

– A estrutura de GAL é #SE,SEo, CA, (DH ,DT ,DS1 ,DS2 ,DR),

(he, u1, u2, O,Oh)e!SE, (%,"), (Ne)e!SE$, onde

– SE = {&, (C), (C, C), (C, NC), (NC), (NC,C), (NC,NC)}.– SEo = {&}.– CA = {#&, (C)$, #&, (NC)$,#(C), (C, C)$, #(C), (C, NC)$, #(NC), (NC, C)$, #(NC), (NC,NC)$}.

– DS1 = DS2 = {#C$, #NC$}.– DR = {0, 2, 3, 4}.– DH = {&, (C), (C,C), (C,NC), (NC), (NC,C), (NC, NC)}.– DT = {(C, C), (C, NC), (NC, C), (NC, NC)}.– h% = &, h(C) = (C), h(NC) = (NC), h(C,C) = (C, C),

h(C,NC) = (C, NC), h(NC,C) = (NC,C), h(NC,NC) = (NC, NC).– u1((C, C)) = 2, u2((C, C)) = 2,

u1((C, NC)) = 4, u2((C, NC)) = 0,u1((NC,C)) = 0, u2((NC,C)) = 4,u1((NC,NC)) = 3, u2((NC,NC)) = 3.

– N% = {1}, N(C) = N(NC) = {2},N(C,C) = N(C,NC) = N(NC,C) = N(NC,NC) = {}.

– O(#C$, #C$) = (C, C),O(#C$, #NC$) = (C,NC),O(#NC$, #C$) = (NC, C),O(#NC$, #NC$) = (NC, NC).

– Oh(&, #C$, #C$) = (C, C),Oh(&, #C$, #NC$) = (C,NC),Oh(&, #NC$, #C$) = (NC, C),Oh(&, #NC$, #NC$) = (NC, NC),Oh((C), #C$, #C$) = (C,C),Oh((C), #C$, #NC$) = (C,NC),Oh((C), #NC$, #C$) = (C,C),Oh((C), #NC$, #NC$) = (C,NC),Oh((C, C), #C$, #C$) = (C, C),Oh((C, C), #C$, #NC$) = (C, C),Oh((C, C), #NC$, #C$) = (C, C),

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 146

Oh((C, C), #NC$, #NC$) = (C, C),Oh((NC), #C$, #C$) = (NC, C),Oh((NC), #C$, #NC$) = (NC, NC),Oh((NC), #NC$, #C$) = (NC, C),Oh((NC), #NC$, #NC$) = (NC, NC),Oh((C, NC), #C$, #C$) = (C, NC),Oh((C, NC), #C$, #NC$) = (C, NC),Oh((C, NC), #NC$, #C$) = (C, NC),Oh((C, NC), #NC$, #NC$) = (C,NC),Oh((NC, C), #C$, #C$) = (NC, C),Oh((NC, C), #C$, #NC$) = (NC, C),Oh((NC, C), #NC$, #C$) = (NC, C),Oh((NC, C), #NC$, #NC$) = (NC, C),Oh((NC, NC), #C$, #C$) = (NC, NC),Oh((NC, NC), #C$, #NC$) = (NC, NC),Oh((NC, NC), #NC$, #C$) = (NC, NC),Oh((NC, NC), #NC$, #NC$) = (NC, NC).

– & " (C, C), & " (C, NC), & " (NC, C), & " (NC,NC),(C) " (C, C), (C) " (C,NC), (NC) " (NC, C),(NC) " (NC, NC), (#C, C$) " (C, C), (#C,NC$) " (C,NC),(#NC, C$) " (NC, C) (#NC, NC$) " (NC, NC).

6.4.1Fórmulas de Equilíbrio de Estratégias Mistas e Comportamentais

Para representarmos os conceitos de equilíbrio de estratégias mistas ecomportamentais, iremos adicionar, para cada jogador i " N , os seguintesítens à definição de um jogo extensivo com informação imperfeita:

– Os sorts "i e #i para as estratégias mistas e comportamentais. Estesserão interpretados como os conjuntos de estratégias mistas e comporta-mentais, respectivamente.

– Os símbolos funcionais Ui :!

i!N "i ! R e Ui :!

i!N #i ! R, que serãointerpretados rigidamente como as funções de utilidades calculadas sobreas estratégias mistas e comportamentais, respectivamente.

Dito isto, um jogo extensivo com informação imperfeita ! =

#N, P,H, Ii, (ui)$ é representado como a seguinte estrutura de GAL#H,Ho, CA, (H, T, Si, "i, #i, R), (hh, ui, O, Oh), (%), (Nh)$ com linguagemnão-lógica #(H, T, Si, #i, "i, R) , (h :! H, ui : T ! R, O : S ! T, Oh :

H ' S ! H, Ui : Xi1 ' . . . #n ! R, U1 : "1 ' . . . "n ! R) , (%: R' R), N$.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 147

Como o conceito de equilíbrio de estratégias mistas (comportamentais)é definido sobre as estratégias mistas (comportamentais) e não utilizamossímbolos para representá-las a cada estado, utilizaremos variáveis livres paracaracterizar equilíbrio de estratégias mistas (comportamentais). Assim, afórmula de equilíbrio de Nash de estratégia mistas (comportamentais), quetem variáveis livres v$"Ai

(v$#Ai), é um equilíbrio de Nash de estratégias mistas

(comportamentais) se, e somente se, existem funções de valorações !"Ai(!#Ai

)que tornam a fórmula verdadeira.

Sejam (v$"i) e (v"i) variáveis de sorts ("i), uma fórmula de equilíbrio

de estratégias mistas é definido como segue.

"i!N)v"i(Ui(v

$"1

, . . . , v$"n) % Ui(v

$"1

, . . . , v"1 , . . . , v$"n

))

Sejam (v$#i) e (v#i) variáveis de sorts (#i), uma fórmula de equilíbrio

de estratégias comportamentais é definido como segue.

"i!N)v#i(Ui(v

$#1

, . . . , v$#n) % Ui(v

$#1

, . . . , v#1 , . . . , v$#n

))

Note que aqui estamos utilizando apenas a linguagem de primeira-ordem de GAL. Achar uma relação temporal destes conceitos que envolvemrandomização é um tópico de pesquisa que será incluído nos trabalhos futurosdesta tese.

Apresentamos abaixo os teoremas que garantem os mapeamentos deequilíbrio de Nash de estratégias mistas e comportamentais como descrito nestaseção. As provas dos mesmos são encontradas na seção B.5 (página 220) doapêndice B.

Teorema 6.21 Sejam ! um jogo extensivo com informação imperfeita, # $ =

(# $i ) um perfil de estratégias mistas para !, G! uma estrutura de GAL para !

como definido na seção 6.4.1, (!"i) funções de valorações de sorts ("i), e "1

uma fórmula de equilíbrio de estratégias mistas para G! como definido acima.

Um perfil de estratégias (# $i ) é um equilíbrio de estratégias mistas para !

+, G!, (!"i) |= "1, onde cada !"i(v$"i

) = # $i

Teorema 6.22 Sejam ! um jogo extensivo com informação imperfeita, # $ =

(# $i ) um perfil de estratégias comportamentais para !, G! uma estrutura deGAL para ! como definido na seção 6.4.1,(!#i) funções de valorações de sorts(#i), e "2 uma fórmula de equilíbrio de estratégias comportamentais para G!

como definido acima.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 148

Um perfil de estratégias (# $i ) é um equilíbrio de estratégias comportamentais para !

+, G!, (!#i) |= "2, onde cada !#i(v$#i

) = # $i

6.5Jogo de Coalizão com Utilidades Transferíveis em GAL

Um jogo de coalizão com utilidades transferíveis pode ser representadocomo uma estrutura de GAL. A idéia deste jogo é semelhante à do caso dejogo estratégico apresentada na seção 6.1. Assim, cada seqüência possível x

para N é representada por um estado x, cujo símbolo x é utilizado pararepresentar a seqüência possível que originou o estado x. Utilizamos 3 sortsNf , I, R, que são, respectivamente, interpretados como: o conjunto Nf , queé o conjunto das seqüências possíveis para N; o conjunto 2N\&, que é oconjunto das coalizões; e o conjunto dos números reais. As funções v e c sãodefinidas rigidamente como no jogo de coalizão. Formalmente, um jogo decoalizão com utilidades transferíveis como uma estrutura de GALé definido por #Nf , Nf , &, (R, Nf , 2N), (xnf

, v, c), (%), &$ com linguagem não-lógica #(R, Nf , I), (x :! Nf , v : I ! R, c : Nf ' I ! R), (%), N$.

6.5.1Fórmula de core

A idéia da representação de core como uma fórmula de GAL é semelhanteao caso de equilíbrio de Nash apresentado na seção 6.1.1. Assim, a fórmula decore será satisfeita em um estado se, e somente se, a interpretação do símbolox estiver no core.

Seja S uma variável de sort I. Uma fórmula de core é definida comosegue.

)S(c(x, S) % v(S))

No exemplo 2.27, a fórmula acima é satisfeita para as soluções x =

#13, 9, 6, 7$ e y = #10, 10, 8, 7$.Abaixo é apresentado o teorema que garante o mapeamento de core, tal

como descrito acima. A prova do mesmo é encontrada na seção B.6 (página222) do apêndice B.Teorema 6.23 Sejam ! = #N, v$ um jogo de coalizão com utilidades transferí-veis, x uma seqüência possível para N no jogo !, G! uma estrutura de GALpara ! como definido na seção 6.5 e " uma fórmula de core como definidoacima.

x está no core +, G! |=x "

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 149

6.5.2Outros Critérios e Soluções para Jogo de Coalizão com UtilidadesTransferíveis

Como o conceito de core pode ser vazio ou mesmo um conjunto enorme,outros critérios devem ser definidos para apresentarmos uma solução. Abaixolistamos alguns outros critérios, que podem ser adotados, bem como fórmulasde GAL que representam esses critérios.

– Se o core for vazio, então quanto (em percentual) devemos subsidiar acoalizão para ter uma solução?

(¬)S((c(x, S)) % v(S))) ! (-m)S(((1 + m) 0 c(x, S)) % v(S)))

– Se o agente A (no exemplo 2.27) somente aceitar participar da coalizãose ele receber pelo menos 13.

()S((c(x, S)) % v(S))) * (c(x, {A}) % 13)

Assim, a seqüência possível y = #10, 10, 8, 7$ não pertence à esta solução.

6.6Jogo Evolutivo de Coalizão com Utilidades Transferíveis

Apresentamos um modelo, onde, em vez de apenas um jogo de coalizão,consideramos uma seqüência de jogos de coalizão, ou seja, um jogo, onde acada evolução temos novas possibilidades de coalizões. Formalmente, um jogoevolutivo de coalizão com utilidades transferíveis é definido pelo par#N, (vt)t!T $, onde:

– N é o conjunto de jogadores;

– cada vt é uma função que associa um número real para cada conjuntonão-vazio dos jogadores S 1 N\& (Coalizão). Dizemos que um tempot + 1 é a evolução em tempo de t.

6.6.1Jogo Evolutivo de Coalizão com Utilidades Transferíveis em GAL

O jogo evolutivo de coalizão com utilidades transferíveis como estruturade GAL segue a idéia apresentada 6.5 com a diferença que temos uma seqüênciade seqüências x para N induzidas pelas funções vt. A linguagem não-lógicadeste jogo é a mesma do jogo e sua interpretação é também semelhante. Osort Nf é interpretado como o conjunto de todos as seqüências possíveis de N

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 150

para todas as funções vt, e as ações do jogo consideram a seqüência das funçõesvt. Para resumir, a definição formal é como segue.

Definição 6.24 Um jogo de coalizão com utilidades transferíveis édefinido por #Nf , Nf0 , A, (R, Nf , 2N), (xnft

, vt, c),%, N$ com linguagem não-lógica #(R, Nf , I), (x :! Nf , v : I ! R, c : Nf ' I ! R),%$, tal que

– Nf =4

Nft, onde Nft é o conjunto de seqüências possíveis de N dafunção vt.

– A é o conjunto das ações tal que para todo 0 / t < k #nt, nt+1$ " A ent " Nt.

– xnfté a interpretação do símbolo x no estado nft " Nft.

Como o conceito de solução de core não considera uma seqüência defunções, parece claro que uma solução para este jogo deveria considerá-la.Assim, uma solução deveria ser um seqüência de seqüências possíveis de N . Aseguinte fórmula representa está solução.

[EG])S(c(x, S) % v(S))

6.7Jogo Extensivo de Coalizão com Utilidades Transferíveis

Apresentamos uma extensão do jogo evolutivo com utilidades transferí-veis quando consideramos uma árvore de jogos de coalizão em vez de umaseqüência como apresentado na seção 6.6. Formalmente, um jogo extensivode coalizão com utilidades transferíveis é definido por #N, (vt)t!T ,2$,onde:

– N é o conjunto de jogadores;

– 2 é uma relação temporal sobre o conjunto T . Dado um instante detempo t, denotamos t + 1 todas as possíveis evoluções do tempo t.

– cada vt é uma função que associa um número real para cada conjuntonão-vazio dos jogadores S 1 N\& (Coalizão).

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 151

6.7.1Jogo Extensivo de Coalizão com Utilidades Transferíveis em GAL

A definição de jogo extensivo de coalizão com utilidades transferíveis ésemelhante à 6.6.1 considerando a estrutura extensiva em vez da estruturaseqüencial. E seu conceito de solução deveria considerar todas os ramos daestrutura extensiva, definido na seguinte fórmula:

[AG])S(c(x, S) % v(S))

6.8Jogo de Coalizão sem Utilidades Transferíveis em GAL

Um jogo de coalizão sem utilidades transferíveis ! = #N,X, v, (2i)$ podeser representado como uma estrutura de GAL. A idéia deste jogo é semelhanteà do caso de jogo de coalizão com utilidades transferíveis apresentada na seção6.5. Assim, cada conseqüência x " X é representada por um estado x, cujosímbolo x é interpretado de acordo com a conseqüência de !, que gerou oestado x. Utilizamos 3 sorts X, 2X , I, que são, respectivamente, interpretadoscomo: o conjunto X, que é o conjunto das conseqüências de !; o conjunto 2X ,que é o conjunto de todos os subconjuntos das conseqüências; e o conjunto2N\&, que é o conjunto das coalizões. Para cada coalizão I um símbolo I éutilizado para designar a coalizão, e sua interpretação é rígida. A função v édefinida como no jogo !. Os símbolos predicativos (2i) são interpretados comono jogo !. O símbolo predicativo " é definido de forma usual.

Definição 6.25 Um mapeamento de um jogo de coalizão sem utilidades trans-feríveis ! = #N,X, v, (2i)$ em uma estrutura G! de GAL é definido como segue

– A linguagem não-lógica #S, F, P,N$ é definida por

– S = {X, 2X , I}.– F = {(II :! I)I&N\%, v : I ! 2X , x :! X},– P = {(2i: X 'X)i!N , ": N ' I, ": X ' 2X}.– N = N , i.e., o conjunto dos jogadores de !.

– A estrutura é definida por G! = #SE,SEo, CA, (DX ,D2X ,DI), (II , v, xe)I&N\%, e!SE,

(2i,")i!N , (Ne)e!SE$ é definida por

– SE = X, o conjunto de estados é o conjunto de conseqüências de!.

– SEo = SE.– CA = &, pois este jogo não tem evolução.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 152

– o domínio DX de sort X é o conjunto de conseqüências X de !; odomínio D2X de sort de 2X é o conjunto de todos os conjuntos deX; o domínio DI de sort I é o conjunto de coalizões de !.

– cada símbolo II é interpretada de forma rígida em SE pelo conjuntoI 1 N\&.

– a função v é interpretada de forma rígida para todos os estados emSE como a função v do jogo !.

– para cada estado e " SE o símbolo x é interpretada pela conseqüên-cia x de ! que originou o estado e.

– o predicado " é interpretado de forma usual e iremos utilizar umabuso de notação referenciando-o da mesma forma para os símbolospredicativos ": X ' 2X e ": N ' I.

– para cada jogador i " N , o símbolo predicativo 2i é interpretadorigidamente como em 2i do jogo !.

– para cada estado e " SE, Ne = &, pois este jogo não tem evolução.

O exemplo 2.31 que foi apresentado na seção 2.7 é apresentado abaixo,bem como a definição deste jogo em GAL como definido acima.

Exemplo 6.26 O exemplo 2.31 é apresentado na sua versão de jogo decoalizão sem utilidades transferíveis e como estrutura de GAL abaixo.

– Jogo de coalizão sem utilidades transferíveis !2.31 = #N,X, v, (2i)$, onde

– N = {1, 2}.– X = {w1, w2, w3, w4, w5}.– v({1, 2}) = {w2, w3, w4}, v({1}) = {w1, w2}, v({2}) = {w4, w5}.– w1 21 w2, w2 21 w3, w3 21 w4, w4 21 w5.– w5 22 w4, w4 22 w3, w3 22 w2, w2 22 w1.

– A estrutura de GAL para o jogo 2.31 é definido porG!2.31 = #X,X, &, (X, 2X , 2N), (xX , v, {1}, {2}, {1, 2}), (21,22,"), &$ comlinguagem não-lógica #(X, 2X , I), (x :! X, v : I ! 2X , I{1} : I, I{2} :

I, I{1,2} : I), (21: X ' X,22: X ' X, ": X ' 2X , ": N ' I), {1, 2}$,onde

– 2N = {{1, 2} , {1} , {2}}.– X = {w1, w2, w3, w4, w5}.– I{1,2} = {1, 2}, I{1} = {1}, I{2} = {2}.– 2X = {{w1, w2}, {w4, w5}, {w2, w3, w4}}.– xw1 = w1, xw2 = w2, xw3 = w3, xw4 = w4, xw5 = w5.– v({1, 2}) = {w2, w3, w4}, v({1}) = {w1, w2}, v({2}) = {w4, w5}.– w1 21 w2, w2 21 w3, w3 21 w4, w4 21 w5.– w5 22 w4, w4 22 w3, w3 22 w2, w2 22 w1.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 6. Teoria dos Jogos em GAL 153

6.8.1Fórmula de core

A idéia de representar fórmula de core é semelhante ao caso de equilíbriode Nash apresentado na seção 6.1.1. Assim, a fórmula de core será satisfeitaem um estado se, e somente se, a interpretação do símbolo x estiver no core.

Sejam S, y e i variáveis de sorts I, X e N , respectivamente. Um fórmulade core para um jogo de coalizão sem utilidades transferíveis é definidacomo segue.

,x " v(IN) * ¬-vI-vy

,,vy " v(vI) *

,2

i!N

(i " vI ! ¬ (x 2i vy))

----

Para o exemplo 2.31, temos que apenas a conseqüência w3 está no core.Assim, temos a seguinte relação de satisfação.

G!2.31 |=w3

,x " v(IN) * ¬-vI-vy

,,vy " v(vI) *

,(1 " vI ! ¬ (x 21 vy))

* (2 " vI ! ¬ (x 22 vy))

----

Uma observação se faz necessária: a fórmula de CGL, que define oconceito de core, só é possível para jogos cujos conjuntos de conseqüênciassejam finitos. Por outro lado, não temos esta restrição na fórmula de GALpara o core, como definido acima. Além disto, o tamanho da fórmula de GALé muito menor do que a de CGL, como vemos claramente no exemplo 2.31.

Abaixo é apresentado o teorema que garante o mapeamento de core, talcomo descrito acima. A prova do mesmo é encontrada na seção B.7 (página222) do apêndice B.

Teorema 6.27 Sejam ! = #N,X, v, (2i)$ um jogo de coalizão sem utilidadestransferíveis, x uma conseqüência de X no jogo !, G! uma estrutura de GALpara ! como definido na seção 6.8 e " uma fórmula de core como definidoacima.

x está no core +, G! |=x "

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

7GAL versus Lógicas para Jogos

Neste capítulo iremos demonstrar que ambas as lógicas ATL e CGL sãofragmentos da lógica GAL.

7.1GAL versus ATL

Nesta seção comparamos GAL à lógica ATL. Como ATL é uma lógicaproposicional baseada também na lógica CTL, podemos defini-la através deGAL utilizando a característica de primeira-ordem de GAL. Na seção 7.1.1,mostramos como uma estrutura de jogo concorrente pode ser definida comouma estrutura de GAL. Definimos as fórmulas de ATL em fórmulas de GALna seção 7.1.2.

Antes de entrarmos em como ATL pode ser embutido na lógica GAL,gostaríamos de ilustrar que a modelagem de jogos utilizando a lógica ATLpode levar a alguns problemas. Considere o exemplo 5.3, jogo do casamento, docapítulo 5 (página 92), que é novamente apresentado na figura 7.1 abaixo. Nestejogo temos, claramente, que quando os jogadores estão casados, então existemapenas duas ações possíveis: permanecer casado; e separar. Note que esta éuma decisão conjunta do casal. Por outro lado, em ATL devemos representaros jogadores com suas ações individuais, desta forma, para termos apenasduas possibilidades neste jogo teríamos que arbitrar que um dos jogadoresdecide e outro aceita. Esta interpretação foge à intuição de que ambos osjogadores decidem se continuam ou não casados. Uma outra forma de modelaristo é considerar que cada jogador pode escolher entre permanecer casado ounão. Contudo, esta interpretação também traz alguns problemas. O primeirodeles é que devemos novamente arbitrar o que fazer quando um jogadordeseja permanecer casado e o outro deseja a separação. Alguém pode dizerque neste caso, então a interpretação usual é que eles continuam casados.Mesmo assim iremos mostrar que esta interpretação também é problemática.Abaixo apresentamos a definição do exemplo 5.3, jogo do casamento, em ATL.Representamos este jogo na figura 7.2, onde a função ! é representada pelassetas entre os estados que têm os perfis de ações rotulados nas setas. Por

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 7. GAL versus Lógicas para Jogos 155

exemplo, no estado q4 temos uma seta que tem como origem e destino omesmo estado q4. Esta seta tem 3 rótulos, !1, 1", !1, 2" e !2, 1", que representamas três transições !(q4, !1, 1") = q4, !(q4, !1, 2") = q4 e !(q4, !2, 1") = q4,respectivamente.

!"

#$

ech = solteiroecm = solteiro

{h} e0!!!"

###$!"

#$

ech = solteiroecm = solteiro

{m} e1!!!"

###$

!"

#$

ech = solteiroecm = solteiro

{} e2

!"

#$

ech = casadoecm = casado

{h,m} e3

%

% !"

#$

ech = solteiroecm = solteiro

{} e4

!"

#$

ech = separadoecm = separado

{} e5

EstadoCivil = {solteiro, casado, separado}

Figura 7.1: Estrutura de GAL para o jogo do casamento.

%&

'(HSol

MSolq1

!1, 1" !2, 1"!!!!!"

#####$%&

'(HSol

MSolq2

!1, 1" !1, 2"!!!!!!"

######$

%&

'(HSol

MSolq3

% !1, 1"

%&

'(HCas

MCasq4

%

!2, 2"

%

!1, 1"!1, 2"!2, 1" %

&'(HSol

MSolq5

% !1, 1"

%&

'(HSep

MSepq6

%!1, 1"

Figura 7.2: Estrutura de ATL para o jogo do casamento.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 7. GAL versus Lógicas para Jogos 156

Exemplo 7.1 O exemplo 5.3 (página 92), jogo do casamento, é modelado daseguinte forma C = !Q,Qo,", a, !", onde

– n = 2. O homem é representado por 1 e a mulher por 2.

–!

= {HSol,MSol, HCas, MCas, HSep, MSep}. HSol, HCas e HSep

são proposições que representam o estado civil do homem quando eleestá solteiro, casado e separado, respectivamente. As proposições MSol,MCas e MSep representam, respectivamente, os estados civis da mulher.

– Q = {q1, q2, q3, q4, q5, q6}.

– Qo = {q1}.

– "(q1) = {HSol, MSol} , "(q2) = {HSol, MSol} , "(q3) =

{HSol, MSol} , "(q4) = {HCas, MCas} , "(q5) = {HSol, MSol} ,"(q6) = {HSep, MSep}.

– – a1(q1) = 2 e a2(q1) = 1. O homem pode fazer uma propostade casamento, que é representado por 1, ou não fazê-la, que érepresentado por 2. A mulher não interfere no estado q1.

– a1(q2) = 1 e a2(q2) = 2. A mulher pode aceitar a proposta de casa-mento, que é representado por 1, ou recusá-la, que é representadopor 2. O homem não interfere no estado q2.

– a1(q3) = 1 e a2(q3) = 1. O homem e a mulher não têm nada maisa escolher.

– a1(q4) = 2 e a2(q) = 2. O homem e a mulher podem decidir sepermanecerão casados (representado por 1) ou se separarão (repre-sentado por 2).

– a1(q5) = 1 e a2(q5) = 1. O homem e a mulher não têm nada maisa escolher.

– a1(q6) = 1 e a2(q6) = 1. O homem e a mulher não têm nada maisa escolher.

– O estado q1 tem dois sucessores: !(q1, !1, 1") = q2, onde o homemfez uma proposta de casamento; e !(q1, !2, 1") = q3, onde o homemnão fez a proposta.

– O estado q2 tem dois sucessores: !(q2, !1, 1") = q4, onde a mulheraceita a proposta de casamento; e !(q2, !1, 2") = q5, onde a mulhernão aceita.

– O estado q3 tem apenas um sucessor !(q3, !1, 1") = q3, uma vez queambos os jogadores não têm mais escolhas a fazer no jogo.

– O estado q4 tem quatro sucessores: !(q4, !1, 1") = q4, onde ambosdecidem por permanecer casados; !(q4, !1, 2") = q4, onde o homemescolhe por permanecer casado, enquanto que a mulher escolhe por

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 7. GAL versus Lógicas para Jogos 157

se separar; !(q4, !2, 1") = q4, onde a mulher escolhe por permanecercasada, enquanto que o homem escolhe por se separar; !(q4, !2, 2") =

q6, onde ambos escolhem por se separarem.– O estado q5 tem apenas um sucessor !(q5, !1, 1") = q5, uma vez que

ambos os jogadores não têm mais escolhas a fazer no jogo.– O estado q6 tem apenas um sucessor !(q6, !1, 1") = q6, uma vez que

ambos os jogadores não têm mais escolhas a fazer no jogo.

Agora iremos fazer algumas análises sobre este jogo utilizando algumasfórmulas em ATL para o jogo do casamento para o estado q4, onde os jogadoresestão casados.

Inicialmente iremos apresentar algumas fórmulas para quando tanto ohomem como a mulher atuam conjuntamente. Note que esta é a mesma intuiçãode GAL e iremos apresentar as fórmulas em ATL abaixo.

– C |=q4 !!1, 2""X(HSol #MSol)

Esta fórmula é satisfeita em q4 quando as estratégias dos jogadoresatribuem ao estado q4 a ação 2.

– C |=q4 !!1, 2""X(HCas #MCas)

Esta fórmula é satisfeita em q4 quando as estratégias dos jogadoresatribuem ao estado q4 a ações 1.

Contudo, diferentemente da intuição deste jogo os jogadores possuemdiferenças entre seus possíveis comportamentos quando são analisados deforma individual. Como veremos abaixo cada jogador pode garantir que elescontinuarão casados, enquanto não podem garantir que eles se separarão.Contudo, intuitivamente não temos esta distinção, pois a separação podeocorrer de forma litigiosa, e nenhum dos jogadores pode, assim, garantirque eles irão continuar casados. Concluímos por dizer que o problema nestamodelagem está em considerarmos que os jogadores podem garantir algumaspropriedades de forma individual, o que não é o caso no jogo do casamento. Poroutro lado, devemos deixar claro que em muitos casos esta separação ocorrede forma intuitiva.

– C |=q4 !!1""X(HCas #MCas)

Esta fórmula é satisfeita em q4 quando a estratégia do jogador 1 atribuiao estado q4 a ação 1. Note que esta fórmula afirma que o jogador 1 podegarantir que os jogadores continuarão casados.

– C |=q4 !!2""X(HCas #MCas)

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 7. GAL versus Lógicas para Jogos 158

Esta fórmula é satisfeita em q4 quando a estratégia do jogador 2 atribuiao estado q4 a ação 1. Note que esta fórmula afirma que o jogador 2 podegarantir que os jogadores continuarão casados.

– C $|=q4 !!1""X(HSep #MSep)

Esta fórmula não é satisfeita em q4, pois qualquer estratégia que o jogador1 utilize o jogador 2 pode sempre garantir que eles permanecerão casados.Note que esta fórmula afirma que o jogador 1 não pode garantir que osjogadores irão se separar.

– C $|=q4 !!2""X(HSep #MSep)

Esta fórmula não é satisfeita em q4, pois qualquer estratégia que o jogador2 utilize o jogador 1 pode sempre garantir que eles permanecerão casados.Note que esta fórmula afirma que o jogador 2 não pode garantir que osjogadores irão se separar.

7.1.1Estruturas de Jogos Concorrentes como Estruturas de GAL

A idéia basicamente é colocar as ações tomadas por cada jogador naestrutura de GAL. Isto é feito utilizando símbolos constantes (ai), um paracada jogador i, tal que a sua interpretação varia de acordo com o perfil de açõestomadas pelos jogadores que originaram o novo estado. As proposições dosestados são mantidas e a relação entre eles também é preservada. Utilizamosainda um símbolo constante s para representar qual foi o estado destinatário darelação de transição que originou o novo estado. No caso dos estados iniciaisarbitramos o valor 0 para a interpretação das constantes (ai), pois eles nãoforam originados de nenhum outro estado. Antes de entrarmos nos detalhesformais de tal representação, gostaríamos que o leitor olhasse a figura 7.3,que representa o exemplo 4.7. Note que o estado inicial q na figura 7.3.a érepresentado na figura 7.3.b como o estado q com A e B representados damesma forma, s é interpretado como q, e os símbolos constantes (a1) e (a2) sãointerpretados como 0. Tomando o mesmo estado q da figura 7.3.a com o perfilde ações !1, 2", temos um estado q!1,2" na figura 7.3.b, que representa a transiçãodo estado q pelo perfil de ações !1, 2" para o estado qB. As interpretaçõesdos símbolos constantes s, a1 e a2 no estado q!1,2" são qB (o estado destinoqB = !(q, !1, 2")), 1 (a ação 1) e 2 (a ação 2), respectivamente. Note ainda queo estado q!1,2" preserva as mesmas proposições verdadeiras que o estado qB.

Formalmente, um jogo concorrente é definido como uma estrutura deGAL como segue.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 7. GAL versus Lógicas para Jogos 159

(b) - Estrutura de GAL (GAB).

(a) - Jogo Concorrente (SAB).

q

qABqA qB

q"$!#

q!1,1""$!#

q!2,1""$!#

q!2,2""$!#

q!1,2""$!#

qA!1,1""$!#

qA!1,2""$!#

qAB!1,1""$!#

qB!2,1""$!#

qB!1,1""$!#

a1 = 0a2 = 0s = q

{1, 2}

a1 = 1a2 = 1s = q

{1, 2}

a1 = 2a2 = 1s = qA

A{1, 2}

a1 = 2a2 = 2s = qAB

A B{1, 2}

a1 = 1a2 = 2s = qB

B{1, 2}

a1 = 1a2 = 1s = qA

A{1, 2}

a1 = 1a2 = 2s = qAB

A B{1, 2}

a1 = 1a2 = 1s = qAB

A B{1, 2}

%a1 = 2a2 = 1s = qAB

A B{1, 2}

a1 = 1a2 = 1s = qB

B{1, 2}

&

''

''

'(

))

))

)*

++++++++++++++++++,

%

''

''

'(

))

))

)*

------------------.

/////0

))

))

)* %

''

'''(

11

11

12%

& & 3 3

%

"$!#

"$!#

"$!#

"$!#

%

3&

% %%

!1, 1"

!1, 1"

!1, 1" !1, 1"

!1, 2" !2, 1"

!2, 2"!2, 1" !1, 2"

%

!!!!!!!!!"

#########$

A A B B

Figura 7.3: Jogo Concorrente vs. Estrutura de GAL para o exemplo 4.7.

Definição 7.2 Seja C = !Q, Qo, ", a, !" uma estrutura de jogo concorrentecom linguagem não-lógica !n, !". Uma estrutura de GAL para C é definidacomo segue.

– A linguagem não-lógica é !S, F, P,N", onde

– S = {N, Q}, um sort N para as ações dos jogadores e um sort Q

para os estados.– F = {s, (ai)}, um símbolo constante s :% Q e, para cada jogador

i & {1, . . . , n}, um símbolo constante ai :% N.– P = !, os símbolos proposicionais de C.– N = {1, . . . , n}, os jogadores de C.

– A estrutura de GAL é G = !SE,SEo, CA, (DN,DQ), (ai,e, se)i#{1,...,n},e#SE,

(pe)p#!,e#SE, (Ne)", onde

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 7. GAL versus Lógicas para Jogos 160

1. Para cada estado q & Q e cada a & A(q), um estado qa & SE.

2. SEo = Qo ' SE.

3. O domínio DQ de sort Q é o conjunto de estados Q de C; e o domínioDN de sort N é o conjunto de todos os possíveis valores das açõesdos jogadores do jogo C. Note que este conjunto é finito se o númerode perfis de ações do jogo C é finito.

4. Para cada estado e & SE, temos

(a) se =

"q, se e = q & Qo

!(q, !a1, . . . , ai, . . . , an"), se e = q!a1,...,ai,...,an" & SE

(b) Para cada jogador i, ai,e =

"0, se e = q & Qo

ai, se e = q!a1,...,ai,...,an" & SE

(c) Para cada proposição p & !, pe é verdadeiro se

i. e = q & SEo e p & "(q) ou

ii. e = qa & SE e p & "(!(q, a)).

(d) Para cada estado e$ & SE, !e, e$" & CA, se, e somente se,existem dois estados q, q$ & Q e um perfil de ações a =

!a1, . . . , ai, . . . , an" & A(q) tal que:

i. se = q.

ii. se# = !(q, a) = q$.

iii. Para cada jogador i, ai,e# = ai..

(e) Ne = {1, . . . , n}.

Denotamos "(q) ' SE como o conjunto de estados, onde se = q.

O exemplo 4.7 (página 82) é apresentado como o jogo concorrente SAB

na seção 4.1 (veja a figura 7.3.a acima) e como a seguinte estrutura de GAL(veja a figura 7.3.b acima).

Exemplo 7.3 O jogo concorrente SAB do exemplo 4.7 é definido na seguinteestrutura de GAL.

– A linguagem não-lógica é !{N, Q}, {s :% Q, a1 :% N, a2 :%N}, {A,B}, {1, 2}"

– A estrutura de GAL GAB = !SE,SEo, CA, (DN,DQ), (se, a1,e, a2,e), (Ae, Be), (Ne)",onde

– SE = {q, q!1,1" , q!2,1" , q!1,2" , q!2,2" , qA!1,1" , qA!1,2" , qB!1,1" , qB!2,1" , qAB!1,1"}.– SEo = {q}.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 7. GAL versus Lógicas para Jogos 161

– CA = {!q, q!1,1"" , !q, q!1,2"" , !q, q!2,1"" , !q, q!2,2"" , !q!1,1" , q!1,1"" ,!q!1,1" , q!1,2"" , !q!1,1" , q!2,1"" , !q!1,1" , q!2,2"" , !q!2,1" , qA!1,1"" ,!q!2,1" , qA!1,2"" , !q!2,2" , qAB!1,1"" , !qB!1,2" , qB!1,1"" , !qB!1,2" , qAB!1,1"" ,!qA!1,1" , qA!1,1"" , !qA!1,1" , qA!1,2"" , !qA!1,2" , qAB!1,1"" , !qAB!1,1" , qAB!1,1"" ,!qB!1,1" , qB!1,1"" , !qB!1,1" , qB!2,1"", !qB!2,1" , qAB!1,1""}.

– DQ = {q, qA, qB, qAB}.– DN = {0, 1, 2}.– sq = q, sq!1,1" = q, sq!2,1" = qA, sq!2,2" = qAB, sq!1,2" = qB,

sqA!1,1"= qA, sqA!1,2"

= qAB, sqAB!1,1"= qAB, sqB!2,1"

= qB,

sqB!1,1"= qB.

– a1,q = 0, a2,q = 0, a1,q!1,1" = 1, a2,q!1,1" = 1, a1,q!1,2" = 1, a2,q!1,2" = 2,a1,q!2,1" = 2, a2,q!2,1" = 1, a1,q!2,2" = 2, a2,q!2,2" = 2, a1,qA!1,1"

= 1,a2,qA!1,1"

= 1, a1,qA!1,2"= 1, a2,qA!1,2"

= 2, a1,qAB!1,1"= 1,

a2,qAB!1,1"= 1, a1,qB!2,1"

= 2, a2,qB!2,1"= 1, a1,qB!1,1"

= 1, a2,qB!1,1"= 1.

– Aq!2,1", Aq!2,2", AqA!1,1", AqA!1,2"

, AqAB!1,1", AqB!2,1"

, Bq!1,2", Bq!2,2",BqB!1,1"

, BqB!2,1", BqAB!1,1"

e BqA!1,2".

– Nq = Nq!1,1"= Nq!2,1"

= Nq!1,2"= Nq!2,2"

= NqA!1,1"= NqA!1,2"

=

NqB!1,1"= NqB!2,1"

= NqAB!1,1"= {1, 2}.

7.1.2Fórmulas de ATL como fórmulas de GAL

Uma vez definido as estruturas de jogos concorrentes nas estruturas deGAL, o próximo passo é representar as fórmulas de ATL nas fórmulas de GAL,preservando a relação de satisfação. Em outras palavras, uma fórmula de ATLé satisfeita em uma estrutura de jogo concorrente se, e somente se, a estruturade GAL (definida como na seção 7.1.1) satisfaz a fórmula de GAL (como serádefinida nesta seção).

Abaixo apresentamos uma tradução das fórmulas de ATL nas fórmulasde GAL, e ainda o teorema que garante que a tradução é correta.

Definição 7.4 Sejam p uma proposição, {i, . . . , j} um conjunto não-vazio dejogadores, vai , . . . , vaj variáveis de sort N, e # e $ fórmulas de ATL. Umatradução de uma fórmula de ATL em fórmula de GAL é uma função#, onde:

– #(p) ( p

– #(¬#) ( ¬#(#)

– #(#%$) ( #(#)% #($)

– #(!!)""X#) ([AX]#(#)

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 7. GAL versus Lógicas para Jogos 162

– #(!!{i, . . . , j}""X#) (*vai , . . . , *vaj

#[EX](vai = ai # . . . # vaj = aj)

# [AX]((vai = ai # . . . # vaj = aj) % #(#))

$

– #(!!)""G#) ( [AG]#(#)

– #(!!{i, . . . , j}""G#) ( [EG](#(#) ##(!!{i, . . . , j}""X#))

– #(!!)""(#U $)) ( A(#(#) U #($))

– #(!!{i, . . . , j}""(#U $)) ( E

###(#)#

#(!!{i, . . . , j}""X(# + $))

$U #($)

$

Abaixo listamos alguns exemplos de fórmulas de ATL para o exemplo 4.7traduzidas conforme a definição acima.

– #(!!{2}""XB) ( *va2([AX](va2 = a2 % B) # [EX](va2 = a2))

– #(!!{1, 2}""X(A#B)) ( *va1*va2

#[EX](va1 = a1 # va2 = a2)

# [AX]((va1 = a1 # va2 = a2) % (A #B))

$

– #(!!{1}""G¬A) ( [EG] (¬A # *va1([EX](va1 = a1) # [AX](va1 = a1 % ¬A)))

– #(!!{1, 2}""G¬A) ( [EG]

#¬A # *va1*va2

#[EX](va1 = a1 # va2 = a2)

#[AX](va1 = a1 # va2 = a2 % ¬A)

$$

– #(!!{2}""(¬AUB)) (

E

##¬A # *va2

#[EX](va2 = a2)

#[AX](va2 = a2 % ¬A +B)

$$U B

$

– #(!!)""(AUB)) ( A(A U B)

Antes de provarmos que a tradução acima é correta, exemplificaremoscomo o teorema, que prova que ATL pode ser embutido em GAL, funciona.Considere o exemplo 4.7, que foi apresentado na seção anterior em ATL e emGAL (veja a figura 7.3). Veja que a fórmula de ATL !!{2}""XB é satisfeitana estrutura SAB no estado q, quando o jogador 2 escolhe a ação 2. A fórmulade GAL (traduzida de acordo com a definição acima) *va2([AX](va2 = a2 %B)# [EX](va2 = a2)) é satisfeita nos estados q e q!1,1", que são os estados ondes = q, da estrutura GAB quando atribui-se a variável va2 o valor 2.

A fórmula !!{1}""G¬A é satisfeita na estrutura SAB nos estados q e qB.No estado qB o jogador 1 decide pela estratégia 1, enquanto que o jogador 2

só tem a opção de escolher 1, permanecendo desta forma no estado qB, ondenão vale A. Por outro lado, no estado q (onde também não vale A) o jogador1 usando novamente a estratégia 1 pode permanecer no estado q (quando ojogador 2 escolhe 1) ou então ir para o estado qB (quando o jogador 2 escolhe

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 7. GAL versus Lógicas para Jogos 163

2). Assim, em ambos os casos não vale A. A fórmula de GAL (traduzida comoacima)

[EG] (¬A # *va1([EX](va1 = a1) # [AX](va1 = a1 % ¬A)))

é satisfeita nos estados q, q!1,1", q!1,2" e qB!1,1" , que são os estados traduzidos apartir de q e qB.

Fundamental para a prova abaixo, é a observação de que dado umaestrutura de jogo concorrente a tradução dela em estrutura de GAL é reversível,ou seja, a definição pode ser utilizada no outro sentido. Note que não estamosafirmando que qualquer estrutura de GAL pode ser definida de forma inversaa uma estrutura de jogo concorrente.

Por simplicidade estamos utilizando a definição 4.4 de estratégias comojogo de lembrança imperfeita, uma vez que para o propósito de ATL estadefinição é suficiente.

Teorema 7.5 Sejam C uma estrutura de jogo concorrente, q um estado emC, # uma fórmula de ATL, G uma estrutura de GAL para C (como definidona seção 7.1.1), "(q) um conjunto de estados em G com se = q, e #(#) umfórmula de GAL para # como definido nesta seção. Para todo e & "(q) temosque

C |=q # ,- G |=e #(#)

Prova. Sejam (vai) variáveis, uma para cada jogador i & N , de sort N e %N umafunção de sort N. Iremos provar por indução no tamanho da fórmula tomandoum estado qualquer e & "(q).

– Base: C |=q p ,- G |=e p, pela definição de G a partir de C.

– Passo Indutivo:

– Caso C |=q ¬# ,- G |=e #(¬#)

C |=q ¬#

,-def4.6 NÃO C |=q #

,-H.I. NÃO G |=e #(#).

,-def5.9 G |=e ¬#(#).

,-def7.4 G |=e #(¬#).

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 7. GAL versus Lógicas para Jogos 164

– Caso C |=q (# % $) ,- G |=e #(# % $)

C |=q (# % $)

,-def4.6 SE C |=q # ENTÃO C |=q $

,-H.I. SE G |=e #(#) ENTÃO G |=e #($)

,-def5.9 G |=e #(#) % #($).

,-def7.4 G |=e #(# % $).

– Caso C |=q !!)""X# ,- G |=e #(!!)""X#)

C |=q (!!)""X#)

,-def4.6 Em todos os caminhos & & $(q, )) vale C |=!1 #

,-def4.5 para todo a & A(q) temos que &1 = !(q, a) vale C |=!1 #

,-H.I. para todo a & A(q) temos que &1 = !(q, a) vale G |=e1 #(#).

Pela definição 7.2 item 4.d temos que !e, e1" & CA se, e somente se,!(q, a) = &1, se = q, se1 = &1 e, para todo jogador i, vale ai,e1 = ai.Daí, segue que

,- para todo e1 tal que !e, e1" & CA vale G |=e1 #(#).

,-def5.9 G |=e [AX]#(#).

,-def7.4 G |=e #(!!)""X#).

– Caso C |=q !!I""X# ,- G |=e #(!!I""X#)

C |=q !!I""X#

,-def4.6 existe um SI de estratégias, uma para jogador em i & I,

tal que em todos os caminhos & = q0, q1, . . . & $(q, SI) vale C |=q1 #.

,-def4.5 existe um SI de estratégias, uma para jogador em i & I,

tal que existe uma ação a = !a1, . . . , an" & A(q)

tal que ai = si(q) e !(q, a) = q1 vale C |=q1 #.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 7. GAL versus Lógicas para Jogos 165

,-H.I. existe um SI de estratégias, uma para jogador em i & I,

tal que existe uma ação a = !a1, . . . , an" & A(q)

tal que ai = si(q) e !(q, a) = q1 vale

G |=e1 #(#).

(7-1)

Para todo estado e & "(q) pela definição 7.2 item 4.d temos que!e, e1" & CA se e somente se se = q, se1 = !(q, a) e, para todojogador i & N , vale ai,e1 = ai. Para cada estado e1 temos duaspossibilidades em relação a intepretação das constantes das açõestomadas pelos jogadores i & I.

1. Elas são interpretadas como as funções de estratégias (i.e., paratodos os jogadores i em I vale ai = si(q)). E a partir da equação7-1 temos que

G,%N(vai|si(q), . . . , vaj |sj(q)) |=e1 ((vai = ai # . . . # vaj = aj) % #(#))

(7-2)

G,%N(vai|si(q), . . . , vaj |sj(q)) |=e [EX](vai = ai # . . . # vaj = aj)

(7-3)

2. Elas são diferentes das estratégias dos jogadores i & I, daítemos que

G,%N(vai|si(q), . . . , vaj |sj(q)) $|=e1 (vai = ai # . . . # vaj = aj)

(7-4)

Daí, pela definição 5.9, temos que

G,%N(vai|si(q), . . . , vaj |sj(q)) |=e1 ((vai = ai # . . . # vaj = aj) % #(#))

(7-5)

A partir de 7-2 e 7-5, temos que

Para todo e1 tal que !e, e1" & CA

vale G,%N(vai|si(q), . . . , vaj |sj(q)) |=e1 (vai = ai # . . . # vaj = aj) % #(#)

,- G,%N(vai|si(q), . . . , vaj |sj(q)) |=e [AX]((vai =ai # . . . # vaj =aj) % #(#))

(7-6)

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 7. GAL versus Lógicas para Jogos 166

A partir de 7-3, 7-6 e da definição 5.9 temos que

G,%N(vai|si(q), . . . , vaj |sj(q)) |=e

#[EX](vai =ai # . . . # vaj =aj)

# [AX]((vai =ai # . . . # vaj =aj) % #(#))

$

,-def5.9 G |=e*vai , . . . , *vaj

#[EX](vai =ai # . . . # vaj =aj)

# [AX]((vai =ai # . . . # vaj =aj) % #(#))

$

,-def7.4 G |=e #(!!I""#)

– Caso C |=q !!)""G# ,- G |=e #(!!)""G#)

C |=q (!!)""G#)

,-def4.6 em todos os caminhos & & $(q, )) e para todo k . 0 vale C |=!k#

,-def4.5 em todos os caminhos a partir de q e para todo k . 0,

existe um a = !a1, . . . , an" & A(q) tal que, para cada jogador i & N,

se ai = si(&k) e &k+1 = !(&k, a), vale que C |=!k#

,-H.I. em todos os caminhos a partir de q e para todo k . 0,

existe um a = !a1, . . . , an" & A(q) tal que, para cada jogador i & N,

se ai = si(&k) e &k+1 = !(&k, a), vale que G |=ek#(#)

Pela definição 7.2 item 4.d temos que !ek, ek+1" & CA se, e somentese, !(&k, a) = &k+1, se = &k, sek+1

= &k+1 e, para todo jogadori & N , vale ai,ek+1

= ai. Daí, segue que

,- em todos os caminhos a partir de e tal que "(e) = (e0, e1, . . .)

vale, para todo k . 0, que G |=ek#(#).

,-def5.9 G |=e [AG]#(#).

,-def7.4 G |=e #(!!)""G#).

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 7. GAL versus Lógicas para Jogos 167

– Caso C |=q !!I""G# ,- G |=e #(!!I""G#)

C |=q (!!I""G#)

,-def4.6 existe um SI de estratégias, uma para cada jogador i & I, tal que

em todos os caminhos & & $(q, SI) e para todo k . 0, vale que C |=!k#

,-def4.6 em todos os caminhos & & $(q, SI) e para todo k . 0,

existe um a = !a1, . . . , an" & A(&k) tal que, para todo jogador i & I,

se ai = si(&k) e &k+1 = !(&k, a), vale que C |=!k#

,-H.I. em todos os caminhos & & $(q, SI)e para todo k . 0,

existe um a = !a1, . . . , an" & A(&k) tal que, para cada jogador i & N,

se ai = si(&k) e &k+1 = !(&k, a), vale que G |=ek#(#). (7-7)

Para todo estado e & "(q) temos pela definição 7.2 item 4.d que"(e) = e0, e1, . . . se e somente se e = e0 e para todo k . 0 temosque !ek, ek+1" & CA, no qual existem dois estados qk, qk+1 & Q e uma = !a1, . . . , an" & A(qk) tal que sek

= qk, sek+1= qk+1 = !(qk, a) e,

para todo jogador i & I, vale ai,ek+1= ai.

Iremos tomar apenas os caminhos que ocorrem em G a partirda equação 7-7, que iremos denotá-los por "SI (e), i.e., "SI (e) =

e0, e1, . . ., no qual e = e0 e para todo k . 0 temos que !ek, ek+1" &CA com a propriedade de que existe um caminho & = q0, q1, . . . &$(q, SI) no qual existe um a = !a1, . . . , an" & A(&k) tal que!(&k, a) = &k+1, sek

= &k, sek+1= &k+1 e, para todo jogador i & I,

vale ai,ek+1= ai = si(&k). Daí, temos que

,- Para todo caminho "SI (e) = (e0, e1, . . .) e para todo k . 0,

vale que G |=ek#(#) (7-8)

Assim, temos que as equações 7-9 e 7-10 valem.

Para todo caminho "SI (e) = (e0, e1, . . .) e para todo k . 0, vale, que

G,%N(vai|si(&k), . . . , vaj |sj(&k)) |=ek+1((vai = ai # . . . # vaj = aj) % #(#))

(7-9)

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 7. GAL versus Lógicas para Jogos 168

Para todo caminho "SI (e) = (e0, e1, . . .) e para todo k . 0, vale, que

G,%N(vai|si(&k), . . . , vaj |sj(&k)) |=ek[EX](vai = ai # . . . # vaj = aj)

(7-10)

Por outro lado, nos outros estados ek+1 & SE que não ocorrem noscaminhos "SI (e) tal que !ek, ek+1" & CA temos que as interpretaçõesdas constantes (ai)i#I dos jogadores não são iguais as estratégiasdefinidas por SI . Daí, segue que

G,%N(vai|si(&k), . . . , vaj |sj(&k)) $|=ek+1(vai = ai # . . . # vaj = aj)

Daí, pela definição 5.9, temos que

G,%N(vai|si(&k), . . . , vaj |sj(&k)) |=ek+1((vai = ai # . . . # vaj = aj) % #(#))

(7-11)

Assim, por 7-11 e 7-9, temos que

Para todo caminho "SI (e) = (e0, e1, . . .) e para todo k . 0, vale que

G,%N(vai|si(&k), . . . , vaj |sj(&k)) |=ek[AX]((vai = ai # . . . # vaj = aj) % #(#))

(7-12)

Assim, por 7-9 e 7-12, temos que

Para todo caminho "SI (e) = (e0, e1, . . .) e para todo k . 0,

vale que

G,%N(vai|si(&k), . . . , vaj |sj(&k)) |=ek

#[EX]((vai =ai # . . . # vaj =aj)

#[AX]((vai =ai # . . . # vaj =aj) % #(#))

$

,-def5.9 Para todo caminho "SI (e) = (e0, e1, . . .) e para todo k . 0,

vale que G |=ek*vai . . . *vaj

#[EX]((vai =ai # . . . # vaj =aj)

#[AX]((vai =ai # . . . # vaj =aj) % #(#))

$

,-def7.4 Para todo caminho "SI (e) = (e0, e1, . . .) e para todo k . 0,

vale que G |=ek#(!!I""#) (7-13)

Pelas equações 7-8 e 7-13 utilizando a definição 5.9 temos que

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 7. GAL versus Lógicas para Jogos 169

Para todo caminho "SI (e) = (e0, e1, . . .) e para todo k . 0,

vale que G |=ek(#(#) ##(!!I""#))

,-def5.9 G |=e [EG] (#(#) ##(!!I""X#)) .

,-def7.4 G |=e #(!!I""G#).

– Caso C |=q !!)""(#U$) ,- G |=e #(!!)""(#U$))

C |=q !!)""(#U$)

,-def4.6 em todos os caminhos & & $(q, )), existe um k . 0 tal que C |=!k$

e para todo 0 / l < k, vale que C |=!l#

,-def4.5 em todos os caminhos & & $(q, )), existe um k . 0 tal que

C |=!k$ e para todo 0 / l < k, existe um a = !a1, . . . , an" & A(&l)

tal que, para cada jogador i & N, se si(&l) = ai e &l+1 = !(&l, a),

vale que C |=!l#

,-H.I. em todos os caminhos & & $(q, )), existe um k . 0 tal que

G |=ek#($) e para todo 0 / l < k,

existe um a = !a1, . . . , an" & A(&l) tal que, para cada jogador i & N,

se si(&l) = ai e &l+1 = !(&l, a), vale que G |=el#(#)

Pela definição 7.2 item 4.d temos que !ek, ek+1" & CA se, e somentese, !(&k, a) = &k+1, se = &k, sek+1

= &k+1 e, para todo jogadori & N , vale ai,ek+1

= ai. Daí, segue que

em todos os caminhos "(e) = e0, e1, . . . , existe um k . 0 tal que

G |=ek#($) para todo 0 / l < k,

vale que G |=el#(#)

,-def5.9 G |=ekA(#(#)U#($))

,-def7.4 C |=!k!!)""(#U$)

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 7. GAL versus Lógicas para Jogos 170

– Caso C |=q !!I""(#U$) ,- G |=e #(!!I""(#U$))

C |=q !!I""(#U$)

,-def4.6 existe um SI de estratégias, uma para cada jogador i & I, tal que

em todos os caminhos & & $(q, SI), existe um k . 0 tal que C |=!k$

e para todo 0 / l < k, vale que C |=!l#

,-def4.5 em todos os caminhos & & $(q, SI), existe um k . 0 tal que

C |=!k$ e para todo 0 / l < k, existe um a = !a1, . . . , an" & A(&l)

tal que, para cada jogador i & I, se si(&l) = ai e &l+1 = !(&l, a),

vale que C |=!l#

,-H.I. em todos os caminhos & & $(q, SI), existe um k . 0 tal que

G |=ek#($) para todo 0 / l < k,

existe um a = !a1, . . . , an" & A(&l) tal que, para cada jogador i & I,

se si(&l) = ai e &l+1 = !(&l, a), vale que G |=el#(#) (7-14)

Para todo estado e & "(q) temos pela definição 7.2 item 4.d que"(e) = e0, e1, . . . se e somente se e = e0 e para todo k . 0 temosque !ek, ek+1" & CA, no qual existem dois estados qk, qk+1 & Q e uma = !a1, . . . , an" & A(qk) tal que sek

= qk, sek+1= qk+1 = !(qk, a) e,

para todo jogador i & I, vale ai,ek+1= ai.

Iremos tomar apenas os caminhos que ocorrem em G a partir daequação 7-14, que iremos denotá-los por "SI (e), i.e., "SI (e) =

e0, e1, . . ., no qual e = e0 e para todo k . 0 temos que !ek, ek+1" &CA com a propriedade de que existe um caminho & = q0, q1, . . . &$(q, SI) no qual existe um a = !a1, . . . , an" & A(&k) tal que!(&k, a) = &k+1, sek

= &k, sek+1= &k+1 e, para todo jogador i & I,

vale ai,ek+1= ai = si(&k). Daí, temos que

Para todo "SI (e) = e0, e1, . . . , existe um k . 0 tal que

G |=ek#($) (7-15)

e para todo 0 / l < k, existe um a = !a1, . . . , an" & A(&l) tal que,

para cada jogador i & I, se si(&l) = ai e &l+1 = !(&l, a),

vale que G |=el#(#) (7-16)

Assim, temos que as equações 7-17 e 7-18 valem.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 7. GAL versus Lógicas para Jogos 171

Para todo caminho "SI (e) = (e0, e1, . . .) existe um k . 0 tal que

para todo 0 / l < k, vale que

G,%N(vai|si(&l), . . . , vaj |sj(&l)) |=el[EX](vai = ai # . . . # vaj = aj)

(7-17)

Para todo caminho "SI (e) = (e0, e1, . . .) existe um k . 0 tal que

para todo 0 / l < k, vale que

G,%N(vai|si(&l), . . . , vaj |sj(&l)) |=el+1((vai = ai # . . . # vaj = aj) % (#(# + $)))

(7-18)

Por outro lado, para todo 0 / l < k e para os outros estados el+1 &SE que não ocorrem nos caminhos "SI (e) tal que !el, el+1" & CAtemos que as interpretações das constantes (ai)i#I dos jogadores nãosão iguais as estratégias definidas por SI . Daí, segue que

G, %N(vai|si(&l), . . . , vaj |sj(&l)) $|=el+1(vai = ai # . . . # vaj = aj)

Daí, pela definição 5.9, temos que

G,%N(vai|si(&l), . . . , vaj |sj(&l)) |=el+1((vai = ai # . . . # vaj = aj) % #(# + $))

(7-19)

Assim, por 7-18 e 7-19 temos que

Para todo caminho "SI (e) = (e0, e1, . . .) existe um k . 0 tal que

para todo 0 / l < k, vale que

G,%N(vai|si(&l), . . . , vaj |sj(&l)) |=el[AX]((vai = ai # . . . # vaj = aj) % #(# + $))

(7-20)

Assim, por 7-17 e 7-20 temos que

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 7. GAL versus Lógicas para Jogos 172

Para todo caminho "SI (e) = (e0, e1, . . .) existe um k . 0 tal que

para todo 0 / l < k, vale que

G,%N(vai|si(&l), . . . , vaj |sj(&l)) |=el

#[EX]((vai =ai # . . . # vaj =aj)

#[AX]((vai =ai # . . . # vaj =aj) % #(# + $))

$

,-def5.9 Para todo caminho "SI (e) = (e0, e1, . . .) existe um k . 0 tal que

para todo 0 / l < k, vale que

G |=el*vai . . . *vaj

#[EX]((vai = ai # . . . # vaj = aj)

#[AX]((vai = ai # . . . # vaj = aj) % #(# + $))

$

,-def7.4 Para todo caminho "SI (e) = (e0, e1, . . .) existe um k . 0 tal que

para todo 0 / l < k, vale que

vale que G |=el#(!!I""(# + $)) (7-21)

Assim, por 7-16 e 7-21 temos que

Para todo caminho "SI (e) = (e0, e1, . . .) existe um k . 0 tal que

para todo 0 / l < k, vale que G |=el#(#) ##(!!I""(# + $))

(7-22)

Assim, por 7-15 e 7-22 temos que

Para todo caminho "SI (e) = (e0, e1, . . .), existe k . 0, tal que G |=ek#($)

e para todo 0 < l / k, vale que G |=el(#(#) ##(!!I""(# + $)))

,-def5.9 G |=e E ((#(#) ##(!!I""X(# + $)))U#($)) .

,-def7.4 G |=e #(!!I""(#U$).

!

7.2GAL versus CGL

Iremos demonstrar que, assim como ATL, a lógica CGL pode ser definidaem GAL. Para tanto, utilizaremos a representação de um jogo de coalizão semutilidades transferíveis em GAL como definido na seção 6.8. As fórmulas deCGL são traduzidas como segue.

Definição 7.6 Sejam $ = !N, X, v, (0i)" um jogo de coalizão sem utilidadestransferíveis, w e w$ conseqüências de $, i um jogador de $, I um conjunto dejogadores de $, # e $ fórmulas de CGL, e vX uma variável de sort X. Uma

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 7. GAL versus Lógicas para Jogos 173

tradução de uma fórmula de CGL em fórmula de GAL é uma função#, onde

– #(w) ( x = w.

– #(w 0i w$) ( w 0i w$.

– #(¬#) ( ¬#(#)

– #(# % $) ( #(#) % #($)

– #(!!I""#) ( *vX(vX & v(I) # (x = vX % #(#)).

Teorema 7.7 Sejam $ = !N, X, v, (0i)" um jogo de coalizão sem utilidadestransferíveis, #o e #c fórmulas de CGL para linguagem %o e %c de CGL geradapela linguagem não-lógica !N, X" (a mesma do jogo $), G" uma estrutura deGAL para o jogo $ definida como na seção 6.8, e # uma função como definidoacima.1

1. $ |=w #o ,- G" |=w #(#o)

2. $ |= #c ,- G" |= #(#c)

Prova. Ambas as provas abaixo serão feitas por indução no tamanho de #.

1. $ |=w #o ,- G" |=w #(#o)

– Base: $ |=w w$ ,- G" |=w x = w$ Pela definição de G" temosque no estado w a constante x é interpretada como w$. A partir daíaplicando a definição 7.6 temos que $ |=w w$ ,- G" |=w #(w$)

– Passo Indutivo:

– Caso: $ |=w ¬#o ,- G" |=w #(¬#o)

$ |=w ¬#o

,-def4.11 NÃO $ |=w ¬#o

,-H.I. NÃO G" |=w #(#o)

,-def5.9 G" |=w ¬#(#o)

,-def7.6 G" |=w #(¬#o)

1w em ! |=w !o significa uma conseqüência do jogo !, enquanto que o w de G! |=w "(!o)é o estado da estrutura de GAL correspondente ao w do jogo ! via definição de estruturade GAL a partir de !.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 7. GAL versus Lógicas para Jogos 174

– Caso: $ |=w #o % $o ,- G" |=w #(#o % $o)

$ |=w #o % $o

,-def4.11 SE $ |=w #o ENTÃO $ |=w $o

,-H.I. SE G" |=w #(#o) ENTÃO G" |=w #($o)

,-def5.9 G" |=w #(#o) % #($o)

,-def7.6 G" |=w #(#o % $o)

2. Esta prova é semelhante à anterior, portanto iremos tratar apenas oseguinte caso: $ |= !!I""#c ,- G" |= #(!!I""#c)

$ |= !!I""#c

,-def4.11 *w & v(I) tal que $ |=w #c (7-23)

Seja %X uma função de valoração de sort X. Como w é um estado de G",a função v é interpretada como em $, I é uma constante interpretadacomo o conjunto I de jogadores e o predicado & tem a intepretação usualtemos que

G", %X(vX |w) |= vX & v(I) (7-24)

Para todo estado w$ & X temos duas possibilidades:

– G",%X(vX |w) $|=w# x = vX Daí, claramente, pela definição dasemântica de GAL e pela equação 7-24, temos que

G",%X(vX |d) |=w# (vX & v(I) # (x = vX % #(#c)))

,-def5.9 G" |=w# *vX(vX & v(I) # (x = vX % #(#c)))

,-def7.6 G" |=w# #(!!I""#c) (7-25)

– G",%X(vX |w) |=w# x = vX . Daí, no estado w$ a partir de 7-23 e apartir do item 1 deste teorema, temos que

G", %X(vX |d) |=w# (x = vX % #(#c)) (7-26)

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 7. GAL versus Lógicas para Jogos 175

E por 7-24 e 7-26 temos que

G",%X(vX |d) |=w# (vX & v(I) # (x = vX % #(#c)))

,-def5.9 G" |=w# *vX(vX & v(I) # (x = vX % #(#c)))

,-def7.6 G" |=w# #(!!I""#c) (7-27)

Daí, a partir de 7-25 e 7-27, temos que

G" |= #(!!I""#c)

!

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

8Experimentos

Neste capítulo tratamos da utilização do verificador de modelos naprática, e realizamos algumas comparações entre outros algoritmos existentes.Os experimentos foram executados em uma máquina com processador 2.4GHzCeleron com 512 MBytes de RAM, rodando Windows XP Home Edition.No sítio http://www.tecmf.inf.puc-rio.br/DaviRomero descrevemos como overificador de modelos pode ser executado para cada tipo de jogo desenvolvidoneste capítulo.

8.1Teoria dos Jogos no GALV

Nesta seção, iremos apresentar como podemos achar as soluções da Teoriados Jogos utilizando o verificador de modelos GALV.

Diversos algoritmos para o problema de encontrar equilíbrio de Nash sãopropostos na literatura (veja (MM96)). A maioria deles computa equilíbrio deNash de estratégias mistas. No entanto, a complexidade permaneceu descon-hecida por muito tempo (Pap01), e, somente recentemente, foi demonstradoem (DGP06) que o problema é PPAD-Completo1 para 4 jogadores. Gambit(MT03) é o melhor software conhecido para Teoria dos Jogos e implementaquase todos os algoritmos. Utilizamos o Gambit (com seu método EnumPu-reSolve) e o GALV para computar os equilíbrios de Nash. Na figura 8.1, mos-tramos o tempo de execução de vários jogos estratégicos com dois jogadoresquando consideramos as utilidades geradas de forma aleatória (figura 8.1.a) ouutilizando um valor constante (figura 8.1.b), por exemplo, zero.

Como só utilizamos modelos finitos e o conjunto de possíveis equilíbriosde estratégias mistas é infinito, não temos como achar o conjunto de equilíbriosde estratégias mistas2. Contudo, podemos verificar se dado uma solução, ela éou não um equilíbrio. Desta forma, não temos como comparar a nossa soluçãocom o Gambit.

1PPAD-Completo é a classe de problemas de busca NP para qual é garantido a existênciade pelo menos uma solução.

2Na verdade, poderíamos definir uma função que retorna o conjunto de equilíbrios deNash de estratégias mistas e implementá-la no verificador.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 8. Experimentos 177

0 5

10 15 20 25 30 35 40 45 50

0 200 400 600 800 outcomes

time

(sec

onds

)

GAL Gambit

0 50

100 150

200 250 300

0 200 400 600 800 outcomes

time

(sec

onds

)

GAL Gambit

(a) - utilidades aleatórias (b) - utilidades constantes

Figura 8.1: Jogos estratégicos com dois jogadores.

O verificador de modelos também foi utilizado para encontrar os equilí-brios de nash e de subjogo perfeito em jogo extensivos com informação perfeitatanto na versão matricial quanto na versão extensiva.

Assim como o problema de encontrar equilíbrio de Nash, o problema deencontrar o core é também uma tarefa difícil. Em (CS04) é demonstrado quemesmo verificar que uma seqüência possível de N está no core é um problemaNP-completo. Utilizamos o nosso algoritmo para encontrar o core, quandoconsideramos somente soluções inteiras. Esta restrição deve-se novamente aofato de tratarmos apenas jogos de modelos finitos no nosso algoritmo. Apesarde ser possível utilizar um solver 3 para achar uma solução pertencente ao core,não parece ser tão simples definir outros critérios, como definidos na seção 6.5.Além disso, em muitos problemas estamos interessados em apenas soluçõesinteiras.

O tempo de execução para achar o core no exemplo 2.27 foi de 2.144segundos. A figura abaixo mostra todas as soluções inteiras para este problema.O tempo de execução, quando adicionamos a restrição para o agente A, foi de2.274 segundos.

8.2SMV vs. GALV

Em (Vas03, VH03) é proposta uma linguagem para descrever jogos, cha-mada de RollGame, bem como uma tradução para a linguagem do verificadorde modelos SMV. A partir daí, o SMV pode ser utilizado para demonstrar pro-priedades de jogos. O exemplo do jogo da velha é utilizado para ilustrar comoas ações de um dos jogadores, que segue certa estratégia, consegue garantir queele nunca perderá. O outro jogador não possui estratégia, desta forma, todas aspossibilidades para ele são levadas em consideração. A representação deste jogose deu através do tabuleiro, e as ações tomadas anteriormente (histórico) não

3Solver é uma ferramenta para problemas de programação linear.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 8. Experimentos 178

Agente A Agente B Agente C Agente D10 10 7 811 9 6 911 9 7 811 10 6 811 10 7 711 11 6 712 8 7 812 8 8 712 9 6 812 9 7 712 10 5 812 8 7 813 8 7 713 9 6 7

Figura 8.2: Solução core para o exemplo 2.27.

são representadas no jogo. Na visão da Teoria dos Jogos, esta representaçãoé um jogo extensivo com informação imperfeita equivalente (veja seção 2.5),tomamos assim a sua representação na forma de um jogo extensivo reduzido.Contudo, devemos ressaltar que a partir de cada estado é possível obter todasas possíveis evoluções do jogo. Isto se deve ao fato típico de que jogos como ojogo da velha possuem subjogos equivalentes.

A fórmula utilizada para expressar que o jogador ‘x’ sempre ganhará ouempatará é definida abaixo.

[AF ](winX ! draw),

onde winX e draw são proposições que verificam se o jogador ‘x’ ganhou eempatou, respectivamente.

Modelamos o mesmo exemplo, jogo da velha, no verificador de modelosde GAL, e o desempenho para verificar a fórmula acima foi muito superior0.001 segundos contra 54.719 segundos da abordagem utilizando o verificadorde modelos SMV. Esta diferença deve-se ao fato do modelo construído peloverificador de modelos de GAL ser bem menor do que no caso do SMVutilizando OBDD. O mesmo fato ocorreu quando utilizamos um exemplo sobrea possibilidade da guerra no Iraque definido também em (Vas03, VH03).

Apesar dos exemplos acima citados demonstrarem que o verificador demodelos de GAL foi superior ao SMV, não podemos concluir que isto sempreocorrerá. Na verdade, o que acontece é que a representação explícita destesjogos é muito menor do que a representação em OBDD. Em jogos que possuam

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 8. Experimentos 179

situações parecidas com os problemas para os quais OBDD obtenha melhorperformance do que uma representação explícita do problema, provavelmente,não obteremos sucesso com a nossa abordagem.

Vale ressaltar que em determinados problemas a utilização do SMV não épossível devido a lógica CTL ser proposicional. Outro ponto que vale a pena serressaltado é que a utilização de tipos de dados abstratos em SMV não é possível.E mesmo a utilização de inteiros é proibitiva, uma vez que o SMV converteos inteiros em tipos booleanos tornando o modelo grande de mais de formadesnecessária. Durante o trabalho desenvolvido no mestrado do autor destatese diversas tentativas foram realizadas sem sucesso, mesmo para problemasbem simples.

8.3Jogos em computação no GALV

A maioria dos jogos tratados em computação são jogos extensivos com in-formação perfeita de soma-zero com alternância entre dois jogadores. Exemplosclássicos são: jogo da velha; xadrez; GO; entre outros. Estes jogos são triviaisdo ponto de vista teórico, uma vez que existem estratégias vencedoras paraum dos jogadores4. Isto é demonstrado pela existência de equilíbrio de subjogoperfeito. Apesar deste resultado, jogos vêm sendo estudados em computação,especificamente na área de inteligência artificial, desde o seu início. Uma dasrazões para isto é que jogos são bem definidos no que tange a representaçãodos estados, das ações e dos resultados. Uma outra razão é que a atividade dejogar é tida como uma das faculdades humanas. Além disso, estes problemastêm se mostrado do ponto de vista prático difíceis de serem resolvidos. Paraexemplificarmos, considere o jogo de xadrez que têm uma média de jogadaspossíveis em torno de 35, e o jogo freqüentemente possui 50 movimentos paracada jogador. Desta forma, temos um total de 35100 ou 10154 nós, embora onúmero de nós diferentes seja de 1040.

Os jogos são abordados através de algoritmos e heurísticas que utilizam,em geral, métodos estatísticos para previsão de jogadas, ou utilizam o algoritmominimax (RN02).

Jogos que utilizam métodos estatísticos para darem soluções usam umagrande quantidade de dados de jogos anteriores e tentam prever qual seriaa melhor jogada a ser seguida de acordo com as jogadas utilizadas em jogosanteriores. Por exemplo, o famoso supercomputador da IBM, Deep Blue, quejogava xadrez contra o campeão do mundo em xadrez, Kasparov, utilizava esta

4Uma estratégia vencedora para um jogador aqui se refere a garantia que este irá ganharou empatar.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 8. Experimentos 180

técnica, entre outras, para decidir qual seria sua jogada. Como se sabe, o DeepBlue conseguiu vencer o campeão.

O algoritmo minimax é baseados no trabalho (Zer13) (veja o teorema2.12), ou seja, utiliza a idéia de indução retroativa (backward induction). Emgeral, a complexidade, na área de Inteligência Artificial, é dada através do fatorde ramificação b do jogo e a profundidade m do jogo. O algoritmo minimax temcomplexidade de O(bm) e a memória requerida é O(b"m). Como conseqüência,o número de estados dos jogos são usualmente enormes, e, assim, não temoscomo tratar o jogo como um todo na prática. Duas técnicas são utilizadas paratentar tratar este problema: cortes (prunning) que realizam buscas parciais nojogo, ignorando os estados que não fazem diferença para a escolha final. Umadas técnicas mais conhecidas é o corte alfa e beta, que torna a complexidade emO(bm/2), mantendo a solução ótima; e heurísticas, como no caso das funçõesde avaliações, que aproximam o valor da utilidade em um estado. Assim, abusca utilizando o minimax pode ser feita até um nível de profundidade d,tipicamente, definido como um parâmetro do algoritmo, em vez de realizaruma busca em todo o jogo. Contudo, não há a garantia que a solução ótimaseja encontrada.

A idéia nesta seção é utilizar o verificador de modelos para analisar ocomportamento de jogadores que tomam suas decisões baseadas em algum al-goritmo conhecido para jogos, como o caso do minimax. Os outros jogadoresnão possuem estratégia, desta forma, todas as possibilidades deles são levadasem consideração. Outra possibilidade é que os outros jogadores só conside-ram as possibilidades “razoáveis”. Mais uma vez, razoável aqui é empregadodependendo do contexto, e não pretendemos prover tal conceito em geral.

Podemos fazer isto facilmente no verificador de modelos GALV por queele permite aspectos computacionais em sua linguagem, diferentemente dosverificadores de modelos SMV e SPIN, onde não se contemplam aspectoscomputacionais. Note que com esta abordagem gerar o modelo a ser analisadonão é mais uma tarefa, necessariamente, rápida, uma vez que a geração dosmodelos envolve algoritmos que podem consumir muito tempo e memória.Implementamos o algoritmo minimax para o exemplo do jogo da velha noGALV. Assim, os jogadores escolhiam as suas jogadas de acordo com esteprocedimento, e como este jogo tem uma representação reduzida pequena,utilizamos o minimax com a profundidade máxima (9). Desta forma, a soluçãopara este jogo é um empate como é bem conhecido. Também, realizamosexperimentos quando apenas um jogador segue a estratégia, enquanto que ooutro não possui estratégia. Em ambos os casos, tanto a geração do modelocomo a verificação de modelos ocorreram de forma bem eficiente. Contudo,

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 8. Experimentos 181

utilizar esta abordagem para problemas maiores ainda deve ser estudada emmais detalhes posteriormente.

8.4Leilão no GALV

Nesta seção iremos apresentar um modelo de leilão que mais se assemelhaa um mercado de ações, no qual agentes (jogadores), a cada momento, ofertamuma quantidade de ações tanto para compra como para venda. Cada agente sebaseia em uma estratégia de planejamento, assim a cada momento ele definequais são as ofertas de compras e vendas. Os jogadores atuam de forma não-determinística, ou seja, suas estratégias podem possuir alternativas para ascompras e vendas, assim teremos vários possíveis cenários a serem analisados.Por exemplo, um agente pode oferecer uma compra de 100 unidades da ação‘p0’ a 10 centavos cada ou alternativamente uma oferta de compra de 50

unidades de ‘p0’ a 12 centavos cada e ainda 60 unidades da ação B a 7 centavoscada.

Propomos que as estratégias dos jogadores sejam definidas conforme afigura 8.3. A cada instante cada agente tem um planejamento que pode serdefinido de forma simultânea utilizando o botão ‘And’ ou então em cenáriosalternativos utilizando o botão ‘Xor’. Na figura 8.3 o planejamento do agente1 no instante de tempo 2 é propor uma oferta de compra para uma ação ‘p3’na quantidade de 11 unidades com preço de 11 reais cada. Alternativamenteno tempo 2 o agente 1 pode ofertar a ação ‘p5’ com 11 unidades a um preçode 13 reais cada.

Abaixo listamos algumas das análises que podem ser feitas utilizando alógica GAL.

– Toda oferta do agente 1 será vendida (em todos os cenários). Isto éexpresso na seguinte fórmula.

#vo!er([AG](O!erFrom(vo!er, 1) $ [AF ](Sold(vo!er)))),

onde vo!er é uma variável para as ofertas de venda, O!erFrom é umpredicado para determinar se uma oferta é de um agente, e Sold é umpredicado que diz se a oferta foi vendida em um dado momento.

– O agente 2 sempre venderá (em todos os cenários) todas as ações doproduto p0 que ele ofertar.

#vo!er[AG]((O!erFrom(vo!er, 1)%(O!erProduct(vo!er, p0))) $ [AF ](Sold(vo!er)))

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 8. Experimentos 182

Figura 8.3: Tela para cadastrar o planejamento dos agentes.

– O agente 1 sempre venderá (em todos os cenários) todas as ações nopróximo instante de tempo.

#vo!er[AG](O!erFrom(vo!er, 1) $ [AX](Sold(vo!er))

– O agente 1 sempre venderá (em todos os cenários) todas as ações emalgum próximo instante de tempo.

#vo!er[AG](O!erFrom(vo!er, 1) $ [EX](Sold(vo!er))

– O agente 3 sempre ofertará (em um cenário) o produto p2.

[EG](&vo!er(O!erFrom(vo!er, 3) %O!erProduct(vo!er, p2)))

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

9Conclusão

Esperamos com este trabalho ter demonstrado que a lógica Game Analy-sis Logic (GAL), que é uma lógica modal de primeira-ordem baseada na lógicaComputation Tree Logic, pode ser usada para representar e analisar diversostipos de interações entre agentes.

No capítulo 6, relacionamos os principais modelos não-cooperativos ecooperativos da Teoria dos Jogos aos modelos de GAL, e relacionamos tambémos critérios de racionalidade (conceitos de solução) da Teoria dos Jogos àsfórmulas de GAL. Listamos abaixo os modelos e conceitos de soluções queforam representados em GAL.

– Jogo estratégico e os conceitos de soluções de equilíbrio de Nash, ótimode Pareto, e equilíbrio de estratégias mistas.

– Jogo extensivo com informação perfeita (quase e imperfeita) e os concei-tos de soluções equilíbrio de Nash, equilíbrio de subjogo perfeito, equilí-brio de estratégias mistas (e comportamentais).

– Jogo de coalizão com (e sem) utilidades transferíveis e o conceito desolução de core.

Ilustramos que GAL pode representar novos modelos e conceitos desoluções de uma forma fácil e intuitiva. Na seção 6.2.8, consideramos soluçõesalternativas para jogos extensivos, e apresentamos, nas seções 6.6 e 6.7,variações dos jogos de coalizão, quando consideramos uma seqüência e umaárvore de jogos de coalizão.

É sabido que a quantificação em contextos modais é problemática. Naseção 5.1.1, mostramos as relações entre as alternativas de quantificaçãoDe Re e De Dicto para GAL. Estudamos a quantificação no contexto dosjogos extensivos na seção 6.2.7, onde também caracterizamos os conceitos deequilíbrio de Nash e de subjogo perfeito de acordo com as alternativas dequantificação, levando em consideração a estrutura do jogo extensivo. Para oconceito de equilíbrio de subjogo perfeito as alternativas de quantificação sãoequivalentes em GAL. Por outro lado, as alternativas para equilíbrio de Nashnão são equivalente em GAL. Contudo, demonstramos que, em particular, para

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 9. Conclusão 184

o caso de equilíbrio de Nash, as fórmulas são equivalentes. De forma resumida,temos que as alternativas de quantificação, De Re e De Dicto, no contextodos jogos extensivos, são equivalentes para os principais conceitos de soluções,equilíbrio de Nash e equilíbrio de subjogo perfeito.

Caracterizamos uma classe de sistemas multi-agentes, os modelos deLORA, para a qual existem jogos extensivos e vice-versa em (VHB06). Comoconseqüência, os critérios de racionalidade da Teoria dos Jogos (equilíbriode Nash, de subjogo perfeito, etc) podem ser aplicadas diretamente para ossistema multi-agentes baseados na arquitetura BDI e vice-versa. Por outrolado, relacionamos os jogos extensivos aos modelos de GAL. Desta forma,podemos utilizar a abordagem deste trabalho para os sistema multi-agentesvia o relacionamento com os jogos. Vale a pena ressaltar que a lógica LORA,que estende a lógica GAL, não possui verificação de modelos, sendo utilizadaapenas como um ferramental teórico para o estudo dos relacionamentos e daracionalidade dos agentes. Assim, utilizando a lógica GAL, podemos raciocinarsobre os agentes de forma automática.

Comparamos a lógica GAL com as lógicas ATL e CGL, que são utiliza-das para raciocinar sobre situações não-cooperativas e cooperativas, respecti-vamente. Demonstramos que ambas as lógicas são fragmentos de GAL. Istojá era esperado, uma vez que GAL é uma lógica de primeira-ordem, enquantoque as outras são proposicionais.

Lógicas como ATL, CATL e CGL embutem características de primeira-ordem em suas linguagens, utilizando operadores modais para representá-las.Assim, as fórmulas que expressam propriedades, tais como os conceitos deequilíbrio de Nash e core, são, usualmente, grandes e de difícil entendimento.Por exemplo, a fórmula 9-3 de CATL abaixo (apresentada na seção 4.1.1) ex-pressa equilíbrio de Nash para o jogo Batalha dos Sexos. O mesmo problemaocorre com a fórmula1 9-4 de CGL abaixo (apresentada na seção 4.2), queexpressa o conceito de core, para o exemplo 2.31. Por outro lado, as repre-sentações em GAL são bem mais simples. Veja as fórmulas 9-1 e 9-2 de GALabaixo que expressam equilíbrio de Nash e core, respectivamente.

(!vA1(u1(a1, a2) " u1(vA1 , a2))) # (!vA2(u2(a1, a2) " u2(a1, vA2))) (9-1)

1Na verdade, a fórmula 9-4 é 5 vezes maior do que esta.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 9. Conclusão 185

!x $ v(IN) # ¬%vI%vy

!!vy $ v(vI) #

!(1 $ vI & ¬ (x '1 vy))

# (2 $ vI & ¬ (x '2 vy))

""""

(9-2)

#

$$$$$$$$$$%

#

$$%C2

#

$$%s2,

#

$$%

(((({1}))X(u1 " 0)) & (C1(s1, ((*))X(u1 " 0))))

# (((({1}))X(u1 " 1)) & (C1(s1, ((*))X(u1 " 1))))

# (((({1}))X(u1 " 2)) & (C1(s1, ((*))X(u1 " 2))))

&

''(

&

''(

&

''(

#

#

$$%C1

#

$$%s1,

#

$$%

(((({2}))X(u2 " 0)) & (C2(s2, ((*))X(u2 " 0))))

# (((({2}))X(u2 " 1)) & (C2(s2, ((*))X(u2 " 1))))

# (((({2}))X(u2 " 2)) & (C2(s2, ((*))X(u2 " 2))))

&

''(

&

''(

&

''(

&

''''''''''(

(9-3)

#

$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$%

((N))w # ¬

#

$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$%

#

$$$$$$$$$%

)(({1}))w1 # (w1 +1 w)

*

,)(({1}))w2 # (w2 +1 w)

*

,)(({1}))w3 # (w3 +1 w)

*

,)(({1}))w4 # (w4 +1 w)

*

,)(({1}))w5 # (w5 +1 w)

*

&

'''''''''(

,

#

$$$$$$$$$%

)(({2}))w1 # (w1 +2 w)

*

,)(({2}))w2 # (w2 +2 w)

*

,)(({2}))w3 # (w3 +2 w)

*

,)(({2}))w4 # (w4 +2 w)

*

,)(({2}))w5 # (w5 +2 w)

*

&

'''''''''(

,

#

$$$$$$$$$%

)(({1, 2}))w1 # (w1 +1 w) # (w1 +2 w)

*

,)(({1, 2}))w2 # (w2 +1 w) # (w2 +2 w)

*

,)(({1, 2}))w3 # (w3 +1 w) # (w3 +2 w)

*

,)(({1, 2}))w4 # (w4 +1 w) # (w4 +2 w)

*

,)(({1, 2}))w5 # (w5 +1 w) # (w5 +2 w)

*

&

'''''''''(

&

''''''''''''''''''''''''''''''''''''''''(

&

''''''''''''''''''''''''''''''''''''''''(

(9-4)

Do ponto de vista prático, apresentamos um verificador de modelos paraGAL, chamado de Game Analysis Logic Verifier (GALV), e realizamos diversosestudos de casos. Em particular, utilizamos o GALV para encontrar diversos

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 9. Conclusão 186

dos conceitos de soluções da Teoria dos Jogos.Utilizamos o verificador de modelos GALV e o SMV para modelarmos o

jogo da velha e o jogo da guerra. Em ambos os casos, a verificação no GALVfoi muito mais eficiente, uma vez que a representação explícita destes jogossão bem menores do que a representação implícita através de OBDDs. Valelembrar que diversos dos problemas desta tese não podem ser tratados com oSMV, uma vez que a lógica do SMV é proposicional. Além disso, verificadorescomo o SMV não possuem tipos abstratos de dados, enquanto que o GALVpossui. Em situações mais parecidas com os problemas reais, os tipos abstratossão essenciais. Esperamos ter demonstrado isto através do exemplo de leilãoconsiderado na seção 8.4.

Outro ponto que vale a pena mencionar é que o GALV permite aspectoscomputacionais em sua linguagem de descrição de jogos, o que nos permitiuimplementar as estratégias dos jogadores utilizando algoritmos conhecidosda ciência da computação, como o minimax. Como conseqüência, podemosverificar propriedades destes algoritmos em relação a outros jogadores quepodem possuir estratégias ou não.

Listamos abaixo alguns dos trabalhos futuros desta tese.

– Relacionar outros modelos e conceitos de soluções da Teoria dos Jogosem GAL. Em particular, o conceito de solução de eliminação iteradade estratégias dominadas não parece ser facilmente definível em GAL,uma vez que o mesmo utiliza ponto-fixo nos conjuntos das estratégias.Tentar simulá-lo através dos operadores modais de GAL parece seruma alternativa. Estudar os conceitos de soluções para jogos repetitivos(um caso especial de jogo extensivo) também seria interessante dado aimportância dos “folk theorems”.

– Caracterizar o conceito de solução de eliminação iterada de estratégiasdominada de acordo com a estrutura de um jogo extensivo. A partirdaí, estudar as alternativas de quantificação. Vimos que, para equilíbriode Nash e de subjogo perfeito, as alternativas são equivalentes. Estudarestas possibilidades para outros conceitos ajudaria a entender se este éum fenômeno geral dos conceitos da Teoria dos Jogos.

– Utilizar o GALV para jogos mais complexos do que o jogo da velha. Paratanto, devemos ter um conhecimento mais profundo sobre o tipo de jogotratado. Por exemplo, o jogo de xadrez tem uma vasta literatura sobrequais são as ações “razoáveis” em determinadas condições. A idéia seria:utilizar o GAL para analisar tais possíveis evoluções do jogo e verificar se,de fato, tais soluções são boas ou não, levando em consideração apenas as

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Capítulo 9. Conclusão 187

possíveis evoluções razoáveis. Este trabalho é puramente experimental,e como falamos depende muito do conhecimento sobre o problemaespecífico tratado.

– Implementar as estratégias dos jogadores através da verificação de fórmu-las lógicas, onde consideramos parte do jogo, ou seja, utilizar heurísticasatravés das fórmulas. Por exemplo, vimos que o conceito do algoritmominimax é baseado em equilíbrio de subjogo perfeito, que foi tambémcaracterizado como uma fórmula de GAL, assim poderíamos utilizar averificação de modelos para encontrar o equilíbrio. De forma heurística,podemos limitar a busca até um nível de profundidade, utilizando asfunções de avaliações, obtendo assim uma solução que não é necessa-riamente ótima. O que ganharíamos com a abordagem do GALV é quedescrever outras propriedades de uma forma lógica, em geral, é mais fácildo que implementar novos algoritmos. Por exemplo, como estamos uti-lizando as funções de avaliações (heurísticas), podemos requerer que afórmula de equilíbrio seja satisfeita conjuntamente com outra condição,tal como ótimo de Pareto de subjogo perfeito (como definido na seção6.2.8), ou ainda que o caminho realizado pela solução garanta a menorperda possível caso o outro jogador não haja de forma racional.

– Definir um sistema de prova correto para GAL que seja capaz de provarteoremas interessantes para jogos, tais como a existência de equilíbriode Nash de estratégias mistas ou a existência de equilíbrio de subjogoperfeito para jogos extensivos com informação perfeita.

– Um tópico de pesquisa bastante interessante da Teoria dos Jogos, cha-mado de Implementation Theory, é, ao invés de fixarmos o jogo e encon-trarmos o conjunto de soluções deste jogo através de algum conceito desolução (equilíbrio de Nash, de subjogo perfeito, etc), fixarmos o conjuntode soluções e encontrar um jogo que leve a este conjunto como os equilí-brios do jogo. Esta abordagem em GAL poderia ser feito especificando oconjunto de soluções em GAL juntamente com as relações de preferên-cias dos jogadores, e então encontrarmos uma estrutura que “implemente”esta correspondência. Infelizmente, para a lógica GAL este problema éindecidível. Encontrar um fragmento decidível de GAL que seja capaz degerar tais jogos será um dos próximos passos deste trabalho.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Referências Bibliográficas

[Age94] S. Agerholm. Domain theory in HOL. Higher Order Logic Theo-rem Proving and its Applications: 6th International Workshop,HUG’93, 780:295–310, 1994. 3

[AH92] R. Aumann and S. Hart. Handbook of Game Theory. North–Holland, 1992. 2, C.2.2

[AHK02] Rajeev Alur, Thomas A. Henzinger, and Orna Kupferman.Alternating-time temporal logic. J. ACM, 49(5):672–713, 2002.1, 1.1, 4, 4.1, 4.1, C.1.1

[AHM+98] Rajeev Alur, Thomas A. Henzinger, Freddy Y. C. Mang, ShazQadeer, Sriram K. Rajamani, and Serdar Tasiran. MOCHA:Modularity in model checking. In Alan J. Hu and Moshe Y.Vardi, editors, CAV, volume 1427 of Lecture Notes in ComputerScience, pages 521–525. Springer, 1998. 4.1

[ÅWvdH06] Thomas Ågotnes, Michael Wooldridge, and Wiebe van derHoek. On the logic of coalitional games. In P. Stone andG. Weiss, editors, AAMAS ’06:Proceedings of the Fifth Interna-tional Conference on Autonomous Agents and Multiagent Sys-tems, pages 153–160, Hakodate, Japan, May 2006. ACM Press.1, 1.1, 4, 4.2, 4.2

[BA95] Adam Brandenburger and Robert Aumann. Epistemic Condi-tions for Nash Equilibrium. Econometrica, 63:1161–1180, 1995.1

[BCL91] J. R. Burck, E. M. Clarke, and D. E. Long. Symbolic modelchecking with partitioned transition relations. In A. Halaasand P. B. Denyer, eds., proceedings of the 1991 InternationalConference on VLSI, pages 49–58, August 1991. 1, 3

[BF97] A. Bolotov and M. Fisher. A resolution method for CTLbranching-time temporal logic. In TIME ’97: Proceedings ofthe 4th International Workshop on Temporal Representation

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Referências Bibliográficas 189

and Reasoning, page 20, Washington, DC, USA, 1997. IEEEComputer Society. 3.1

[BK01] Adam Brandenburger and H. Jerome Keisler. Epistemic Condi-tions for Iterated Admissibility. In TARK ’01: Proceedings ofthe 8th Conference on Theoretical Aspects of Rationality andKnowledge, pages 31–37, San Francisco, CA, USA, 2001. Mor-gan Kaufmann Publishers Inc. 1

[BLL+95] Johan Bengtsson, Kim Guldstrand Larsen, Fredrik Larsson,Paul Pettersson, and Wang Yi. UPPAAL - a tool suite forautomatic verification of real-time systems. In Hybrid Systems,pages 232–243, 1995. 1, 3

[Bol00] Alexander Bolotov. Clausal Resolution Method for Branching-Time Temporal Logic. PhD thesis, Manchester MetropolitanUniversity, 2000. 3.1

[Bon01] Giacomo Bonanno. Branching time logic, perfect informationgames and backward induction. Games and Economic Beha-vior, 36(1):57–73, 2001. 1, C.1.1

[Bon02] Giacomo Bonanno. Modal logic and game theory: two alter-native approaches. Risk, Decision and Policy, 7(03):309–324,November 2002. 1

[Bra87] M. E. Bratman. Intention, Plans, and Practical Reason. Har-vard University Press, Cambridge, MA, 1987. 1

[Bry92] Randal E. Bryant. Symbolic boolean manipulation with or-dered binary-decision diagrams. ACM Computing Surveys,24(3):293–318, 1992. 3.2.2, 2

[BS06] Adam Brandenburger and Harborne Stuart. Biform games.Fothcoming in Management Science, January 2006. available athttp://pages.stern.nyu.edu/ abranden/bg-02-24-06.pdf. 2, C.5

[BSWZ01] M. Baldamus, K. Schneider, M. Wenz, and R. Ziller. CanAmerican Checkers be solved by means of symbolic modelchecking? Electronic Notes in Theoretical Computer Science,47, 2001. 1, 3

[CE81] Edmund M. Clarke and E. Allen Emerson. Design and synthesisof synchronization skeletons using branching-time logic. In

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Referências Bibliográficas 190

Workshop on Logic of Programs, pages 52–71. Springer, may1981. 1, 3, 3.1, 3.1, 5

[CES86] E. M. Clarke, E. A. Emerson, and A. P. Sistla. Automatic veri-fication of finite-state concurrent systems using temporal logicspecifications. ACM Trans. Program. Lang. Syst., 8(2):244–263,1986. 3.1

[CGP99] E. M. Clarke, O. Grumberg, and D. A. Peled. Model Checking.MIT Press, 1999. 1, 1.1, 3, 3.1, 3, 5.3.1

[CS04] Vincent Conitzer and Tuomas Sandholm. Computing Shapleyvalues, manipulating value division schemes, and checking coremembership in multi-issue domains. In AAAI, pages 219–225,2004. 8.1

[Dav83] Morton D. Davis. Games Theory: A Nontechnical Introduction.Dover, New York, 1983. 2

[DGP06] Constantinos Daskalakis, Paul W. Goldberg, and Christos H.Papadimitriou. The complexity of computing a Nash equili-brium. In STOC ’06: Proceedings of the Thirty-eighth AnnualACM Symposium on Theory of Computing, pages 71–78, NewYork, NY, USA, 2006. ACM Press. 8.1

[EH86] Allen E. Emerson and Joseph Y. Halpern. “sometimes” and“not never” revisited: on branching versus linear time temporallogic. J. ACM, 33(1):151–178, January 1986. 3, 3.1

[Fis91] Michael Fisher. A resolution method for temporal logic. InIJCAI, pages 99–104, 1991. 3.1

[Fit96] Melvin Fitting. First-order Logic and Automated TheoremProving (2nd ed.). Springer-Verlag New York, Inc, 1996. 1,3

[FM99] Melvin Fitting and Richard L. Mendelsohn. First-order ModalLogic. Kluwer Academic Publishers, 1999. 1.1, 5.1, 5.1.2

[FT91] Drew Fudenberg and Jean Tirole. Game Theory. MIT Press,October 1991. 2, 2.1.2, 6.2.7

[GHR94] Dov M. Gabbay, Ian Hodkinson, and Mark Reynolds. TemporalLogic (vol. 1): Mathematical Foundations and Computational

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Referências Bibliográficas 191

Aspects. Oxford University Press, Inc., New York, NY, USA,1994. 5

[Gib92] Robert Gibbons. Game Theory for Applied Economists. Prin-ceton, New Jersey, 1992. 2, 2.4

[Gol92] Robert Goldblatt. Logic of Time and Computation. CSLI -Center for Study of Language and Information, 1992. 3.1, C.2

[Gor01] Valentin Goranko. Coalition games and alternating temporallogics. In TARK ’01: Proceedings of the 8th Conference onTheoretical Aspects of Rationality and Knowledge, pages 259–272, San Francisco, CA, USA, 2001. Morgan Kaufmann Publi-shers Inc. 1

[GvD06] Valentin Goranko and Govert van Drimmelen. Complete axio-matization and decidability of alternating-time temporal logic.Theoretical Computer Science, 353(1):93–117, 2006. 4.1

[HHWT95] Thomas A. Henzinger, Pei-Hsin Ho, and Howard Wong-Toi. Auser guide to hytech. In Tools and Algorithms for Constructionand Analysis of Systems, pages 41–71, 1995. 1, 3

[HMvdHW03] Paul Harrenstein, John-Jules Meyer, W. van der Hoek, andCees Witteveen. A modal characterization of Nash equilibrium.Fundamenta Informaticae, 57(2-4):281–321, 2003. 1

[Hol97] Gerard J. Holzmann. The SPIN model checker. IEEE Tran-saction on Software Engineering, 23(5):279–295, May 1997. 1,3, 3.1, 3.1

[HvdHMW00] B. P. Harrenstein, W. van der Hoek, J-J. Ch. Meyer, andC. Witteveen. A modal interpretation of Nash-equilibria andsome related concepts. In Proceedings of the LOFT4 conference,Torino, Italy, 2000. 1

[KAE+05] T. Krause, G. Andersson, D. Ernst, E.V. Beck, R. Cherkaoui,and A. Germond. A comparison of Nash equilibria analysisand agent-based modelling for power markets. In Proceedings ofthe 15th Power System Computation Conference (PSCC 2005),pages 22–26, Liège, Belgium, August 2005. C.1

[Kak41] S. Kakutani. A generalization of Brouwer’s fixed point theorem.Duke Mathematical Journal, 8:457–459, 1941. 2.1.2

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Referências Bibliográficas 192

[Kal01] J. A. Kalman. Automated Reasoning with Otter. Rinton Press,2001. 3

[KP04] Magdalena Kacprzak and Wojciech Penczek. Unbounded modelchecking for alternating-time temporal logic. In AAMAS ’04:Proceedings of the Third International Joint Conference onAutonomous Agents and Multiagent Systems, pages 646–653.IEEE Computer Society, 2004. 1, 3

[Kuh53] H. Kuhn. Extensive games and the problem of information.Annals of Mathematics Studies, 28:193–216, 1953. 2.2.1, 2.4.1

[Lam80] Leslie Lamport. “sometime” is sometimes “not never”: on thetemporal logic of programs. In POPL ’80: Proceedings ofthe 7th ACM SIGPLAN-SIGACT Symposium on Principles ofProgramming Languages, pages 174–185, New York, NY, USA,1980. ACM Press. 3.1

[LP85] Orna Lichtenstein and Amir Pnueli. Checking that finitestate concurrent programs satisfy their linear specification. InPOPL ’85: Proceedings of the 12th ACM SIGACT-SIGPLANsymposium on Principles of Programming Languages, pages 97–107, New York, NY, USA, 1985. ACM Press. 3.1

[LR57] R.D. Luce and H. Rai!a. Games and Decisions. J. Wiley, NewYork, 1957. 2

[McM93] K. McMillan. Symbolic Model Checking: An Approach to theState Explosion Problem. PhD thesis, Kluwer Academic, 1993.1, 3, 3.2, 3.2.2

[MKM00] J.Strother Moore Matt Kaufmann and Panagiotis Manolios.Computer-Aided Reasoning: An Approach. Kluwer AcademicPublishers, 2000. 3

[MM96] R. D. McKelvey and A. McLennan. Computation of equilibriain finite games. In H. Amman, D. Kendrick, and J. Rust, edi-tors, Handbook of Computational Economics, volume 1, pages87–142. Elsevier, 1996. 8.1

[MT03] A. McLennan R. McKelvey and T. Turocy. Gambit: Softwaretools for game theory, version 0.97.0.5, 2003. 8.1

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Referências Bibliográficas 193

[Nas50] J. F. Nash. Equilibrium points in n-person games. Proceedingsof the National Academy of Sciences of the United States ofAmerica 36, pages 48–49, 1950. 2.1.1

[NM44] J. Von Neumann and O. Morgenstern. Theory of Games andEconomic Behavior. John Wiley and Sons, 1944. 1, 2

[OR94] M. J. Osborne and A. Rubinstein. A Course in Game Theory.MIT Press, 1994. 1, 2, 2.1.2, 2.4, 2.4.1, 6.2.7, C.1.1, C.2.2, 9,C.5

[Pap01] Christos Papadimitriou. Algorithms, games, and the internet.In STOC ’01: Proceedings of the Thirty-third Annual ACMSymposium on Theory of Computing, pages 749–753, New York,NY, USA, 2001. ACM Press. 8.1

[Par85] Rohit Parikh. The logic of games and its applications. InSelected papers of the international conference on "foundationsof computation theory"on Topics in the theory of computation,pages 111–139, New York, NY, USA, 1985. Elsevier North-Holland, Inc. C.1.1

[Par02] D. Parker. Implementation of Symbolic Model Checking forProbabilistic Systems. PhD thesis, University of Birmingham,August 2002. 1, 3

[Pau01] M. Pauly. Logic for Social Software. Illc dissertation series2001-10, University of Amsterdam, 2001. 1, 1.1, C.1.1

[PMT02] G. Michele Pinna, Franco Montagna, and Elisa B. P. Tiezzi.Investigations on fragments of first order branching temporallogic. Mathematical Logic Quarterly, 48:51–62, 2002. 5

[Pnu77] Amir Pnueli. The temporal logic of programs. In Proceedings ofthe 18th IEEE Symposium on Foundations of Computer Science(FOCS), pages 46–57, 1977. 3.1, 3.1

[PP03] Marc Pauly and Rohit Parikh. Game logic - an overview. StudiaLogica, 75(2):165–182, 2003. C.1.1

[Ren04] C. J. Renteria. Uma abordagem geral para quantificadores emdedução natural. PhD thesis, PUC-Rio, 2004. 3.1

[Rey01] Mark Reynolds. An axiomatization of full computation treelogic. Journal of Symbolic Logic, 66(3):1011–1057, 2001. 3.1

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Referências Bibliográficas 194

[RG95] A. S. Rao and M. P. George!. BDI-agents: from theory topractice. In Proceedings of the First International Conferenceon Multiagent Systems, San Francisco, 1995. 1

[RH02] C. J. Renteria and E. H. Haeusler. Natural deduction forcomputation tree logic. Bulletin of the Section of Logic, 31(4),2002. 3.1

[RN02] S. Russell and P. Norvig. Artificial Intelligence: A ModernApproach. Prentice Hall, 2nd edition edition, 2002. 1, 8.3

[Ros06] Don Ross. Game theory. In Edward N. Zalta, editor, TheStanford Encyclopedia of Philosophy. Spring 2006. 2, 2.4, 6.2.7

[Rub91] Ariel Rubinstein. Comments on the interpretation of gametheory. Econometrica, 59(4):909–924, 1991. 2

[RV02] Alexandre Riazanov and Andrei Voronkov. The design andimplementation of vampire. AI Communications, 15(2):91–110,2002. 3

[SC85] A. P. Sistla and E. M. Clarke. The complexity of propositionallinear temporal logics. J. ACM, 32(3):733–749, 1985. 3.1

[Sch80] Thomas C. Schelling. The Strategy of Conflict. HarvardUniversity Press, 1980. 2

[Sch04] Pierre-Yves Schobbens. Alternating-time logic with imperfectrecall. Electronic Notes in Theoretical Computer Science, 85(1),2004. 4.1

[Sta87] J. M. Staatz. A game theoretic analysis of decisionmaking infarmer cooperatives. In Cooperative Theory: New Approaches,pages 117–147, Washington, D.C., 1987. 2.6

[Tar72] R. Tarjan. Depth-first search and linear graph algorithms.SIAM Journal on Computing, 1(2):146–159, 1972. 2

[THL97] Roland Vogt Thomas Hillenbrand, Arnim Buch and BerndLochner. WALDMEISTER - high-performance equational de-duction. Journal of Automated Reasoning, 18(2):265–270, 1997.3

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Referências Bibliográficas 195

[Vas03] D. R. Vasconcelos. Análise de estratégia utilizando verificaçãoformal de modelos (in portuguese). Master’s thesis, PUC-Rio,2003. 1, 1, 3, 8.2

[vB03] Johan van Benthem. Rational dynamics andepistemic logic in games. 2003. Available athttp://www.illc.uva.nl/Publications/ResearchReports/PP-2003-06.text.pdf. 1

[vB05] Johan van Benthem. Open problems in logic and games. 2005.available at http://www.illc.uva.nl/lgc/postings.html. 1, C.1.1

[vdHJW05] Wiebe van der Hoek, Wojciech Jamroga, and Michael Wool-dridge. A logic for strategic reasoning. In AAMAS ’05: Pro-ceedings of the Fourth International Joint Conference on Au-tonomous Agents and Multiagent Systems, pages 157–164, NewYork, NY, USA, 2005. ACM Press. 1, 4, 4.1.1, 4.1.1, C.1.1

[vdHW02] Wiebe van der Hoek and Michael Wooldridge. Tractablemultiagent planning for epistemic goals. In AAMAS ’02:Proceedings of the First International Joint Conference onAutonomous Agents and Multiagent Systems, pages 1167–1174,New York, NY, USA, 2002. ACM Press. 1, 3

[vdHW03] Wiebe van der Hoek and Michael Wooldridge. Cooperation,knowledge, and time: Alternating-time temporal epistemic logicand its applications. Studia Logica, 75(1):125–157, 2003. 1,C.1.1

[VH03] D. R. Vasconcelos and E.H. Haeusler. A logic view of playinggames. In Advances in Intelligent Systems and Robotics – TheFourth Congress of Logic Applied to Technology – LAPTEC2003, volume 101 of Frontiers in Artificial Intelligence andApplications, pages 67–80. IOS Press, 2003. 1, 8.2, C.1.1

[VHB05] D. R. Vasconcelos, E. H. Haeusler, and M. F. Benevides.Reasoning about games via temporal logic. In 7th Augustusde Morgan Workshop, London, 2005. 1

[VHB06] D. R. Vasconcelos, E. H. Haeusler, and M. F. Benevides.Defining agents via strategies: Towards a view of MAS as games.In WRAC 2005 : Workshop on Radical Agent Concepts, volume

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Referências Bibliográficas 196

3825 of Lecture Notes in Artificial Intelligence, pages 299–311.Springer Verlag, 2006. 1.2, 9, C.1.1

[VHPB04] D. R. Vasconcelos, E. H. Haeusler, M. V. Poggi, and M. F.Benevides. Reasoning about games via temporal logic: A modelchecking approach. Technical Report 47, PUC-Rio, 2004. 1,C.1.1

[vOvdHW04] Sieuwert van Otterloo, Wiebe van der Hoek, and MichaelWooldridge. Preferences in game logics. In AAMAS ’04:Proceedings of the Third International Joint Conference onAutonomous Agents and Multiagent Systems, pages 152–159,Washington, DC, USA, 2004. IEEE Computer Society. 1, 3,C.1.1

[Wei97] Christoph Weidenbach. Spass - version 0.49. Journal ofAutomated Reasoning, 18(2):247–252, 1997. 3

[Wil86] J. D. Williams. The Compleat Strategyst: Being a Primer onthe Theory of Games of Strategy. Dover, New York, 1986. 2

[Woo00] Michael Wooldridge. Reasoning about Rational Agents. MITPress, 2000. 1, C.1, C.1.1, C.2.1, C.2.1

[Woo02] Michael Wooldridge. An Introduction to MultiAgent Systems.John Wiley and Sons, 2002. 1

[Zer13] E. Zermelo. Über eine Anwendung der Mengenlehre auf dieTheorie des Schachspiels. In E. Hobson and A. Love, editors,Proceedings of Fifth Congress Mathematicians, volume 2, pages501–504. Cambridge Univ. Press, 1913. 1, 2.2.1, 8.3

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

AProvas das Interações entre Quantificação De Re e DeDicto

Por simplicidade iremos adotar que temos apenas um sort s. Seja G =

!SE,SEo, CA,Ds, (Ff,e), (Pp,e), (Ne)" uma estrutura de GAL com linguagemnão-lógica !{s}, F, P, N", e !s uma função de valoração de sort s, e "(x) e #(x)

fórmulas de GAL com a variável livre x de sort s, onde s # S, f # F, p # P ee # SE. Vale observar que a escolha por domínios constantes é fundamentalpara as provas que seguem.

1. $x[EX]"(x) % [EX]$x"(x)

Prova.

G,!s |=e [EX]$x"(x)

&'def $e1 tal que !e, e1" # CA temos que G,!s |=e1 $x"(x)

&'def $e1 tal que !e, e1" # CA temos que $d # Ds temos queG,!(x|d) |=e1 "(x)

Como o domínio é contante temos que o mesmo elemento d existe emambos os estados e e e1 daí

&' $d # Ds tal que $e1 tal que !e, e1" # CA temos queG,!(x|d) |=e1 "(x)

&'def $d # Ds tal que G,!(x|d) |=e [EX]"(x)

&'def G,!s |=e $x[EX]"(x) !

2. $x[AX]"(x) ( [AX]$x"(x)

Prova.

G,!s |=e $x[AX]"(x)

&'def $d # Ds, tal que G,!s(x|d) |=e [AX]"(x)

&'def $d # Ds, tal que )e1 tal que !e, e1" # CA tem-se queG,!s(x|d) |=e1 "(x)

Como o domínio é constante temos que o mesmo elemento d existe emtodos estados e1 daí1

1Note que a volta não é válida, pois não podemos afirmar que é o mesmo elemento d.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Apêndice A. Provas das Interações entre Quantificação De Re e De Dicto 198

=' )e1 tal que !e, e1" # CA temos que $d # Ds tal que G,!s(x|d) |=e1

"(x)

='def )e1 tal que !e, e1" # CA temos que G,!s |=e1 $x"(x)

='def G,!s |=e [AX]$x"(x) !

3. $xE("(x)U#(x)) ( E($x"(x)U$x#(x))

Prova.

G,!s |=e $xE("(x)U#(x))

&'def $d # Ds, tal que G,!s(x|d) |=e E("(x)U#(x))

&'def $d # Ds, tal que existe um caminho finito (ou infinito) $(e) =

(e0e1e2...ei), tal que existe um k, onde k * 0 tal que

G,!s(x|d) |=ek#(x) (A-1)

)j 0 + j < k temos que G,!s(x|d) |=ej "(x) (A-2)

Como o domínio é constante e a partir de A-1 e A-2 temos que2

=' Existe um caminho finito (ou infinito) $(e) = (e0e1e2...ei), tal queexiste um k, onde k * 0 tal que

$d # Ds, G,!s(x|d) |=ek#(x) (A-3)

$d # Ds, )j 0 + j < k temos que G,!s(x|d) |=ej "(x) (A-4)

='def Existe um caminho finito (ou infinito) $(e) = (e0e1e2...ei), tal queexiste um k, onde k * 0 tal que

G,!s |=ek$x#(x) (A-5)

)j 0 + j < k temos que G,!s |=ej $x"(x) (A-6)

='def G,!s |=e E($x"(x)U$x#(x)) !

4. $xA("(x)U#(x)) ( A($x"(x)U$x#(x))

Prova.

G,!s |=e $xA("(x)U#(x))

&'def $d # Ds, tal que G,!s(x|d) |=e A("(x)U#(x))

2Note que só podemos tomar o sentido =', pois não podemos garantir que no outrosentido &= temos o mesmo elemento em comum.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Apêndice A. Provas das Interações entre Quantificação De Re e De Dicto 199

&'def $d # Ds, tal que para todos os caminhos finitos (e infinitos)$(e) = (e0e1e2...ei), tal que existe um k, onde k * 0 tal que

G,!s(x|d) |=ek#(x) (A-7)

)j 0 + j < k temos que G,!s(x|d) |=ej "(x) (A-8)

Como o domínio é constante e a partir de A-7 e A-8 temos que3

=' Para todos os caminhos finitos (e infinitos) $(e) = (e0e1e2...ei), talque existe um k, onde k * 0 tal que

$d # Ds, G,!s(x|d) |=ek#(x) (A-9)

$d # Ds, )j 0 + j < k temos que G,!s(x|d) |=ej "(x) (A-10)

='def Para todos os caminhos finitos (e infinitos) $(e) = (e0e1e2...ei),

tal que existe um k, onde k * 0 tal que

G,!s |=ek$x#(x) (A-11)

)j 0 + j < k temos que G,!s |=ej $x"(x) (A-12)

='def G,!s |=e A($x"(x)U$x#(x)) !As provas abaixo são semelhantes as anteriores e se baseiam no mesmoargumento que o elemento existe nos outros estados. Note que a voltanão é válida, pois não podemos garantir que este seja o mesmo elemento.

5. $x[EF ]"(x) % [EF ]$x"(x)

6. $x[AF ]"(x) ( [AF ]$x"(x)

7. $x[EG]"(x) ( [EG]$x"(x)

8. $x[AG]"(x) ( [AG]$x"(x)

9. )x[EX]"(x) % [EX])x"(x)

Prova.

G,!s |=e [EX])x"(x)

&'def $e1 tal que $e1 tal que !e, e1" # CA e G,!s |=e1 )x"(x)

&'def $e1 tal que !e, e1" # CA e )d # Ds temos queG,!(x|d) |=e1 "(x)

3Note que só podemos tomar o sentido =', pois não podemos garantir que no outrosentido &= temos o mesmo elemento em comum.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Apêndice A. Provas das Interações entre Quantificação De Re e De Dicto 200

Como o domínio é constante temos que todos os elementos em Ds existemem todos os mundos (em particular nos estados e e e1), daí

&' )d # Ds tal que $e1 tal que !e, e1" # CA eG,!(x|d) |=e1 "(x)

&'def )d # Ds tal que G,!(x|d) |=e [AX]"(x)

&'def G,!s |=e $x[EX]"(x) !

10. (Barcan) )x[AX]"(x) % [AX])x"(x)

Prova.

G,!s |=e [AX])x"(x)

&'def )e1 tal que !e, e1" # CA temos que G,!s |=e1 )x"(x)

&'def )e1 tal que !e, e1" # CA temos que )d # Ds temos queG,!(x|d) |=e1 "(x)

Como o domínio é constante temos que todos os elementos em Ds existemem todos os mundos, daí

&' )d # Ds temos que )e1 tal que !e, e1" # CA temos queG,!(x|d) |=e1 "(x)

&'def )d # Ds temos que G,!(x|d) |=e [AX]"(x)

&'def G,!s |=e )x[AX]"(x) !

A prova abaixo é semelhante a prova acima (Barcan) e se baseia no fatode GAL ter domínio constante.

11. )x[AG]"(x) % [AG])x"(x)

12. E()x"(x)U)x#(x)) ( )xE("(x)U#(x))

Prova.

G,!s |=e E()x"(x)U)x#(x))

&'def Existe um caminho finito (ou infinito) $(e) = (e0e1e2...ei), talque existe um k, onde k * 0 tal que

G,!s |=ek)x#(x) (A-13)

)j 0 + j < k temos que G,!s |=ej )x"(x) (A-14)

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Apêndice A. Provas das Interações entre Quantificação De Re e De Dicto 201

&'def Existe um caminho finito (ou infinito) $(e) = (e0e1e2...ei), talque existe um k, onde k * 0 tal que

)d # Ds temos que G,!s(x|d) |=ek#(x)

(A-15)

)j 0 + j < k temos que )d # Ds temos que G,!s(x|d) |=ej "(x)

(A-16)

Suponha por contradição que G,!s ,|=e )xE("(x)Ux#(x))

&'def $d1 # Ds tal que G,!s(x|d1) ,|=e E("(x)Ux#(x))

&'def $d1 # Ds tal que NÃO existe um caminho finito (ou infinito)$(e) = (e0e1e2...ei), tal que existe um k, onde k * 0 tal que

G,!s(x|d1) |=ek#(x) (A-17)

)j 0 + j < k temos que G,!s(x|d1) |=ej "(x) (A-18)

Como o domínio é constante e a partir de A-15 e A-16 temos que

='def $d1 # Ds tal que existe um caminho finito (ou infinito) $(e) =

(e0e1e2...ei), tal que existe um k, onde k * 0 tal que

G,!s(x|d1) |=ek#(x) (A-19)

)j 0 + j < k temos que G,!s(x|d1) |=ej "(x) (A-20)

!

13. A()x"(x)U)x#(x)) ( )xA("(x)U#(x))

Prova.

G,!s |=e A()x"(x)U)x#(x))

&'def Para todos os caminhos finitos (e infinitos) $(e) = (e0e1e2...ei),

tal que existe um k, onde k * 0 tal que

G,!s |=ek)x#(x) (A-21)

)j 0 + j < k temos que G,!s |=ej )x"(x) (A-22)

&'def Para todos os caminhos finitos (e infinitos) $(e) = (e0e1e2...ei),

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Apêndice A. Provas das Interações entre Quantificação De Re e De Dicto 202

tal que existe um k, onde k * 0 tal que

)d # Ds temos que G,!s(x|d) |=ek#(x)

(A-23)

)j 0 + j < k temos que )d # Ds temos que G,!s(x|d) |=ej "(x)

(A-24)

Suponha por contradição que G,!s ,|=e )xA("(x)Ux#(x))

&'def $d1 # Ds tal que G,!s(x|d1) ,|=e A("(x)Ux#(x))

&'def $d1 # Ds tal que NÃO para todos os caminhos finitos (e infinitos)$(e) = (e0e1e2...ei), tal que existe um k, onde k * 0 tal que

G,!s(x|d1) |=ek#(x) (A-25)

)j 0 + j < k temos que G,!s(x|d1) |=ej "(x) (A-26)

Como o domínio é constante e a partir de A-23 e A-24

='def $d1 # Ds tal que para todos os caminhos finitos (e infinitos)$(e) = (e0e1e2...ei), tal que existe um k, onde k * 0 tal que

G,!s(x|d1) |=ek#(x) (A-27)

)j 0 + j < k temos que G,!s(x|d1) |=ej "(x) (A-28)

!

14. [EF ])x"(x) ( )x[EF ]"(x)

Prova.

G,!s |=e [EF ])x"(x)

&'def Existe um caminho finito (ou infinito) $(e) = (e0e1e2...ei), talque existe um k, onde k * 0 tal que

G |=ek)"(x)

&'def Existe um caminho finito (ou infinito) $(e) = (e0e1e2...ei), talque existe um k * 0 tal que

)d # Ds G, !s(x|d) |=ek"(x) (A-29)

Suponha por contradição que G,!s ,|=e )x[EF ]"(x)

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Apêndice A. Provas das Interações entre Quantificação De Re e De Dicto 203

&'def $d1 # Ds tal que G,!s(x|d1) ,|=e [EF ]"(x)

Como o domínio é constante e a partir de A-29 temos que

='def $d1 # Ds tal que Existe um caminho finito (ou infinito) $(e) =

(e0e1e2...ei), tal que existe um k * 0 tal que

G,!s(x|d1) |=ek"(x) (A-30)

='def $d1 # Ds tal que G,!s(x|d1) |=e [EF ]"(x) !

As provas abaixo seguem a mesma idéia.

15. [AF ])x"(x) ( )x[AF ]"(x)

16. [EG])x"(x) ( )x[EG]"(x)

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

BProvas dos Teoremas de Teoria dos Jogos em GAL

B.1Jogo Estratégico

B.1.1Equilíbrio de Nash

A fórmula " abaixo é a fórmula de equilíbrio de Nash da seção 6.1.1(página 113).

" ::=!

i!N)vAi(ui(a1, . . . , an) * ui(a1, . . . , vAi , . . . , an)) (B-1)

Teorema 6.2 Sejam ! um jogo estratégico, a" = (a"i ) um perfil de ações de !,G! uma estrutura de GAL para ! como definido na seção 6.1, e " uma fórmulade Equilíbrio de Nash como definido acima.

a" é um equilíbrio de Nash em ! &' G! |=a! "

Prova.

a" é um equilíbrio de Nash em !

&'def para todo jogador i # N vale que ui(a"1, . . . , a

"n) * ui(a

"1, . . . , ai, . . . , a

"n)

para todo ai # Ai

Como o domínio DAi de cada sort Ai em G! é definido pelo conjunto Ai dojogo estratégico !, temos que

&' para todo jogador i # N e )di # DAi vale que

ui(a"1, . . . , a

"n) * ui(a

"1, . . . , di, . . . , a

"n)

Pela definição 5.8 no estado a" de acordo com a definição de G!, temos que,para todo jogador i # N , !̄Ai(a

", ai) = a"i e !̄Ai(vAi|di)(a", vAi) = di. Daí, segue

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Apêndice B. Provas dos Teoremas de Teoria dos Jogos em GAL 205

que

&' para todo jogador i # N e )di # DAi vale que

ui(!̄A1(a", a1), . . . , !̄An(a", an)) * ui(!̄A1(a

", a1), . . . , !̄Ai(vAi|di)(a", vAi), . . . , !̄An(a", an))

Como as funções de utilidade são interpretadas rigidamente de acordocom !, temos que

&'def para todo jogador i # N e )di # DAi vale que

!̄R(a", ui(a1, . . . , an)) * !̄R(a", ui(a1, . . . , vAi , . . . , an))

&'def para todo jogador i # N e )di # DAi vale que

G!,!R, (!Ai(vai|di)) |=a! (ui(a1, . . . , an) * ui(a1, . . . , vAi , . . . , an))

&'def para todo jogador i # N vale que

G!,!R, (!Ai) |=a! )vAi(ui(a1, . . . , an) * ui(a1, . . . , vAi , . . . , an))

&'def G! |=a!!

i!N)vAi(ui(a1, . . . , an) * ui(a1, . . . , vAi , . . . , an))

!

B.1.2Ótimo de Pareto

A fórmula " abaixo é a fórmula de ótimo de Pareto da seção 6.1.2 (página115).

" ::= ¬

"

##$$vA1 . . . $vAn

"

##$

% !i!N

ui(vA1 , . . . , vAn) * ui(a1, . . . , an)

&-

% 'i!N

ui(vA1 , . . . , vAn) > ui(a1, . . . , an)

&

(

))*

(

))*

(B-2)

Teorema 6.3 Sejam ! um jogo estratégico, a" = (a"i ) um perfil de estratégiasde !, G! uma estrutura de GAL para ! como definido na seção 6.1, e " umafórmula de ótimo de Pareto como definido acima.

a" é um ótimo de Pareto em ! &' G! |=a! "

Prova. a" é um ótimo de Pareto em !

&'def Não existe um outro perfil de estratégias a # A tal que existe umjogador j # N tal que uj(a) > uj(a") e, para todo jogador i # N , vale queui(a) * ui(a").

&'def Não, para todo jogador i # N , existe um di # Ai tal que

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Apêndice B. Provas dos Teoremas de Teoria dos Jogos em GAL 206

"

##$

"

##$

% !i!N

ui(d1, . . . , dn) * ui(a"1, . . . , a"n)

&-

% 'i!N

ui(d1, . . . , dn) > ui(a"1, . . . , a"n)

&

(

))*

(

))*

&'def Não, para todo jogador i # N , existe um di # Ai tal que"

#####$

"

#####$

+!

i!N

ui(!A1(vA1|d1)(a", vA1), . . . , !An(vAn|dn)(a", vAn)) *

ui(!A1(vA1|d1)(a", a1), . . . , !An(vAn|dn)(a", an))

,-

+'

i!N

ui(!A1(vA1|d1)(a", vA1), . . . , !An(vAn|dn)(a", vAn)) >

ui(!A1(vA1|d1)(a", a1), . . . , !An(vAn|dn)(a", an))

,

(

)))))*

(

)))))*

&'def Não, para todo jogador i # N , existe um di # Ai tal que

G!, (!Ai(vAi|di)) |=a!

"

##$

"

##$

% !i!N

ui(vA1 , . . . , vAn) * ui(a1, . . . , an)

&-

% 'i!N

ui(vA1 , . . . , vAn) > ui(a1, . . . , an)

&

(

))*

(

))*

&'def Não

G! |=a!

"

##$$vA1 . . . $vAn

"

##$

% !i!N

ui(vA1 , . . . , vAn) * ui(a1, . . . , an)

&-

% 'i!N

ui(vA1 , . . . , vAn) > ui(a1, . . . , an)

&

(

))*

(

))*

&'def G! |=a! ¬

"

##$$vA1 . . . $vAn

"

##$

% !i!N

ui(vA1 , . . . , vAn) * ui(a1, . . . , an)

&-

% 'i!N

ui(vA1 , . . . , vAn) > ui(a1, . . . , an)

&

(

))*

(

))*

!

B.1.3Equilíbrio de Nash de Estratégias Mistas

A fórmula " abaixo é a fórmula de equilíbrio de Nash de estratégiasmistas da seção 6.1.3 (página 116).

" ::=!

i!N)v"Ai(Ui(v#A1 , . . . , v#An) * Ui(v#A1 , . . . , v"Ai , . . . , v#An)) (B-3)

Teorema 6.4 Sejam ! um jogo estratégico, % " = (% "i ) um perfil de estratégiasmistas, G! um estrutura de GAL para ! como definido na seção 6.1.3, (!#Ai

)

funções de valorações de sorts ("Ai), e " uma fórmula de equilíbrio de Nashde estratégias mistas como definido acima.

(% "i ) é um equilíbrio de estratégias mistas em !

&' G!, (!#Ai) |= ", onde cada !#Ai(v#Ai

) = % "i

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Apêndice B. Provas dos Teoremas de Teoria dos Jogos em GAL 207

Prova. (% "i ) é um equilíbrio de estratégias mistas em !.&'def Para todo jogador i # N e para toda estratégia degenerada

&i # #(Ai) vale que Ui(% "1 , . . . , % "n) * Ui(% "1 , . . . , &i, . . . , % "n).Como cada domínio D"(Ai) de sort #(Ai) é definido pelo conjunto #(Ai)

do jogo estratégico !, temos que&'def Para todo jogador i # N e para toda estratégia degenerada

di # #(Ai) vale que Ui(% "1 , . . . , % "n) * Ui(% "1 , . . . , di, . . . , % "n).&'def Para todo jogador i # N e para toda estratégia degenerada

di # #(Ai) vale queUi(!#A1

(v#A1), . . . , !#An(v#An

)) * Ui(!#A1(v#A1), . . . ,!#!i

(v"(Ai)|di)(v"Ai), . . . , !#A1(v#An)),

onde !#Ai(v#Ai

) = % "i&'def Para todo jogador i # N e para toda estratégia degenerada

di # #(Ai) vale queG!, (!#Ai

),!"(Ai)(v"(Ai)|di) |=-Ui(v#A1 , . . . , v#An

) * Ui(v#A1 , . . . , v"Ai , . . . , v#An).,

onde !#Ai(v#Ai

) = % "i&' G!, (!#Ai) |=

!i!N)v"Ai(Ui(v#A1 , . . . , v#An

) * Ui(v#A1 , . . . , v"Ai , . . . , v#An)),

onde !#Ai(v#Ai

) = % "i !

B.2Jogo Extensivo na Versão Matricial

B.2.1Equilíbrio de Nash

A fórmula " abaixo é a fórmula de equilíbrio de Nash da seção 6.2.2(página 121).

" ::=!

i!N)vSi(ui(O(s1, . . . , sn)) * ui(O(s1, . . . , vSi , . . . , sn))) (B-4)

Teorema 6.7 Sejam ! um jogo extensivo com informação perfeita, s" = (s"i )

um perfil de estratégias para !, G! uma estrutura de GAL na versão matricialpara ! como definido na seção 6.2.1, e " uma fórmula de equilíbrio de Nashpara G! como definido acima.

Um perfil de estratégias s" é um equilíbrio de Nash para ! &' G! |=s! "

Prova.

s" é um equilíbrio de Nash em !

&'def para todo jogador i # N vale que ui(O(s"1, . . . , s"n)) * ui(O(s"1, . . . , si, . . . , s

"n))

para todo si # Si

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Apêndice B. Provas dos Teoremas de Teoria dos Jogos em GAL 208

Como o domínio DSi de cada sort Si em G! é definido pelo conjunto Si do jogoestratégico !, temos que

&' para todo jogador i # N e )di # DSi vale que

ui(O(s"1, . . . , s"n)) * ui(O(s"1, . . . , di, . . . , s

"n))

Pela definição 5.8 no estado s" de acordo com a definição de G!, temos que,para todo jogador i # N , !̄Si(s

", si) = s"i . Daí, segue que

&'def5.8 para todo jogador i # N e )di # DSi vale que

ui(O(!̄S1(s", s1), . . . , !̄Sn(s", sn))) * ui(O(!̄S1(s

", s1), . . . , !̄Si(vSi|di)(s", vSi), . . . , !̄Sn(s", sn)))

Como a função O e as funções de utilidade são interpretadas de forma rígidade acordo com !, temos que

&' para todo jogador i # N e )di # DSi vale que

!̄R(s", ui(O(s1, . . . , sn))) * !̄R(s", ui(O(s1, . . . , vSi , . . . , sn)))

&'def5.9 para todo jogador i # N e )di # DSi vale que

G!,!R, (!Si(vSi|di)) |=s! (ui(O(s1, . . . , sn)) * ui(O(s1, . . . , vSi , . . . , sn)))

&'def5.9 para todo jogador i # N vale que

G!,!R, (!Si) |=s! )vSi(ui(O(s1, . . . , sn)) * ui(O(s1, . . . , vSi , . . . , sn)))

&'def5.9 G! |=s!!

i!N)vSi(ui(O(s1, . . . , sn)) * ui(O(s1, . . . , vSi , . . . , sn)))

!

B.2.2Equilíbrio de Subjogo Perfeito

A fórmula " abaixo é a fórmula de equilíbrio de subjogo perfeito da seção6.2.3 (página 121).

" ::=)vNT

%!i!N

P (vNT )= i ( )vSi (ui(Oh(vNT , s1, . . . , sn)) * ui(Oh(vNT , s1, . . . , vSi , . . . , sn)))

&

(B-5)

Teorema 6.8 Sejam ! um jogo extensivo com informação perfeita, s" = (s"i )

um perfil de estratégias para !, G! uma estrutura de GAL na versão matricialpara ! como definido na seção 6.2.1, e " uma fórmula de equilíbrio de subjogoperfeito para G! como definido acima.

Um perfil de estratégias s" é um equilíbrio de subjogo perfeito para !

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Apêndice B. Provas dos Teoremas de Teoria dos Jogos em GAL 209

&' G! |=s! "

Prova.

s" é um equilíbrio de subjogo perfeito em !

&'def para todo jogador i # N e para todo histórico não-terminal h # H

para o qual P (h) = i vale que ui(Oh(h, s"1, . . . , s"n)) * ui(Oh(h, s"1, . . . , si, . . . , s

"n))

para toda si # Si

Como o domínio DNT de sort NT em G! é definido pelo conjunto H\T do jogoextensivo !, temos que

&' para todo jogador i # N e para todo nt1 # DNT

SE P (nt1) = i ENTÃO/

ui(Oh(nt1, s"1, . . . , s"n)) * ui(Oh(nt1, s"1, . . . , si, . . . , s"n))

0

para toda estratégia si # Si

Como cada domínio DSi de sort Si em G! é definido pelo conjunto Si do jogoextensivo !, temos que

&' para todo jogador i # N e para todo nt1 # DNT

SE P (nt1) = i ENTÃO para todo di # DSi/ui(Oh(nt1, s"1, . . . , s

"n)) * ui(Oh(nt1, s"1, . . . , di, . . . , s"n))

0

&'def5.7 para todo jogador i # N e para todo nt1 # DNT

SE P (!NT (vNT |nt1)(vNT )) = i ENTÃO para todo di # DSi

+ui(Oh(!NT (vNT |nt1)(vNT ), s"1, . . . , s

"n)) *

ui(Oh(!NT (vNT |nt1)(vNT ), s"1, . . . ,!Si(vSi|di)(vSi), . . . , s"n))

,

&'def5.8 para todo jogador i # N e para todo nt1 # DNT

SE P (!̄NT (vNT |nt1)(s", vNT )) = i ENTÃO para todo di # DSi

+ui(Oh(!̄NT (vNT |nt1)(s", vNT ), !̄S1(s

", s1), . . . , !̄Sn(s", sn))) *

ui(Oh(!̄NT (vNT |nt1)(s", vNT ), !̄S1(s", s1), . . . , !̄Si(vSi|di)(s", vSi), . . . , !̄Sn(s", sn)))

,

Como as funções P, Oh e (ui) são interpretadas rigidamente de acordo com !

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Apêndice B. Provas dos Teoremas de Teoria dos Jogos em GAL 210

e ainda pela definição de 5.9, temos que

&' para todo jogador i # N e para todo nt1 # DNT

SE G!,!NT (vNT |nt1) |=s! P (vNT ) = i ENTÃO para todo di # DSi

G!,!NT (vNT |nt1),!Si(vSi|di) |=s! (ui(Oh(vNT , s1, . . . , sn)) * ui(Oh(vNT , s1, . . . , vSi , . . . , sn)))

&'def5.9 para todo jogador i # N e para todo nt1 # DNT

SE G!,!NT (vNT |nt1) |=s! P (vNT ) = i ENTÃO

G!,!NT (vNT |nt1) |=s! )vSi (ui(Oh(vNT , s1, . . . , sn)) * ui(Oh(vNT , s1, . . . , vSi , . . . , sn)))

&'def5.9 para todo nt1 # DNT e para todo jogador i # N

G!,!NT (vNT |nt1) |=s!

(P (vNT ) = i ( )vSi (ui(Oh(vNT , s1, . . . , sn)) * ui(Oh(vNT , s1, . . . , vSi , . . . , sn))))

&'def5.9 para todo nt1 # DNT e para todo jogador i # N

G!,!NT (vNT |nt1) |=s!

(P (vNT ) = i ( )vSi (ui(Oh(vNT , s1, . . . , sn)) * ui(Oh(vNT , s1, . . . , vSi , . . . , sn))))

&'def5.9 G! |=s!

)vNT

%!i!N

P (vNT ) = i ( )vSi (ui(Oh(vNT , s1, . . . , sn)) * ui(Oh(vNT , s1, . . . , vSi , . . . , sn)))

&

!

B.3Jogo Extensivo Versão Extensiva

B.3.1Equilíbrio de Nash

A fórmula " abaixo é a fórmula de equilíbrio de Nash da seção 6.2.5(página 125).

" ::=!

i!N)vSi(ui(O(s1, . . . , sn)) * ui(O(s1, . . . , vSi , . . . , sn))) (B-6)

Teorema 6.11 Sejam ! um jogo extensivo com informação perfeita, s" = (s"i )

um perfil de estratégias para !, G! uma estrutura de GAL na versão extensivapara ! como definido na seção 6.2.4, (!Si) funções de valorações de sorts (Si),e " uma fórmula de equilíbrio de Nash para G! como definido acima.

Um perfil de estratégias (s"i ) é um equilíbrio Nash para !

&' G!, (!Si) |= ", onde cada !Si(v"Si

) = s"i

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Apêndice B. Provas dos Teoremas de Teoria dos Jogos em GAL 211

Prova.

s" é um equilíbrio de Nash em !

&'def para todo jogador i # N vale que ui(O(s"1, . . . , s"n)) * ui(O(s"1, . . . , si, . . . , s

"n))

para todo si # Si

Como o domínio DSi de cada sort Si em G! é definido pelo conjunto Si do jogoestratégico !, temos que

&' para todo jogador i # N e )di # DSi vale que

ui(O(s"1, . . . , s"n)) * ui(O(s"1, . . . , di, . . . , s

"n))

&'def5.7 para todo jogador i # N e )di # DSi vale que

ui(O(!S1(v"S1

), . . . , !Sn(v"Sn))) * ui(O(!S1(v

"S1

), . . . , !Si(vSi|di)(vSi), . . . , !Sn(v"Sn))),

onde cada !Si(v"Si

) = s"i

Como a função O e as funções de utilidade são interpretadas de forma rígidade acordo com !, temos que

&'def para todo jogador i # N e )di # DSi vale que

G!, (!Si(vSi|di)) |= (ui(O(v"S1, . . . , v"Sn

)) * ui(O(v"S1, . . . , vSi , . . . , v

"Sn

))),

onde cada !Si(v"Si

) = s"i

&'def para todo jogador i # N vale que

G!, (!Si) |= )vSi(ui(O(v"S1, . . . , v"Sn

)) * ui(O(v"S1, . . . , vSi , . . . , v

"Sn

))),

onde cada !Si(v"Si

) = s"i

&'def G!, (!Si) |=!

i!N)vSi

-ui(O(v"S1

, . . . , v"Sn)) * ui(O(v"S1

, . . . , vSi , . . . , v"Sn

)).,

onde cada !Si(v"Si

) = s"i

!

B.3.2Equilíbrio de Subjogo Perfeito

A fórmula " abaixo é a fórmula de equilíbrio de subjogo perfeito da seção6.2.6 (página 126).

" := [AG]

% !i!N

i ( )vsi

-ui(Oh(h, v"s1

, . . . , v"sn)) * ui(Oh(h, v"s1

, . . . , vsi , . . . , v"sn

)).&

(B-7)

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Apêndice B. Provas dos Teoremas de Teoria dos Jogos em GAL 212

Teorema 6.12 Sejam ! um jogo extensivo com informação perfeita, s" = (s"i )

um perfil de estratégias para !, G! uma estrutura de GAL na versão extensivapara ! como definido na seção 6.2.4, (!Si) funções de valorações de sorts (Si), e" uma fórmula de equilíbrio de subjogo perfeito para G! como definido acima.

Um perfil de estratégias s" é um equilíbrio de subjogo perfeito para !

&' G!, (!Si) |=# ", onde cada !Si(v"Si

) = s"i

Prova.

Um perfil de estratégias s" é um equilíbrio de subjogo perfeito para !

&'def para todo jogador i e para todo histórico não-terminal h # H

para o qual P (h) = i temos que ui(Oh(h, s"1, . . . , s"n)) * ui(Oh(h, s"1, . . . , si, . . . , s

"n))

para toda estratégia si # Si

Pela definição de G! a partir de !, temos que cada estado de G!, que representaum histórico, é alcançado por um caminho a partir do estado inicial ., querepresenta o histórico inicial; e ainda, que o domínio DSi é o conjunto deestratégias Si (i.e. DSi = Si), e o jogador que deve tomar uma ação emum estado ek, que representa um histórico hk, é definido pela função P (i.e.Nek

= {P (hk)}), e, finalmente, o símbolo h é interpretado em ek pelo históricohk (i.e. !̄H(ek, h) = hk). Daí, temos que

&' para todo caminho $(.) = e0, e1, . . . e para todo k * 0

vale que para todo jogador i # N vale que SE i # Nek

ENTÃO para todo di # DSi temos que

(ui(Oh(!̄H(ek, h), s"1, . . . , s"n) * ui(Oh(!̄H(ek, h), s"1, . . . , di, . . . , s

"n)))

Como a função Oh e as funções de utilidades são interpretadas de forma rígida

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Apêndice B. Provas dos Teoremas de Teoria dos Jogos em GAL 213

e de acordo com !, temos que

&' para todo caminho $(.) = e0, e1, . . . e para todo k * 0

vale que para todo jogador i # N vale que

SE G!, (!s) |=eki ENTÃO para todo di # DSi temos que

G!, (!Si(vSi|di)) |=ek

-ui(Oh(h, v"S1

, . . . , v"Sn)) * ui(Oh(h, v"S1

, . . . , vSi , . . . , v"Sn

)).,

onde cada !Si(v"Si

) = s"i

&'def para todo caminho $(.) = e0, e1, . . . e para todo k * 0

vale que para todo jogador i # N vale que

SE G!, (!s) |=eki ENTÃO para todo di # DSi temos que

G!, (!Si(vSi|di)) |=ek

-ui(Oh(h, v"S1

, . . . , v"Sn)) * ui(Oh(h, v"S1

, . . . , vSi , . . . , v"Sn

)).,

onde cada !Si(v"Si

) = s"i

&'def para todo caminho $(.) = e0, e1, . . . e para todo k * 0

vale que para todo jogador i # N vale que SE G!, (!Si) |=eki

ENTÃO G!, (!Si) |=ek)vSi

-ui(Oh(h, v"S1

, . . . , v"Sn)) * ui(Oh(h, v"S1

, . . . , vSi , . . . , v"Sn

)).,

onde cada !Si(v"Si

) = s"i

&'def para todo caminho $(.) = e0, e1, . . . e para todo k * 0

vale que para todo jogador i # N vale que

G!, (!Si) |=ek

-i ( )vSi

-ui(Oh(h, v"S1

, . . . , v"Sn)) * ui(Oh(h, v"S1

, . . . , vSi , . . . , v"Sn

))..

,

onde cada !Si(v"Si

) = s"i

&'def para todo caminho $(.) = e0, e1, . . . e para todo k * 0 vale que

G!, (!Si) |=ek

% !i!N

i ( )vSi

-ui(Oh(h, v"S1

, . . . , v"Sn)) * ui(Oh(h, v"S1

, . . . , vSi , . . . , v"Sn

)).&

,

onde cada !Si(v"Si

) = s"i

&'def

G!, (!Si) |=# [AG]

% !i!N

i ( )vSi

-ui(Oh(h, v"S1

, . . . , v"Sn)) * ui(Oh(h, v"S1

, . . . , vSi , . . . , v"Sn

)).&

,

onde cada !Si(v"Si

) = s"i

!

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Apêndice B. Provas dos Teoremas de Teoria dos Jogos em GAL 214

B.4Quantificando em Jogos Extensivos

B.4.1Definições de Equilíbrio de Nash

Lema 6.2.7 As seguintes asserções são equivalentes.

1. Para todo jogador i # N temos que ui(O(s"1, . . . , s"n)) *

ui(O(s"1, . . . , si, . . . , s"n)) para todo si # Si.

2. Para todo h # O(s"1, . . . , s"n) para o qual P (h) = i vale que

ui(Oh(h, s"1, . . . , s"n)) * ui(Oh(h, s"1, . . . , si, . . . , s"n)) para todo si # Si.

3. Para todo si # Si e para todo h # O(s"1, . . . , s"n) para o qual P (h) = i

vale que ui(Oh(h, s"1, . . . , s"n)) * ui(Oh(h, s"1, . . . , si, . . . , s"n)).

Prova.

– Caso 1 =' 2: Suponha por contradição que NÃO para todo h #O(s"1, . . . , s

"n) para o qual P (h) = i vale que ui(Oh(h, s"1, . . . , s

"n)) *

ui(Oh(h, s"1, . . . , si, . . . , s"n)) para todo si # Si.

Daí, temos que existe um h # O(s"1, . . . , s"n) para o qual P (h) = i vale que

ui(Oh(h, s"1, . . . , s"n)) < ui(Oh(h, s"1, . . . , si, . . . , s"n)) para algum si # Si.

Por outro lado, por hipótese, temos para o jogador i queui(O(s"1, . . . , s

"n)) * ui(O(s"1, . . . , si, . . . , s"n)) para todo si # Si. Daí,

temos uma contradição, pois para o jogador i no histórico h temos queui(Oh(h, s"1, . . . , s

"n)) * ui(Oh(h, s"1, . . . , si, . . . , s"n)) para todo si # Si.

– Caso 2 =' 1: Suponha por contradição que NÃO para todo jogadori # N temos que ui(O(s"1, . . . , s

"n)) * ui(O(s"1, . . . , si, . . . , s"n)) para

todo si # Si. Daí, temos que existe um jogador i # N tal queui(O(s"1, . . . , s

"n)) < ui(O(s"1, . . . , si, . . . , s"n)) para algum si # Si. Agora

iremos considerar dois casos.

1. O jogador i não toma uma decisão em O(s"1, . . . , s"n). Então, o

jogador i não pode alterar os históricos terminais, assim, temosque ui(O(s"1, . . . , s

"n)) = ui(O(s"1, . . . , si, . . . , s"n)) para todo si # Si,

chegando assim a uma contradição.

2. O jogador i toma uma decisão em O(s"1, . . . , s"n). Então, em algum

histórico h para o qual P (h) = i temos que ui(Oh(h, s"1, . . . , s"n)) <

ui(Oh(h, s"1, . . . , si, . . . , s"n)) para algum si # Si. O que contradiz ahipótese que para todo h # O(s"1, . . . , s

"n) para o qual P (h) = i vale

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Apêndice B. Provas dos Teoremas de Teoria dos Jogos em GAL 215

que ui(Oh(h, s"1, . . . , s"n)) * ui(Oh(h, s"1, . . . , si, . . . , s"n)) para todo

si # Si

– Caso 1 =' 3: semelhante ao caso 1 =' 2.

– Caso 3 =' 1: semelhante ao caso 2 =' 1.

!

B.4.2Jogo Extensivo Versão Matricial

As fórmulas "1, "2, #1 e #2 abaixo são, respectivamente, equilíbrio deNash na versão De Dicto da seção 6.2.7 (página 132), equilíbrio de Nash naversão De Re da seção 6.2.7 (página 133), equilíbrio de subjogo perfeito naversão De Dicto da seção 6.2.7 (página 130), equilíbrio de subjogo perfeito naversão De Re da seção 6.2.7 (página 131).

!1 ::= $vNT

0

BB@

vNT ! O(s1, . . . , sn) % V

i"NP (vNT ) = i % $vSi

`ui(Oh(vNT , s1, . . . , sn)) & ui(Oh(vNT , s1, . . . , vSi , . . . , sn))

´!

1

CCA

(B-8)

!2 ::= $vS1 . . . $vSn$vNT

0

BB@

vNT ! O(s1, . . . , sn) % V

i"NP (vNT ) = i %

`ui(Oh(vNT , s1, . . . , sn)) & ui(Oh(vNT , s1, . . . , vSi , . . . , sn))

´!

1

CCA

(B-9)

"1 ::= $vNT

V

i"NP (vNT ) = i % $vSi

`ui(Oh(vNT , s1, . . . , sn)) & ui(Oh(vNT , s1, . . . , vSi , . . . , sn))

´!

(B-10)

"2 ::= $vS1 . . . $vSn$vNT

V

i"NP (vNT ) = i %

`ui(Oh(vNT , s1, . . . , sn)) & ui(Oh(vNT , s1, . . . , vSi , . . . , sn))

´!

(B-11)

Teorema 6.17 Sejam ! um jogo extensivo, s" = (s"i ) um perfil de estratégiaspara !, G! a estrutura de GAL na versão matricial para ! como definido naseção 6.2.1, "1 a fórmula B-8 de equilíbrio de Nash na versão De Dicto, "2

a fórmula B-9 de equilíbrio de Nash na versão De Re, #1 a fórmula B-10 deequilíbrio de subjogo perfeito na versão De Dicto, e #2 a fórmula B-11 deequilíbrio de subjogo perfeito na versão De Re.

1. Um perfil de estratégias s" é um EN para ! &' G! |=s! "1.

2. Um perfil de estratégias s" é um EN para ! &' G! |=s! "2.

3. Um perfil de estratégias s" é um ESP para ! &' G! |=s! #1.

4. Um perfil de estratégias s" é um ESP para ! &' G! |=s! #2.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Apêndice B. Provas dos Teoremas de Teoria dos Jogos em GAL 216

1. Prova.

Um perfil de estratégias s" é um EN

&'lema6.2.7 para todo h#O(s"1, . . . , s"n) e, para todo jogador i#N, para o qual P (h)= i

vale que ui(Oh(h, s"1, . . . , s"n)) * ui(Oh(h, s"1, . . . , si, . . . , s

"n)) para todo si # Si.

&' para todo h # NT se h # O(s"1, . . . , s"n) então para todo jogador i # N

para o qual P (h) = i vale que ui(Oh(h, s"1, . . . , s"n)) * ui(Oh(h, s"1, . . . , si, . . . , s

"n))

para todo si # Si.

De acordo com a definição de G!, temos que os símbolos constantes (si)

são interpretados no estado s" como as estratégias (s"i ), i.e. !̄Si(s", si) =

s"i ; o domínio DNT é o conjunto de não-terminais NT de !; e cadadomínio (DSi) é o conjunto de estratégias Si do jogo !.

Por definição temos que !NT (vNT |h)(vNT ) = h e para todo jogador i # N

!̄Si(vSi|si)(s", vSi) = si e !̄Si(s", si) = s"i .

&' para todo h # DNT se !NT (vNT |h)(vNT ) # O(!̄S1(s", s1), . . . , !̄Sn(s", sn))

e para todo jogador i # N para o qual P (!NT (vNT |h)(vh)) = i vale que

ui(Oh(!NT (vNT |h)(vNT ), !̄S1(s", s1), . . . , !̄Sn(s", sn))) *

ui(Oh(!NT (vNT |h)(vNT ), !̄S1(s", s1), . . . , !̄Si(vSi|si)(s

", vSi), . . . , !̄Sn(s", sn)))

para todo si # DSi .

De acordo com a definição de G! temos que as funções P, O, Oh, ui e #são interpretadas rigidamente como no jogo !. Daí, temos que

&' para todo h # DNT se G!,!NT (vNT |h) |=s! vNT # O(s"1, . . . , s"n)

e para todo jogador i # N se G!,!NT (vNT |h) |=s! P (vNT ) = i vale que

G!,!NT (vNT |h),!Si(vSi|si) |=s! ui(Oh(vNT , s1, . . . , sn)) *

ui(Oh(vNT , s1, . . . , vSi , . . . , sn)) para todo si # DSi .

&' para todo h # DNT se G!,!NT (vNT |h) |=s! vNT # O(s"1, . . . , s"n)

e para todo jogador i # N se G!,!NT (vNT |h) |=s! P (vNT ) = i vale que

G!,!NT (vNT |h), |=s!

)vSi (ui(Oh(vNT , s1, . . . , sn)) * ui(Oh(vNT , s1, . . . , vSi , . . . , sn)))

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Apêndice B. Provas dos Teoremas de Teoria dos Jogos em GAL 217

&' para todo h # DNT se G!,!NT (vNT |h) |=s! vNT # O(s"1, . . . , s"n)

e para todo jogador i # N vale que

G!,!NT (vNT |h) |=s!

P (vNT ) = i ( ()vSi (ui(Oh(vNT , s1, . . . , sn)) * ui(Oh(vNT , s1, . . . , vSi , . . . , sn))))

&' para todo h # DNT se G!,!NT (vNT |h) |=s! vNT # O(s"1, . . . , s"n) vale que

G!,!NT (vNT |h) |=s!

!i!N

P (vNT ) = i ( ()vSi (ui(Oh(vNT , s1, . . . , sn)) * ui(Oh(vNT , s1, . . . , vSi , . . . , sn))))

&' G! |=s!

)vNT

"

#$vNT # O(s!1, . . . , s!n) (

% !i"N

P (vNT ) = i ( ()vSi (ui(Oh(vNT , s1, . . . , sn)) * ui(Oh(vNT , s1, . . . , vSi , . . . , sn))))&

(

)*

!

2. Prova. Utilizando a prova anterior e o fato de que a ordem das quanti-ficações universais de sorts diferentes podem ser alternadas, mantendoassim a relação de satisfatibilidade. !

3. Prova. Foi provado na seção B.2.2 deste apêndice. !

4. Prova. Utilizando a prova anterior e o fato de que a ordem das quanti-ficações universais de sorts diferentes podem ser alternadas, mantendoassim a relação de satisfatibilidade. !

B.4.3Jogo Extensivo Versão Extensiva

As fórmulas "1, "2, #1 e #2 abaixo são, respectivamente, as fórmulas deequilíbrio de Nash na versão De Dicto da seção 6.2.7 (página 132), equilíbriode Nash na versão De Re da seção 6.2.7 (página 133), equilíbrio de subjogoperfeito na versão De Dicto da seção 6.2.7 (página 130), equilíbrio de subjogoperfeito na versão De Re da seção 6.2.7 (página 131).

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Apêndice B. Provas dos Teoremas de Teoria dos Jogos em GAL 218

!1 ::= [EG]

"

#$h # O(v!s1

, . . . , v!sn) -

% !i"N

i ( )vsi

-ui(Oh(h, v!s1

, . . . , v!sn)) * ui(Oh(h, (v!s1

, . . . , vsi , . . . , v!sn

))).&

(

)*

(B-12)

!2 ::= )vs1 . . .)vsn [EG]

"

#$h # O(v!s1

, . . . , v!sn) -

% !i"N

i (-ui(Oh(h, v!s1

, . . . , v!sn)) * ui(Oh(h, (v!s1

, . . . , vsi , . . . , v!sn

))).&

(

)*

(B-13)

"1 ::= [AG]% !

i"Ni ( )vsi

-ui(Oh(h, v!s1

, . . . , v!sn)) * ui(Oh(h, v!s1

, . . . , vsi , . . . , v!sn

)).&

(B-14)

"2 ::= )vs1 . . . )vsn [AG]% !

i"Ni (

-ui(Oh(h, v!s1

, . . . , v!sn)) * ui(Oh(h, v!s1

, . . . , vsi , . . . , v!sn

)).&

(B-15)

Teorema 6.18 Sejam ! um jogo extensivo, s" = (s"i ) um perfil de estratégiaspara !, G! a estrutura de GAL na versão extensiva para ! como definido naseção 6.2.4, "1 a fórmula B-12 de equilíbrio de Nash na versão De Dicto, "2

a fórmula B-13 de equilíbrio de Nash na versão De Re, #1 a fórmula B-14de equilíbrio de subjogo perfeito na versão De Dicto, e #2 a fórmula B-15 deequilíbrio de subjogo perfeito na versão De Re.

1. Um perfil de estratégias s" é um EN para ! &' G!, (!Si) |=# "1, ondecada !Si(v

"Si

) = s"i .

2. Um perfil de estratégias s" é um EN para ! &' G!, (!Si) |=# "2, ondecada !Si(v

"Si

) = s"i .

3. Um perfil de estratégias s" é um ESP para ! &' G!, (!Si) |=# #1, ondecada !Si(v

"Si

) = s"i .

4. Um perfil de estratégias s" é um ESP para ! &' G!, (!Si) |=# #2, ondecada !Si(v

"Si

) = s"i .

1. Prova.

Um perfil de estratégias (s"i ) é um equilíbrio de Nash para S!.

&' para todo jogador i # N vale que ui(O(s"'i, s"i )) * ui(O(s"'i, si)),

para toda estratégia si # Si.

&'lema6.2.7 para todo h#O(s"1, . . . , s"n) e para todo jogador i#N para o qual P (h)= i

vale que ui(Oh(h, s"1, . . . , s"n)) * ui(Oh(h, s"1, . . . , si, . . . , s

"n)) para todo si # Si.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Apêndice B. Provas dos Teoremas de Teoria dos Jogos em GAL 219

Iremos tomar o caminho em G! que é definido pelo pelos históricos emO(s"1, . . . , s

"n) de acordo com a definição de G! a partir de !, daí temos

que

&' existe um caminho $(.) = e0, e1, . . . tal que para todo k * 0 vale que

!̄H(ek, h) # O(s"1, . . . , s"n) E para todo jogador i # N SE i # Nek

ENTÃO para todo si # Si vale que

(ui(Oh(!̄H(ek, h), s"1, . . . , s"n)) * ui(Oh(!̄H(ek, h), (s"1, . . . , si, . . . , s

"n)))) ,

onde cada !Si(v"Si

) = s"i .

Como o domínio DSi de cada sort Si, a função O, a função Oh e as funçõesde utilidades são interpretadas rigidamente de acordo com a definição de!, temos que

&' existe um caminho $(.) = e0, e1, . . . tal que para todo k * 0 vale que

G!, (!Si) |=ekh # O(v"S1

, . . . , v"Sn) E para todo jogador i # N SE G!, (!Si) |=ek

i

ENTÃO para todo si # Si vale que

G!, (!Si(vSi|si)) |=ek

-ui(Oh(h, v"S1

, . . . , v"Sn)) * ui(Oh(h, (v"S1

, . . . , vSi , . . . , v"Sn

))).,

onde cada !Si(v"Si

) = s"i .

&'def existe um caminho $(.) = e0, e1, . . . tal que para todo k * 0 vale que

G!, (!Si) |=ekh # O(v"S1

, . . . , v"Sn) E para todo jogador i # N SE G!, (!Si) |=ek

i

ENTÃO G!, (!Si) |=ek)vSi

-ui(Oh(h, v"S1

, . . . , v"Sn)) * ui(Oh(h, (v"S1

, . . . , vSi , . . . , v"Sn

))).,

onde cada !Si(v"Si

) = s"i .

&'def existe um caminho $(.) = e0, e1, . . . tal que para todo k * 0 vale que

G!, (!Si) |=ekh # O(v"S1

, . . . , v"Sn) E para todo jogador i # N

G!, (!Si) |=eki ( )vSi

-ui(Oh(h, v"S1

, . . . , v"Sn)) * ui(Oh(h, (v"S1

, . . . , vSi , . . . , v"Sn

))).,

onde cada !Si(v"Si

) = s"i .

&'def existe um caminho $(.) = e0, e1, . . . tal que para todo k * 0 vale que

G!, (!Si) |=ekh # O(v"S1

, . . . , v"Sn) E

G!, (!Si) |=ek

!i!N

i ( )vSi

-ui(Oh(h, v"S1

, . . . , v"Sn)) * ui(Oh(h, (v"S1

, . . . , vSi , . . . , v"Sn

))).,

onde cada !Si(v"Si

) = s"i .

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Apêndice B. Provas dos Teoremas de Teoria dos Jogos em GAL 220

&'def G!, (!Si) |=#

[EG]

"

#$h # O(v"S1

, . . . , v"Sn) -

% !i!N

i ( )vSi

-ui(Oh(h, v"S1

, . . . , v"Sn)) * ui(Oh(h, (v"S1

, . . . , vSi , . . . , v"Sn

))).&

(

)*

onde cada !Si(v"Si

) = s"i .

!

2. Prova. Por um lado, a fórmula anterior representa EN, e utilizando o fatode que a quantificação universal De Dicto do operador [EG] implica naDe re, temos que se uma solução é um EN, então ela satisfaz a fórmulana versão De Dicto e por conseqüência satisfaz também a fórmula naversão De Re. Por outro lado, não temos que, De Re implica em DeDicto para [EG], assim é de se esperar que soluções que não sejam EN,sejam satisfeita na versão De Re. Todavia, isto não ocorre, e temos aequivalência entre as fórmulas. O que ocorre é o operador [EG] nãoestá quantificando sobre um caminho qualquer, e sim sobre um caminhoespecífico, o resultante das estratégias de cada jogador. Por este motivo,temos que estas fórmulas são equivalentes. A prova formal, é similar aocaso anterior e não iremos apresentá-la. !

3. Prova. Foi provado na seção B.3.2 deste apêndice. !

4. Prova. Pela prova anterior e pela equivalência entre De Re e De Dictoda quantificação universal do operador [AG]. !

B.5Jogo Extensivo com Informação Imperfeita

As fórmulas "1 e "2 abaixo são, respectivamente, as fórmulas de equilíbriode Nash de estratégias mistas e comportamentais da seção 6.4.1 (página 146).

"1 ::=!

i!N)v#i(Ui(v

"#1

, . . . , v"#n) * Ui(v

"#1

, . . . , v#1 , . . . , v"#n

)) (B-16)

"2 ::=!

i!N)v"i(Ui(v

""1

, . . . , v""n) * Ui(v

""1

, . . . , v"1 , . . . , v""n

)) (B-17)

Teorema 6.21 Sejam ! um jogo extensivo com informação imperfeita, % " =

(% "i ) um perfil de estratégias mistas para !, G! uma estrutura de GAL para !

como definido na seção 6.4.1, (!#i) funções de valorações de sorts ("i), e "1

uma fórmula de equilíbrio de estratégias mistas para G! como definido acima.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Apêndice B. Provas dos Teoremas de Teoria dos Jogos em GAL 221

Um perfil de estratégias (% "i ) é um equilíbrio de estratégias mistas para !

&' G!, (!#i) |= "1, onde cada !#i(v"#i

) = % "i

Prova. Sejam (v#i) variáveis e (!#i) funções de valorações, uma para cadajogador i, de sorts ("i), e ainda !R uma função de valoração de sort R.

% " é um equilíbrio de estratégias mistas para !

&'def para todo jogador i # N vale que Ui(%"1 , . . . , % "n)) * Ui(%

"1 , . . . , %i, . . . , %

"n)

para todo %i # "i

Como o domínio D#i de cada sort "i em G! é definido pelo conjunto "i dojogo !, temos que

&' para todo jogador i # N e )di # D#i vale que

Ui(%"1 , . . . , % "n)) * Ui(%

"1 , . . . , di, . . . , %

"n))

&'def5.7 para todo jogador i # N e )di # DSi vale que

Ui(!#1(v"#1

), . . . , !#n(v"#n))) * Ui(!#1(v

"#1

), . . . , !#i(v#i|di)(v#i), . . . , !#n(v"#n))),

onde cada !#i(v"#i

) = % "i

Como as funções de utilidade são interpretadas rigidamente de acordo com !,temos que

&'def5.9 para todo jogador i # N e )di # DSi vale que

G!, (!#i(v#i|di)) |= (Ui(v"#1

, . . . , v"#n) * Ui(v

"#1

, . . . , v#i , . . . , v"#n

)),

onde cada !#i(v"#i

) = % "i

&'def5.9 para todo jogador i # N vale que

G!, (!#i) |= )v#i(Ui(v"#1

, . . . , v"#n) * Ui(v

"#1

, . . . , v#i , . . . , v"#n

)),

onde cada !#i(v"#i

) = % "i

&'def5.9 G!, (!#i) |=!

i!N)v#i

-Ui(v

"#1

, . . . , v"#n) * Ui(v

"#1

, . . . , v#i , . . . , v"#n

).,

onde cada !#i(v"#i

) = % "i

!A prova abaixo é semelhante a apresentada acima.

Teorema 6.22 Sejam ! um jogo extensivo com informação imperfeita, % " =

(% "i ) um perfil de estratégias comportamentais para !, G! uma estrutura deGAL para ! como definido na seção 6.4.1,(!"i) funções de valorações de sorts

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Apêndice B. Provas dos Teoremas de Teoria dos Jogos em GAL 222

(#i), e "2 uma fórmula de equilíbrio de estratégias comportamentais para G!

como definido acima.

Um perfil de estratégias (% "i ) é um equilíbrio de estratégias comportamentais para !

&' G!, (!"i) |= "2, onde cada !"i(v""i

) = % "i

B.6Jogo de Coalizão Com Utilidades Transferíveis

A fórmula " abaixo é a fórmula de core para jogo de coalizão comutilidades transferíveis da seção 6.5.1 (página 148).

" ::= )S(c(x, S) * v(S)) (B-18)

Teorema 6.23 Sejam ! = !N, v" um jogo de coalizão com utilidade transferí-veis, x uma seqüência possível para N no jogo !, G! uma estrutura de GALpara ! como definido na seção 6.5 (página 148) e " uma fórmula de core comodefinido acima.

x está no core &' G! |=x "

Prova.

x está no core

&'def x é uma seqüência possível de N e c(s, S) * v(S) para todo S / N\..

Como x # Nf e a constante x é interpretada como x do jogo !, e ainda odomínio de I é o conjunto 2N\. e as funções c e v são interpretadas rigidamentecomo em ! temos que

G! |=x )S(c(x, S) * v(S))

!

B.7Jogo de Coalizão Sem Utilidades Transferíveis

A fórmula " abaixo é a fórmula de core para jogo de coalizão semutilidades transferíveis da seção 6.8.1 (página 153)1.

1Lembre-se que a relação # está definida na linguagem não-lógica.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Apêndice B. Provas dos Teoremas de Teoria dos Jogos em GAL 223

" ::=

+x # v(IN) - ¬$vI$vy

++vy # v(vI) -

+1

i!N

(i # vI ( ¬ (x 0i vy))

,,,,

(B-19)

Teorema 6.27 Sejam ! = !N,X, v, (0i)" um jogo de coalizão sem utilidadestransferíveis, x uma conseqüência de X no jogo !, G! uma estrutura de GALpara ! como definido na seção 6.8 (página 151) e " uma fórmula de core comodefinido acima.

x está no core &' G! |=x "

Prova.

x está no core

&'def x # v(N) (B-20)

e não existe uma coalizão S / N\. e uma conseqüência y # v(S)

tal que y 1i x para todo i # S. (B-21)

Como no estado x # SE temos que o símbolo x é interpretado por x # X,a constante IN é interpretada como o conjunto N do jogo ! e a função v éinterpretada como em ! temos a partir de B-20 que

G! |=x x # v(IN) (B-22)

Sejam vI e !I uma variável e uma função de valoração de sort I e aindavy e !X uma variável e função de valoração de sort X.

Como o domínio DI é o conjunto de coalizões do jogo !, o domínio DX éo conjunto X de !, e a função v é interpretada como em ! temos a partir deB-21 que

Não existe S # DI e y # DX tal queG!,!I(vI |S),!X(vy|y) |=x vy # v(vI)

e para todo i # v(S) temos queG!,!I(vI |S),!X(vy|y) |=x ¬(x 0i vy)

&' Não existe S # DI e y # DX tal que

G!,!I(vI |S), !X(vy|y) |=x vy # v(vI)

e para todo i # N temos que

G!,!I(vI |S), !X(vy|y) |=x i # v(S) ( ¬(x 0i vy)

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Apêndice B. Provas dos Teoremas de Teoria dos Jogos em GAL 224

&' Não existe S # DI e y # DX tal que

G!,!I(vI |S),!X(vy|y) |=x vy # v(vI) e

G!,!I(vI |S),!X(vy|y) |=x

1

i!N

(i # v(S) ( ¬(x 0i vy))

&' Não existe S # DI e y # DX tal que

G!,!I(vI |S),!X(vy|y) |=x vy # v(vI) -+

1

i!N

(i # v(S) ( ¬(x 0i vy))

,

&' G! |=x ¬$vI$vy

+vy # v(vI) -

+1

i!N

(i # v(S) ( ¬(x 0i vy))

,,(B-23)

Daí, a partir de B-22 e B-23, temos que

&' G! |=x

+x # v(IN) - ¬$vI$vy

+vy # v(vI) -

+1

i!N

(i # v(S) ( ¬(x 0i vy))

,,,

(B-24)

!

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

CDefining Agents via Strategies:Towards a view of MASs as Games

D. R. Vasconcelos1, E. H. Haeusler1, and Mario R. F. Benevides2

1Pontifícia Universidade Católica do Rio de Janeiro, Brazildavirv,[email protected]

2Programa de Sistemas, COPPE/UFRJ, [email protected]

AbstractIn this article, we intend to characterize, at least on BDI (Belief-Desire-Intention) basis, a class of MASs G for which there is a somehowequivalent class of games and vice-versa. As a consequence, criteria ofrationality for agents can be directly applied to players and vice-versa.Game analysis formal tools can be applied to MAS as well. The mainresults of this article are the following two lemmata.Lemma I: Every MAS belonging to G is, essentially, a Game.Lemma II: Every Game can be implemented as a MAS and Equilibriaare Optimal Desires Satisfaction.

C.1Introduction

Multi-Agent Systems (MASs) have been widely used as an adequateabstraction for the design and implementation of a large sort of applications.A system of agents whenever appropriately arranged is called a communityof agents. This arrangement concerns the integration of individual beliefstowards common beliefs, integration of agent’s individual plans into commonplans and finally the integration of agent’s individual actions performingcommon actions. This integration follows and is induced (in a very precisemathematical meaning) by the way the community is organized, that is, bythe way each kind of agent communicates each other and the way that theycan communicate their beliefs and interact among themselves. This establishesa kind of architecture for a MAS. This article regards to the view that aMAS is strongly based on the integration of the belief-intention-planning of

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Appendix C. Defining Agents via Strategies:Towards a view of MASs as Games 226

the individual agents in order to build a whole community of agents. Specificaspects of action and ontological (structured) concerns of MASs are out ofscope of this work.

Software Architecture is a well-established and studied subject when-ever concerned to components. Let us discuss briefly some points that raisewhen comparing MAS and Component-Based architectures. Di!erently fromComponents, Agents have a belief model, and a set of intentions, that rulesplans, which are supposed to perform actions in order to satisfy some of theirintentions. The interdependence among intentions, the set of beliefs and thegenerated plans become the behavior of an agent more sophisticated than asole component behavior. Even for a reconfigurable component architecture,the behavior of their components is more rigid than the agent case. In generala dynamic reconfiguration is obtained by changing the channels of communi-cation among the components. This can be done by changing the connectors ina predicted way (a connector has a finite amount of ports). On the other hand,despite the amount of possible paths of communications among agents beingfinite as well, the way of a MAS changes the channels of communications isstrongly related to the belief-intention-planning feature of the agent, and thisis less predictable than the component’s case, since the evolving of an agent’sbelief is a feature more related to logic than to computation (in the sense of be-havior). The literature call BDI (Belief-Desire-Intention, see (Woo00)) modelto this logical approach that integrates belief, intention and planning in orderto model the main concerns of an individual agent.

We will take the BDI model as our starting point for an individual agentdefinition. Regarding the MAS architecture discussion, we take as an essentialaspect to be dealt with the integration of the very logical aspect of each BDIagent model. Thus, we take a MAS, in the context of belief-intention aspects,as the harmonious integration of each individual agent’s model in the wholesystem1. As one can expect, an (individual) agent of a MAS does not have tobelieve or even know the global intention of it. The MAS behavior should beessentially driven by the rational aspect of each of its components. This veryfeature regards (rational) players in a game, from the particular point of viewof Game Theory.

Game Theory is a branch of Mathematics, extensively used by economistsand social scientists, well-suited to define and study rational behavior in thecontext of cooperative and non-cooperative environments. Equilibria notions

1An interesting and natural consequence of this view of a MAS is that it has also its ownBDI model, representing common beliefs, intentions and performing a common plan to fulfillits goals, taking a coalition of agents as a new kind of agent. However this broader view ofMAS, as a single agent, seems to be of no help in practical design of agent-based systems.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Appendix C. Defining Agents via Strategies:Towards a view of MASs as Games 227

(after Nash) play a central role in solution concepts regarding a great varietyof Games assuming the players are rational. Game Theory is mainly takeninto account when the scientists want to predict and study global phenomenafrom individual known behavior. Typical examples of this kind of researchcome from phenomena emerging from Markets, Auctions and Elections. Onecan observe a strong similarity between the rationales coming from GameTheory and Multi-Agent Systems modeling. Game Theory provides somegeneral Game definitions, some of them equivalent in a certain sense. It alsoprovides solution concepts to each kind of Game, pointing out relationshipsamong the di!erent solution concepts, as for example the “Folk Theorems”relating equilibria points in a game to the repeated game version. Algorithmsfor searching and formally identifying solution concepts in a (generic) gameare worth of study for theoretical and practical notions.

The previous discussion raises up the point of having Game Theory asa worth tool to be applied in the analysis of MAS validation and designing.The existence of formal tools (programs), some of them listed in a subsequentsubsection, that help in this validation task turns out feasible the formalvalidation of MAS. On the other hand, MAS themselves can be applied tomodel and formally study, by means of simulation, the kind of phenomenatypically subjected to Game Theory analysis. In (KAE+05) it is shown aquite good comparison between Game Theory and MAS formal analysis ofthe market of electricity. The main guide line and motivation of this articleis to establish the relationship between Games and MASs. We intend tocharacterize, at least on a BDI basis, a class of Games for which there is asomehow equivalent MAS and vice-versa. The notion of equivalence of MASand Games will be taken as logical, since BDI has a logical counter-part playedby Lora’s2 theories.

C.1.1More motivations to our goal

By taking the main defining aspects of the BDI model as specificstrategies in an extensive game (see (OR94)) and the behavior of an agentas a player’s (possible) sequence of steps in this game, we intend to showthat in some cases, a MAS can be viewed as a kind of coalition gamewith the coalition among the players representing the integration of eachplayer individual strategy into the whole strategy of the coalition game. Fromthat point on, one can proceed a formal analysis (verification, validation of

2LORA is the logical language designed to specify agents regarding to the BDI model.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Appendix C. Defining Agents via Strategies:Towards a view of MASs as Games 228

properties as well as theorem proving) of a MAS using formal tools designedfor game solution concepts analysis.

Although historically Game Theory has been considered more suitableto perform quantitative analysis than qualitative ones, there has been a lot ofapproaches that emphasizes Game Analysis on a qualitative basis, by usingan adequate logic in order to express games as well as their solution concepts.Some of the most representatives of these logics are: Alternating-time TemporalLogic (ATL) (AHK02) and its variations (ATEL and CATL), and we pointout (vdHW03, vdHJW05) as excellent references on this approach; GameLogic (PP03, Par85); Coalitional Logic (Pau01); Game Logic with Preferences(vOvdHW04); A temporal logic for analyzing extensive games with perfectinformation is described in (Bon01). To see more details about the connectionsand open problems between logic and games we point out (vB05).

In (VH03), yet another logical view of game-analysis is shown. A logic,Game Analysis Logic (GAL), based on first-order CTL (Computational TreeLogic) is defined and used to specify solution concepts as well as ordinaryproperties on specific games. However, since most of these logics are propo-sitional logic languages and BDI has been firstly developed on a first-ordersetting using LORA (see (Woo00)), we choose to develop our approach usingGAL itself, since it has first-order features and is a logic language which canexpress strategies in a suitable way. In (VHPB04) it is shown how GAL isable to specify Strategic Games and Coalition Games with Transferable Pay-o!s, as well as their main solution concepts, namely, Nash Equilibrium andCore. Besides that, we have a prototype of model-checker for GAL, namelyGALV, that has been developed according to the main intentions of the ap-proach advocated here. GALV is available for download at www.tecmf.inf.puc-rio.br/DaviRomero.

This article argues in favor of taking agents as players in a game and thatthe definition of an agent is made by the definition of his strategy in the game.The main results of this article characterize a class G of MASs as Games suchthat the following two lemmata hold.

Lemma I: Every MAS belonging to G is, essentially, a Game.Lemma II: Every Game can be implemented as a MAS and Equilibria

are Optimal Desires Satisfaction.In (VHB06) we present these lemmata for restricted BDI MASs which

do not allow simultaneous actions applications belonging to di!erent agents.In this work we also deal with simultaneous moves.

C.2

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Appendix C. Defining Agents via Strategies:Towards a view of MASs as Games 229

The background theories: BDI and Game Theory

It is assumed a basic reader’s familiarity with first-order and modal logics,including Kripke models and Bisimulation.

In order to have a theoretical basis to use Game-Analysis tools to proceedthe formal analysis of agents and MAS, we need to argue that from the verystarting of the design of an individual agent, we can take it as a player in aspecific game. We base our argumentation on the BDI model for agents. TheBDI model is based on three logical modalities, namely, the Belief modality, theDesire modality, the Intention modality, forming a Multi-modal logic, the firstmodality is a KD45 modality (see (Gol92)), the other two are KD modalities.GAL is based on CTL and CTL has the $X (“in some next state”) modalityas a KD modality and $U (“until”) modality behaving as a KD4L fixed-pointmodality over $X. Thus, in principle, the expressiveness power of both logicsare comparable, not forgetting that both are first-order logics. However, theBarcan principle, as well its inverse, that are required in GAL, seems to beliberalized in LORA (the logical counter-part of the BDI model). The temporalaspects are di!erent, since LORA is based on CTL", while GAL is based onCTL. The first lemma is a way of expressing, by means of strategies, the Desire-Intention aspect of BDI, while ensuring that the states of the defined gameprovide enough Belief for the player.

C.2.1The BDI Model

In this subsection we state the basic terminology, definitions and no-tations of the BDI model for (individual) agents. For the sake of a succinctpresentation we use some concepts of the possible worlds semantics of thelogical language LORA, presented in (Woo00).

This article does not intend to provide new definitions for BDI-agents.Thus, the mathematical terminology used in the sequel only has the purposeof providing a shorter text. The following definition is an extensional (model-theoretic) counter-part of the well-known BDI intentional definition such theone found in (Woo00). However, the reader must take into account that thereis an intentional meaning for the agent. This intentional meaning has the roleof establishing a relevant distinction between Beliefs, Desires and Intentions,namely:

– Beliefs consist of information available to the agent.

– Desires are “things” that the agent would like to make true. The onlyrestriction on desires is the consistency. Agents cannot have inconsistent

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Appendix C. Defining Agents via Strategies:Towards a view of MASs as Games 230

desires.

– Intentions are desires that the agent has chosen and committed to.

Definition 1 A temporal structure !T,<T " is a set T and a partially, discreteand serial order on it3. A temporal sub-structure !T 2, <T (" of !T,<T " is suchthat T 2 / T and <T (/<T .

Sometimes we use the carrier set T when referring to a temporal structure!T, <T ".

We remind the reader that a first-order language contains a set offunctional and predicate symbols of any finite arity4. Since we deal withcomputational agents, the following definition of MAS restricts the first-orderlanguage to a finite set of symbols, both predicates and functionals. In thatcase we name it as a finite first-order language.

Definition 2 Given a finite first-order language L we call L-state a pair!SL,!" where SL is first-order structure5 for L and ! : V ars ( Dom(SL)

is an assignment of values for variables.

Definition 3 Let !T,<T " be a temporal structure. A click over T is a pair(t1, t2) # T3T , with the property that there is no t # T such that t1 <T t <T t2

and t1 ,= t and t2 ,= t. Clicks(T ) is the set of all clicks over T

Definition 4 A MAS over a first-order language L, with a set ofagents A, and (finite) set of actions X, is a structure of the form!T, W, (Ba)a!A, (Ia)a!A, (Da)a!A, (Sw)w!W , AcX , AgX", such that: 1- W isa set of temporal substructures of T ; 2- Sw is a set of L-states indexed by thetime structure Tw; 3- Ba, Da, Ia / W 3 T 3W are, respectively, the Believe,Desire and Intention Kripke relationships between the states, for the agenta; 4- AcX : Clicks(T ) ( X associates an action with each time step in T ;5- AgX : X ( A associates an agent with each action in X. The followingrestrictions on the structure must hold:

– For each agent a, if !w, t, w(" # Ba then t # Tw 4 Tw#. Analogously forDa and Ia respectively.

– Define Bt,wa = {w(/!w, t, w(" # Ba}, and !w, w(" # Ba,t, i!, w( # Bt,w

a .For each a and t, Ba,t must be a serial, transitive and euclidean6.Analogous we define Da,t and Ia,t and these relations must be serial foreach a and t.

3A relation <T is serial, i!, )t1$t2(t1 <T t2).4A functional symbol with arity 0 (zero) is called a constant.5Space limits prevent us to write down the usual definitions regarded to first-order logic

semantics.6R is euclidean, i!, if !w, w#" # R and !w, w##" # R, then !w#, w##" # R.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Appendix C. Defining Agents via Strategies:Towards a view of MASs as Games 231

In the above definition a MAS is identified with its semantics. A stateSt represents the description of the MAS at time t. A world w # W representsthe beliefs on the evolving, in time, of state descriptions.

For the sake of terminology and notation, we denote as sub(t, w) thesubtree of Tw determined by the node t, whenever t # Tw.

It is worthwhile mentioning that the above extensional definition is thesemantics of an intentional definition of the MAS, usually defined by meansof a programming of each of its agents in a loop-control as, for example, theone shown in algorithm 12. It is well-known that this control-loop can be moredetailed, such that it includes assessment and reconsideration of Intentions,soundness of Planning with Desires, and more. Algorithm 13 shows a refinedversion of the previous one. Both versions are from (Woo00) and can be seen asparticular cases of the semantic Planning function defined below. This articletakes as free the self-explanatory content of these algorithms. The reader mustobserve that, according to the BDI definition taken in this article, there maybe simultaneous actions in the MAS.

Algoritimo 12 Agent Control LoopB := B0;I := I0;while true do

get next percepta ';B := brf(B, ');D := options(B, I);I := filter(B,D, I);$ := plan(B, I);execute($);

end whileaPercept is referred here to an agent’s perception of the environment.

The reader is invited to see the agents intentionally defined above asdenotations, according to the MAS definition 4, of either version of the shownagent control-loop algorithms. The intuitive meaning of these control-loops,regarded to the MAS extensional definition can be understood as following:

– The beliefs of an agent are dependent on the evolving of the time, sincethis is the only e!ect that can cause new percepts. It is worth noting thatthe evolving time can be caused by an action of (possibly) other agent;

– The Desires depend on the (new) beliefs and the (old) intentions. Thismeans that from a (hypothetical) belief position the agent may go furtherwhen considering intentions (next item);

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Appendix C. Defining Agents via Strategies:Towards a view of MASs as Games 232

Algoritimo 13 Refined Agent Control LoopB := B0;I := I0;while true do

get next percept ';B := brf(B, ');D := options(B, I);I := filter(B,D, I);$ := plan(B, I);while not (empty($) or succeeded(I,B) or impossible(I,B)) do

" := hd($);execute(");$ := tail($);get next percept ';B := brf(B, ');if reconsider(I,B) then

D := options(B, I);I := filter(B,D, I);

end ifif not sound($,I,B) then

$ := plan(B, I)end if

end whileend while

– The (new) intentions that can be taken by the agent include those canbe considered by an action raised hypothetically by the agent. This isvery similar to a look-ahead “attitude”;

– Re-considerations may come and the consequent soundness analysis isamong the tasks towards e"ciency.

In fact, an agent planning can be thought of as a procedure thatevaluates the set of Beliefs, Intentions and Desires of an agent and producesa structured action (a term in an algebra action). This structured actionwill afterwards executed subterm by subterm, sometimes yielding concurrentactions applications. However, each time either Beliefs, Intentions or Desiressets are update, the currently stored plan is revised to maintain soundness.From an abstract setting, the planning is a mapping from Beliefs, Intentionsand Desires into evolving L-states, so to say, a temporal substructure of T . Ofcourse this is a simplified version of planning, since we are taking a planningapplication as an atomic procedure. We briefly discuss at the conclusion how toconsider the more sophisticated setting at the theoretical level, without goingtoo abstract. The Plan function, defined below is the semantic counterpart ofthe just discussed concept of planning. Considering the planning as a relation

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Appendix C. Defining Agents via Strategies:Towards a view of MASs as Games 233

instead of a function, in order to get into non-deterministic plan generation is ofcourser formally feasible in our setting, but this would make the notation anddefinitions heavier. More than that, the Plan semantics function, for reasonsof consistency, would be a partial function.

In the following definition we consider Bela = Image(Ba) 5 Range(Ba)

and analogously for Desa and Inta.

Definition 5 (Planning Semantic Function) LetM = !T, W, (Ba)a!A, (Ia)a!A, (Da)a!A, (Sw)w!W , AcX , AgX" be a MAS.A planning function for the agent a # A is a partial function Plana :

Desa 3 Inta 3Bela ( Inta 5Bela, such that, for all t # T , if !w, t, w1" # Ba,!w, t, w2" # Ia, !w, t, w3" # Da then Plana(w1, w2, w3) is defined.

Definition 6 Let M = !T, W, (Ba)a!A, (Ia)a!A, (Da)a!A, (Sw)w!W , AcX , AgX"be a MAS. Plana, for each a # A, be the planning (partial) functions ofeach agent planning. The situation tree of M , regarded to the family of plansPlana(a # A) is defined as the labelled rooted tree SitM(Plana) that comesfrom the application of the following steps:

1. The root of SitM(Plana) is the same root of T ;

2. The labels of SitM are determined by AcX ;

3. If, for an agent a, !w, t, w1" # Ba, !w, t, w2" # Ia, !w, t, w3" # Da

and wp = Plana(w1, w2, w3), then t has sub(t, wp) as a subtree of it inSitM(Plana);

4. If there is a time t # SitM , such that, there are two or more Clickslabelled with the same action v # X leading into times t1, . . . , tk and{St1 , . . . , Stk} is not a chain7, then replace all of these subtrees by aninfinite path of clicks labelled by v8.

One can think of SitM(Plana) as describing all alternatives of evolutionof the behavior of M , regarding to the plans Plana(a # A). In the sequel(section C.3) we obtain a game definition from SitM(Plana).

7A set {A1, . . . , Ak} of L-structures is a chain, i!, there is a permutation p : [1, k] ( [1, k],such that Ap1 + Ap2 + . . . + Apk , where + is the substructure relation.

8The fact that the set of L 6 Structures Sti is not a chain means that if the MASevolves by taking the v action then there will be no L-structure ensuring the semantics ofthe system.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Appendix C. Defining Agents via Strategies:Towards a view of MASs as Games 234

C.2.2Game Theory Basics

Space limitations prevent us to mention the rationale of the definitionsrelated to Game Theory. In the sequel, we write down the definitions andtheorems used in this article. Mathematical definitions used in this article toprove the lemmata of the next sections can be found in (OR94) and (AH92).

Definition 7 (Kuhn1953) A n-person game in an extensive form, extensivegame for short, ! is a structure consisting of the following data:

– A finite set N = {1, 2, . . . , n} of players.

– A (rooted) tree (, the game tree.

– A partition of the set of non-leaf nodes of ( into n+1 subsets P0, . . . , Pn.The nodes belonging to P0 are called chance nodes, since they haveprobabilities attached to their outgoing branches. For the other subsets,Pi is the set of (possible) moves of player i in (.

– For each node p in P0 a probability distribution over the outgoing branchesof p.

– A finite set of actions ". Each outgoing branch, from a non-leaf node, islabelled with an unique element of ", except the chance branch which islabelled with a real number (a probability).

– For each i # N a partition of Pi into n(i) information sets, Bi1, . . . , B

in(i),

such that for every j = 1, n(i):

– All nodes in Bij have the same number of outgoing branches, with a

1-1 correspondence between the sets of respective outgoing nodes ofdi!erent nodes in Bi

j.– Every path in the tree from the root to a leaf-node visit each Bi

j atmost once.

– For each leaf-node t, an n-dimensional vector h(t) = !h1(t), . . . , hn(t)" ofpayo!s.

– The structure just being described is common knowledge among theplayers.

A game is of perfect information if every information set is a singleton.Otherwise, it is of imperfect information. In this work, we deal only with gameswith perfect information.

Figure C.1.a shows the extensive form of the Matching Pennies game(imperfect information) and figure C.1.b shows the extensive form of theprisoner’s dilemma (perfect information).

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Appendix C. Defining Agents via Strategies:Towards a view of MASs as Games 235

1,61 61,161,1 1,61

H T

H T H T

!"#$B1

1

!!

!!"

##

##$!"#$B2

1

!!!"

###$

!"#$B2

1

!!!"

###$

(a) - Matching Pennies (b) - The Prisoner’s Dilemma

2,2 4,0 0,4 3,3

C NC

C NC C NC

!"#$B1

1

!!

!!"

##

##$!"#$B2

1

!!!"

###$

!"#$B2

2

!!!"

###$

Figure C.1: Extensive Games

A strategy si of player i is a function that specifies for every informationset of player i a choice a # Bi

j. The set of strategies of player i is representedby Si. A profile of strategies is a n-tuple (si) of strategies of the players. For aprofile of strategies, the expected payo! hi(s) to player i is defined by

hi(s) =2

t!L

ps(t)gi(t),

where, for each terminal node t # L(T ), ps(t) is the probability that the gameends at t when every player uses the strategies (si).

Definition 8 A profile of strategies (si) is a subgame perfect equilibrium of anextensive game ! i! for each non-leaf node u # ! if u # Pi, then the strategysi leads to the highest payo! for that player.

An interesting result that plays an important role for the analogy madein this article is the following.

Theorem C.1 (Kuhn1953) Every finite game of perfect information has asubgame perfect equilibrium.

In the prisoner’s dilemma the only subgame perfect equilibrium is whenevery player chooses C yielding to payo! of 2 for each player. The matchingpennies has no subgame perfect equilibrium. Although, it has a mixed equi-librium. However, for the purpose of this work we do not need to deal withmixed equilibrium.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Appendix C. Defining Agents via Strategies:Towards a view of MASs as Games 236

C.3Agents as Players

We want to move toward a Game-Theoretical foundation for MAS,mainly in the context of computational agents. Thus, in this article we focusonly on this kind of MAS. Natural agents and Games running on concrete(Real) entities are left outside the scope of this work, unless we take thesecases as perfect BDI models. At least in some cases this can be achieved.

In what follows, agents will always be taken as computational agents, aswell MAS refers to a system of agents in the sense of definition 4. Consideran agent A in a MAS M . The main analogy between agents and players in agame is depicted by the following association.

Agent Concept Game ConceptBeliefs State-DescriptionIntention StrategyDesires Maximization of Payo!s a

aThe assignment of payo!s will be based on the extensional semantics of the MAS itself.

Table C.1: Relation between MAS and Games.

We will see that the payo! assignment will be the key of this relationship,on the other hand it can be seen as natural from the extensional point-of-view.A MAS, in general, yields a repeated game. The following discussion wouldbe better understood if the reader could consider the portion of the MAS

associated to the stage game. Anyway, the analogy between MAS and Gamescan be observed in the following table.

Agency Theory Game TheoryAgents Groups PlayersCommon Beliefs Game TreeAgent’s Intentions Player’s StrategiesDesires Satisfaction a Existence of Equilibria

aHere we refer to the satisfaction of desires of a set of agents.

Table C.2: Relation between MAS and Games.

Before we show how to assign a game to MAS M , we have to take thecare of removing infinitely long paths in SitM(Plana) that are meaningful inthe game-theoretical interpretation. These paths consist of L-states that arebissimilar. As it happens with infinitely long paths, two cases are possible:

– There is no repeated elementarily equivalent L-state in the path.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Appendix C. Defining Agents via Strategies:Towards a view of MASs as Games 237

– There is at least one repeated elementarily equivalent L-state in the path.

The first case will never result in a finite path if bissimilar states are identified.The other case, however, may lead to a finite path, just in case that thebissimilar state that repeats infinitely often is the one that causes the infinitefeature of the path. This seems to be strongly related to the well-known “Stage-Game” in an infinitely repeated game. This discussion motivates the followingdefinition. This will be used in the game-tree definition of the game associatedto a MAS as states lemma C.2.

Definition 9 Consider a MAS M over a first-order language L andSitM(Plana) as stated by definition 6. Given two elementarily equivalent L-states s1 and s2, we say that s1 7 s2(mod(SitM(Plana))), i!, s1 and s2 arebissimilar.

It is a routine task to check that the definition above is an equivalencerelation. Thus, we define SITM(Plana) as the quotient of the transition systemSitM(Plana) regarded to 7, with the addition of the following: Any transitionthat, after the quotient, has the same target and source will be removed. Thereader can observe that the later makes SITM(Plana) a tree.

One more step is needed before we construct the game-tree from aSITM(Plana). According to definition 4 of a MAS, a transition betweentwo nodes occurs by an action performed by an agent. In addition, manyactions can be performed from the same node. As a result, there is a sort ofsimultaneous moves in definition 4. On the other hand, definition 7 do notallow simultaneous moves at each node9. The definition below takes care oftransforming SITM(Plana) in a tree without simultaneous moves.

The idea is to add to SITM(Plana) nodes for nature before each nodethat has simultaneous actions in a way that allows each player to have equalchance of choosing a move. Figure C.2.a shows part of a SITM(Plana) thathas two actions, A1 and B2, from the state s0 that correspond to the moves ofagents 1 and 2, respectively. So, in order to allow simultaneous moves we addtwo nodes s(0 and s((0 to the tree in which node s0 is a nature node that hasequal probabilities attached to the outgoing branches as shown in the figureC.2.a. After that we add the branches to maintain the moves for the agentsfrom the nodes s(0 and s((0 that are nodes for the agents 1 and 2, respectively.

9Although, games with simultaneous moves may be represented by the imperfect infor-mation feature of definition 7. See (OR94) for a discussion and examples.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Appendix C. Defining Agents via Strategies:Towards a view of MASs as Games 238

(a) - SITM(Plana) (b) - Tree without simultaneous moves

%s0

!!

!!"

##

##$

A1 B2

%s1...%s2...

%s0

!!

!!"

##

##$

0.5 0.5

%s(0 %s((0A1 B2% %%s1...

%s2...

Figure C.2: Example of the transformation of SITM(Plana) in a tree withoutsimultaneous moves

We refer to |Ag(u)| and |Aga(u)| as the number of actions from the nodeu and the number of actions for agent a from the node u.

The following definition establishes in a more detailed way the relation-ship depicted by the above tables.

Definition 10 Let M be a MAS over a first-order language L with (finite) setof agents a, (finite) set of actions X and family of plans Plana(a # A), thenthere is an extensive Game GM , such that, each agent a # A of M correspondsto a player pa, in a way that :

– The game tree of GM is the tree constructed by the situation treeSITM(Plana) as follows.

– every node u in SITM(Plana) is a node of GM .– for each node u in SITM(Plana) that has simultaneous actions, then

u # P0.– for each node u in SITM(Plana) that has no simultaneous actions

(i.e. for all t # Clicks(T ) that are outgoing branches of u, holdsAgX(AcX(t)) = a for an agent a # A), then u # Pa and all branchesof u are in GM .

– for each node u in SITM(Plana) that has simultaneous actionsand for each t # Clicks(T ) that is an outgoing branch of u, ifAgX(AcX(t)) = a, then a new node ua is a node of GM , and ua # Pa.In addition, a branch, for each v that is an ingoing branch of u, isadded to GM from ua to v labelled by AcX(!u, v").

– a branch from u to ua is added to GM with the probability of|Aga(u)|/|Ag(u)|. This means that every player has the probabilityaccording to the number of actions available to him in u.

– The game is of perfect information.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Appendix C. Defining Agents via Strategies:Towards a view of MASs as Games 239

– The set of strategies are determined by the branches in a free, in themathematical sense, way.

– The payo! of a terminal node, for each agent a, is the number of desiresof a that are satisfied by the L-state associated to this terminal node. Thusthe payo! vector has da as the component a, where da is the number ofsatisfied desires.

Lemma C.2 In the conditions of the above definition, each subgame equilibriaof GM expresses a L-state where every possible desire for each agent is satisfied.

Proof-Sketch. A subgame equilibria in GM is a node in SITM(Plana)

that represents a position in the behavior of the M , such that, any furtherevolution (in time) of M puts the system in a state that cannot evolve to astate with more desires satisfied, not considering the other agent moves. Onthe other hand, any state in M that has an optimal number of desires satisfiedfor each agent a, independent of the other agents evolution in time, by theconstruction of SITM(Plana) and GM is a subgame equilibria in the later.Thus, the subgame perfect equilibria correspond to states where the agentshave optimal satisfaction regarding to desires, that is, are states which haveoptimal social satisfaction.!

C.4Players as Agents

On the other hand, the following lemma is simpler, since any playerin a Game (extensive form or not) can be modeled by an Agent in a MASrepresenting the game itself. As a matter of fact, the definition of the MAS

follows the relationship stated by the tables of the previous section. The factthat some games are not computationally representable does not bother theassociation of MASs to games. Only computational games can be implementedas MASs. The image of a computational game is a (computational) MAS,hence, may belong to the class G of MASs. Indeed, any computational gameis mapped into MAS that belongs to G as the following lemma holds.

Lemma C.3 Let g be a computational game, then there is a MAS Mg # G

that implements g in a way that the desires of Mg are the maximization ofthe payo!s of the game, the intentions are the strategies and each playercorresponds to an agent. Equilibria (subgame perfect equilibria) of the gameare states of optimal social satisfaction10

10A state of optimal social satisfaction is a state where each agent has the most possible,whatever action of other players, satisfaction.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Appendix C. Defining Agents via Strategies:Towards a view of MASs as Games 240

The proof sketch for lemma C.3 is as follows

– Each agent corresponds to a player.

– The desire of the player is to maximize the payo!.

– Beliefs are state descriptions of the extensive game.

– The strategies of each player determine the Planning of the each agent.

– The intentions of the players are paths that lead to subgame perfectequilibria.

– States of maximal social of M (if any) are subgame perfect equilibria ofthe game.

Below we present the prisoner’s dilemma as a model of LORA accordingto lemma C.3. Figure C.3 represents the extensive form and the temporalstructure T of this example in LORA.

Exemple C.4 The prisoner’s dilemma is defined in LORA byL = !T, W, (Ba)a!A, (Ia)a!A, (Da)a!A, (Sw)w!W , AcX , AgX", where

– A = {1, 2, n}. The agents 1, 2 and n represent the players 1, 2 and thenature, respectively;

– X = {C1, NC1, C2, NC2, I}. The action I means an action of the nature;

– T = {s0, s1, s2, s3, s4, s5, s6};

– R = {!s0, s1", !s0, s2", !s1, s3", !s1, s4", !s3, s3", !s4, s4",!s2, s5", !s2, s6", !s5, s5", !s6, s6" };

– AcX(!s0, s1") = C1, AcX(!s0, s2") = NC1, AcX(!s1, s3") = C2,

AcX(!s1, s4") = NC2, AcX(!s3, s3") = I, AcX(!s4, s4") = I,

AcX(!s3, s5") = C2, AcX(!s3, s6") = NC2, AcX(!s5, s5") = I,

AcX(!s6, s6") = I ;

– AgX(C1) = AgX(NC1) = 1, AgX(C2) = AgX(NC2) = 2 e AgX(I) = n.

– W = {T, w1, w2}. w1 is defined by s0, s1, s3, s3, ..., and w2 is defined bys3, s3, ...;

– For all situations !w, t" and for all agents a, we have

– !w, t, T " # Ba. The temporal structure T is common knowledge;– If t # w1, then !w, t, w1" # Ia. Otherwise, !w, t, w" # Ia. The

intention of each agent is the world w1 that is a path for a subgameperfect equilibrium.

– If t # w2, then !w, t, w2" # Da. Otherwise, !w, t, w" # Da. Thedesires of each agent are states that are subgame perfect equilibrium.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Appendix C. Defining Agents via Strategies:Towards a view of MASs as Games 241

%s0

!!

!!"

##

##$

C1 NC1

%s1

!!!"

###$

C2 NC2

%s2

!!!"

###$

C2 NC2

% % % %

I%s3

I%s4

I%s5

I%s6

(a) - Game in LORA (b) - Extensive Game

2,2 4,0 0,4 3,3

C NC

C NC C NC

!"#$B1

1

!!

!!"

##

##$!"#$B2

1

!!!"

###$

!"#$B2

2

!!!"

###$

Figure C.3: The Prisoner’s Dilemma

– for every world Sw we have )(OptSat, s3) = true, where OptSat is aproposition that is true at the states of maximal social satisfaction.

C.5Conclusion

This article shows that Games and MASs are strongly related whenmodeling behavior and rationality. As a consequence, criteria of rationality foragents can be directly applied to players and vice-versa. Game analysis formaltools can be applied to MAS as well.

Other way of dealing with MAS is the construction of the situation se-mantics SITM(Plana) taking into account hybrid noncooperative-cooperativegame model. A good example of such models is the Biform game (BS06) whichis a two-stage game. The first stage is an extensive game (noncooperativemodel) and the agents’ choices lead to a second stage game which is a coalitiongame with transferable payo! (cooperative model). For the second stage thesolution concept that must be used is that of core (see (OR94)). Fortunately,cores seem to be associated to the equilibria states of an Biform game associ-ated to SITM(Plana), when the payo!s are taken according to the coalitionsthat appear in the situation semantics. In fact, when agents cooperate amongthemselves, it is natural that common desires, intentions and beliefs emerge.A consequence of this is that the game would modify the way the payo!s areassigned. For the first stage the solution concept that must be used is that ofsubgame perfect equilibrium. One of the future direction of our research is theinvestigation of the following conjecture

Every MAS can be viewed in the form of a Biform Game

such that the core/subgame perfect equilibria is the semantics of the MAS.

DBD
PUC-Rio - Certificação Digital Nº 0310848/CB

Livros Grátis( http://www.livrosgratis.com.br )

Milhares de Livros para Download: Baixar livros de AdministraçãoBaixar livros de AgronomiaBaixar livros de ArquiteturaBaixar livros de ArtesBaixar livros de AstronomiaBaixar livros de Biologia GeralBaixar livros de Ciência da ComputaçãoBaixar livros de Ciência da InformaçãoBaixar livros de Ciência PolíticaBaixar livros de Ciências da SaúdeBaixar livros de ComunicaçãoBaixar livros do Conselho Nacional de Educação - CNEBaixar livros de Defesa civilBaixar livros de DireitoBaixar livros de Direitos humanosBaixar livros de EconomiaBaixar livros de Economia DomésticaBaixar livros de EducaçãoBaixar livros de Educação - TrânsitoBaixar livros de Educação FísicaBaixar livros de Engenharia AeroespacialBaixar livros de FarmáciaBaixar livros de FilosofiaBaixar livros de FísicaBaixar livros de GeociênciasBaixar livros de GeografiaBaixar livros de HistóriaBaixar livros de Línguas

Baixar livros de LiteraturaBaixar livros de Literatura de CordelBaixar livros de Literatura InfantilBaixar livros de MatemáticaBaixar livros de MedicinaBaixar livros de Medicina VeterináriaBaixar livros de Meio AmbienteBaixar livros de MeteorologiaBaixar Monografias e TCCBaixar livros MultidisciplinarBaixar livros de MúsicaBaixar livros de PsicologiaBaixar livros de QuímicaBaixar livros de Saúde ColetivaBaixar livros de Serviço SocialBaixar livros de SociologiaBaixar livros de TeologiaBaixar livros de TrabalhoBaixar livros de Turismo