Monsalve Arévalo(Eds).Cap1

Embed Size (px)

Citation preview

  • Captulo 1

    Juegos No-Cooperativos con Informacion Simetrica1

    I. Introduccion

    La teora de las decisiones interactivas clasica (o teora de juegos clasica) analiza,basicamente, la toma de decisiones racionales en terminos de construcciones com-petitivas (juegos no-cooperativos) y coalicionales (juegos cooperativos) abstradasde los juegos de salon (poquer, bridge, monopolio, etc.), en los cuales dos o masagentes, considerando las acciones de sus oponentes, deben tomar decisiones en elesfuerzo por obtener las maximas ganancias posibles. Esta abstraccion ha abiertoel espectro de posibilidades de aplicacion al mundo real: los jugadores pueden serseres humanos, instituciones, poblaciones de animales, partidos polticos, agentes deun mercado, etc., a la vez que las estrategias pueden ser de muy diversa ndole. Lateora de juegos tiene en estos campos una habilidad unica: la de ser un sistemade referencia para el estudio de las interacciones, descrito en terminos simples yuniversales.

    II. La Teora de Juegos de von Neumann y Morgenstern[1944]: una vision general

    En 1928 el matematico hungaro-judo John von Neumann [1903-1957] reporto uncurioso descubrimiento a la Sociedad Matematica de Gotinga: haba encontrado unaestrategia racional al problema al que se enfrentan dos oponentes a la hora deelegir en el lanzamiento de una moneda al aire. Y aunque esto, a primera vista, nopareciera un gran logro, era el comienzo de una nueva rama de la ciencia: la teorade juegos.

    La prueba de von Neumann, publicada como Zur Theorie der Gesellschaftspiele, seextenda a otros juegos como el ajedrez y las cartas, y mostraba que exista, en cadacaso, un mejor metodo posible de juego, que era matematicamente determinable.La mejor estrategia posible o estrategia racional era aquella que le asegurabaa un jugador la maxima ventaja, sin importar lo que los oponentes hicieran. Esta

    1Julian Arevalo, Francisco Lozano, Sergio Monsalve y Edgar Villa.

    15

  • 16 Un Curso de Teora de Juegos Clasica

    estrategia, obviamente, no lo aseguraba ni de la ruina ni de hacerse rico; solamente leminimizaba la maxima perdida que podra soportar. La estrategia racional indicadapor von Neumann, desde luego, no siempre es practica. Basta pensar en el juegodel ajedrez o el poquer para observar que un calculo como ese podra tomar siglos.Sin embargo, al comienzo, estas limitaciones eran de importancia secundaria. Losustancial era que existiera una estrategia optima en cada caso, y que el juegoentonces tuviera solucion.

    Von Neumann no estaba interesado en ayudarle a alguien en particular a ganar unjuego. Tena la conjetura que un analisis de la estructura general de los juegos serade importante valor matematico, y que la solucion a ciertos problemas de juegospodra arrojar luz sobre algunas discusiones economicas y sociales. Es evidente quelos juegos de estrategias comparten ciertos elementos con la vida real: se debentomar decisiones en cada momento y rara vez un jugador tiene el control total de lasvariables que determinan el resultado final. Por estas similitudes, a falta de otras,el estudio de las teoras de interacciones ha venido teniendo una fructfera relacioncon la comprension del comportamiento cotidiano. Fue el austriaco Oskar Morgen-stern (1902-1977) el primer economista que clara y explcitamente reconocio quelos agentes deben tener en cuenta la naturaleza interactiva de la economa cuandotoman sus decisiones. El y von Neumann se encontraron en Princeton a finales dela decada de 1930 y comenzaron una colaboracion que culmino en el clasico Theoryof Games and Economic Behavior de 1944. Con la publicacion de este monumentaltrabajo, la teora de juegos se recibio como una disciplina cientfica.

    Todos los juegos que von Neumann y Morgenstern estudiaron en Theory of Gamesand Economic Behavior tenan varios elementos en comun:

    1. Un conjunto finito de jugadores (que, como ya dijimos, pueden ser personas,animales, entidades, etc.) y cada jugador tiene a su disposicion un conjuntofinito de reglas (o estrategias) para jugar.

    2. El juego termina despues de un numero finito de etapas.

    3. Luego de que el juego termina, se le asigna un pago numerico a cada jugador(que, en general, es positivo si se ha ganado en el juego y negativo si se haperdido), que a su vez es una suma ponderada de los pagos recibidos en cadauna de las etapas previas.

    4. Existen posibles movimientos de la naturaleza; es decir, se permiten ciertasformas de aleatoriedad en las decisiones de los jugadores.

    5. Cada jugador tiene conocimiento completo (simetrico) de las reglas del juegoy de los jugadores.

    Nuestros autores dieron en clasificar estos elementos con tres criterios: numero dejugadores, caractersticas de los pagos, y acuerdos antes de comenzar el juego. Loscaptulos III y IV de Theory of Games se concentran en el estudio de los juegos de

  • Juegos No-Cooperativos con Informacion Simetrica 17

    dos personas y suma cero (es decir, lo que pierde un jugador lo recibe el otro). Elcaptulo V estudia los juegos de tres personas y suma cero. El VI, VII y VIII, losjuegos generales de n personas y suma cero; de cuatro personas y suma cero; y cincoo mas personas y suma cero, respectivamente; y, al final, el captulo XI lo dedican alos juegos generales de suma no-cero. A continuacion presentamos, entonces, algunasde las ideas basicas del trabajo de von Neumann y Morgenstern.

    Juegos de Dos Jugadores y Suma Cero

    En los juegos de dos jugadores y suma cero, que son, quizas, el tipo de juego massimple que podemos encontrar1, tenemos dos jugadores, 1 y 2, cada uno con unconjunto finito de estrategias a su disposicion, C1 y C2; y tambien cada uno confunciones de pago asociadas, pi1 y pi2, que dependen no solo de su eleccion particularsino tambien de la eleccion del otro; es decir, pi1 y pi2 son funciones con dominioC1C2 (el producto cartesiano de C1 y C2) y recorrido en los numeros reales. Todaesta informacion se puede resumir en la siguiente bimatriz2:

    Jugador 2

    1 2 n1 pi111, pi

    211 pi

    112, pi

    212 pi11n, pi21n

    2 pi121, pi221 pi

    122, pi

    222 pi12n, pi22n

    3 pi131, pi231 pi

    132, pi

    232 pi13n, pi23n

    Jugador 1...

    ......

    ......

    i pi1i1, pi2i1 pi

    1i2, pi

    2i2 pi1in, pi2in

    ......

    ......

    ...

    m pi1m1, pi2m1 pi

    1m2, pi

    2m2 pi1mn, pi2mn

    donde C1 { 1, 2, . . . ,m }, C2 { 1, 2, . . . , n }; pi1ij es el pago al jugador 1 cuandojuega la estrategia i y su oponente juega j, y pi2ij es el pago al jugador 2 cuandojuega la estrategia j y su oponente juega i. Pero si ademas asumimos que

    pi1ij + pi2ij = 0 (Juego de suma cero)

    para todo i = 1, 2, . . . ,m; j = 1, 2, . . . , n, entonces pi1ij = pi2ij, y la descripcion deljuego dada por la tabla anterior ahora se simplifica:

    1O tal vez son los juegos de un unico jugador? El lector podra pensar quizas en RobinsonCrusoe o en el juego del solitario para las cartas, pero estos son problemas fundamentales deeleccion y no de interaccion.

    2Esta forma de ilustrar un juego recibe este nombre porque cada celda tiene dos numeros; enuna matriz ordinaria cada celda contiene solo uno.

  • 18 Un Curso de Teora de Juegos Clasica

    Jugador 2

    1 2 n1 pi11 pi12 pi1n2 pi21 pi22 pi2n3 pi31 pi32 pi3n

    Jugador 1...

    ......

    ......

    i pii1 pii2 piin...

    ......

    ......

    m pim1 pim2 pimn

    donde piij pi1ij = pi2ijEl juego entonces consiste en que el jugador 1 escoge entre filas y el jugador 2(simultaneamente) escoge entre columnas, ambos buscando maximizar sus pagos(jugadores racionales). Von Neumann y Morgenstern consideraban que los jugadores(racionales como eran) elegiran de acuerdo con una particular regla:

    1. El jugador 1 (jugador fila) escogera la estrategia i que le maximiza el mnimopago posible que le permite adquirir el jugador 2; es decir, resolvera

    maxi

    mnj

    piij

    encontrando lo que llaman la estrategia de maxmin y que le genera un pago v1que corresponde a la ventaja que el jugador 1 obtiene por jugar el juego.

    2. Similarmente, el jugador 2 (jugador columna), sabiendo que su oponente selec-cionara la fila con maximo pago, tratara de minimizar esto con una adecuadaescogencia de su columna (es decir, minimizara sus perdidas), resolviendo

    mnj

    maxi

    piij

    encontrando lo que llaman la estrategia de minmax y que le genera un pago dev2, que, a su vez, es la ventaja que el jugador 2 obtiene por jugar el juego.

    Von Neumann y Morgenstern consideran que una posible solucion consistenteal juego es aquella estrategia ( i, j ) que satisfaga la condicion de maximizacionde ganancia igual a minimizacion de perdidas; es decir,

    v1 = maxi

    mnjpiij = mn

    jmax

    ipiij = v2

    A este valor lo llamaron un punto (de equilibrio) de silla3 del juego o, simple-mente, el valor del juego.

    3Podra el lector decir por que el nombre de punto de silla. Una grafica sencilla ayudara.

  • Juegos No-Cooperativos con Informacion Simetrica 19

    Ejemplo 1 (Davis [1983]).Supongamos que en cierto proceso electoral hay un aspecto referente a cual de dosciudades (A o B) le sera construido un sistema de transporte masivo. Hay solo doscandidatos a la presidencia y cada uno de estos debe anunciar a cual de las dosciudades se compromete a construirle el sistema de transporte, o evadir el tema ensus apariciones publicas. Cada candidato busca obtener el mayor porcentaje posiblede los votos de las dos ciudades. Los votantes de las demas ciudades son indiferentesrespecto al tema. Los porcentajes de votos que obtiene el candidato 1 dadas laselecciones de 1 y 2 aparecen en la matriz de la figura 1. As, por ejemplo, si elcandidato 1 se compromete a construirle el sistema de transporte masivo a la ciudadA, mientras el candidato 2 se compromete a construrselo a B, cada uno obtendrael 50 % de los votos. Para encontrar el valor maxmin de este juego, inicialmentetomemos como dada la eleccion del candidato 1 y encontremos la estrategia de 2que minimiza el pago de 1; as, independientemente de la eleccion del candidato 1, elcandidato 2 decide evadir el tema, con lo que los pagos mnimos para el candidato 1(porcentajes de votacion) son 40 %, 50 % o 40 %; como este debe ahora maximizar supago mnimo, elegira construirle a By as, la reparticion del electorado sera 50 %-50 %, con lo que el valor maxmin es, efectivamente, v1 = 0,5. (Ver figura 1.)

    Figura 1: Problema electoral

    Construirle a A Construirle a B Evadir el tema

    Construirle a A 45 % 50 % 40 %

    Construirle a B 60 % 55 % 50 %

    Evadir el tema 45 % 55 % 40 %

    Encontremos ahora el valor minmax; para las elecciones del candidato 2 Construirlea A, Construirle a B y Evadir el tema, los maximos pagos para el candidato 1son 60 %, 55 % y 50 %, respectivamente. Como el candidato 2 debe minimizar estospagos, elige Evadir el tema, con lo que el valor minmax es v2 = 0,5. Observemosque, en este juego, v1 = v2 = 0,5.

    M

    Ejemplo 2 (lanzar la moneda).El juego de lanzar la moneda (matching pennies), originalmente planteado por vonNeumann y Morgenstern en 1944, consiste en dos jugadores que, simultaneamente,eligen una cara de una moneda. Si en ambas monedas aparece cara, o en ambasaparece sello, el jugador 1 gana la moneda; pero si en una moneda aparece cara yen la otra sello, sera el jugador 2 el que la gana. Este juego es uno de dos jugadoresy suma cero que puede representarse mediante la siguiente matriz:

  • 20 Un Curso de Teora de Juegos Clasica

    Figura 2: Juego de lanzar la moneda

    Jugador 1

    Jugador 2

    Cara Sello

    Cara 1 -1

    Sello -1 1

    Aqu, pi11 = 1, pi12 = 1, pi21 = 1, pi22 = 1, yv1 = max

    imn

    jpiij = max{pi12 = 1, pi21 = 1 } = 1

    v2 = mnj

    maxi

    piij = mn{pi11 = 1, pi22 = 1 } = 1

    Sin embargo aqu, obviamente, v1 6= v2 y no existe valor minmax para este juego.Mas adelante discutiremos por que sucede esto.

    M

    Ejemplo 3 (piedra-papel-tijera).Este es el conocido juego infantil piedra-papel-tijera propuesto tambien por vonNeumann y Morgenstern, en el que piedra vence a tijera, tijera vence a papely papel vence a piedra, y es un empate en los otros casos. Podemos describir estejuego en una matriz como la de la figura 3.

    Figura 3: Piedra-papel-tijera

    Jugador 1

    Jugador 2

    piedra papel tijera

    piedra 0 -1 1

    papel 1 0 -1

    tijera -1 1 0

    Aqu,

    v1 = maxi

    mnj

    piij = max{pi12 = 1, pi23 = 1, pi31 = 1 } = 1v2 = mn

    jmax

    ipiij = mn{pi21 = 1, pi32 = 1, pi13 = 1 } = 1

    Tambien en este caso v1 6= v2 y no existe un valor minmax.M

  • Juegos No-Cooperativos con Informacion Simetrica 21

    Ejemplo 4 (otro ejemplo de von Neumann y Morgenstern).En la matriz de la figura 4 tenemos que el valor del juego esta bien definido, puesv1 = 1 = v2 es un punto de silla que se obtiene cuando el jugador 1 juega suestrategia B y el jugador 2 su estrategia A.

    Figura 4: Ejemplo de von Neumann y Morgenstern

    Jugador 1

    Jugador 2

    A B

    A -2 1

    B -1 2M

    Lo sucedido en los ejemplos clasicos de lanzar la moneda y piedra-papel-tijeraobligo a los autores del Theory of Games a tomar una decision: aceptaban el hechode que los valores minmax no siempre existen (as que, en general, cierta indeter-minacion estara presente en el analisis de multiples situaciones de interaccion entreagentes racionales) o se deshacan de la indeterminacion mediante una modificacioningeniosa del proceso que conduce a la eleccion de la estrategia apropiada.

    Hasta ahora los problemas de decision mostrados establecan que cada jugador de-bera razonar sobre cual de las distintas alternativas posibles era la mas favorable(estas las llamaron estrategias puras). Ahora modificaron el escenario y colocarona disposicion de cada jugador un conjunto de dados que lanzaran para determinarla estrategia a seguir. As, introdujeron un elemento probabilstico en la toma dedecisiones (estrategias mixtas). Pero no todo se deja a los dados. Von Neumanny Morgenstern asumen que cada jugador tratara de maximizar el valor esperado(matematico) de sus pagos, en lugar de los pagos seguros, y luego se preguntan si,con estas modificaciones, el punto de silla existe. Pero esto ya von Neumann lo sabadesde su trabajo de 1928: el punto de silla exista y, por tanto, el problema estababien determinado: las estrategias mixtas no haban sido introducidas en vano!

    Formalmente, una estrategia mixta para el jugador 1 es un vector de probabili-dades p = ( p1, p2, . . . , pm ), donde pi (i = 1, 2, . . . ,m) es la probabilidad de que

    el jugador 1 juegue la estrategia i. Obviamente pi 0 para todo i ym

    i=1pi = 1.

    Similarmente, una estrategia mixta para el jugador 2 es un vector de probabilidadesq = ( q1, q2, . . . , qn ), donde qj (j = 1, 2, . . . , n) es la probabilidad de que el jugador 2

    juegue la estrategia j. Desde luego, tambien qj 0 para todo j yn

    j=1qj = 1. (Note-

    mos que las estrategias puras pueden verse como casos particulares de las mixtas.As, por ejemplo, ( 0, 0, 1, 0, . . . , 0 ) es la representacion mixta de la tercera estrategiapura por parte de alguno de los jugadores).

  • 22 Un Curso de Teora de Juegos Clasica

    El concepto de valor esperado probabilstico de una estrategia mixta es, simplemente,una valoracion de los pagos que recibira el jugador en cada una de las estrategiaspuras, ponderada por las probabilidades de que estas sean elegidas. El pago esperadopor el jugador 1 bajo la distribucion de probabilidades p = ( p1, . . . , pm ) si el jugador2 juega la estrategia j es

    E( p, j ) = p1pi1j + p2pi2j + + pmpimj

    Se espera tambien aqu que el jugador 1 escoja las probabilidades p de tal forma queresuelva

    maxp

    mnjE( p, j )

    Similarmente, el jugador 2 recibira un pago esperado bajo la distribucion q =( q1, . . . , qn ) si el jugador 1 juega la estrategia i igual a

    E( i, q ) = q1pii1 + q2pii2 + + qmpiim;

    y se espera entonces que el jugador 2 escoja las probabilidades q de tal forma queresuelva

    mnq

    maxiE( i, q )

    Si p y q son tales que

    maxp

    mnjE( p, j ) = mn

    qmax

    iE( i, q )

    diremos entonces que estas probabilidades son una solucion al juego (o un punto desilla del juego) y a este valor lo llamaremos el valor (minmax) del juego. Veamoscomo se aplican los conceptos anteriores en juegos concretos.

    Ejemplo 5 (lanzar la moneda, otra vez).La justificacion de las estrategias mixtas para este juego la dan von Neumann yMorgenstern de la siguiente manera: puesto que ninguna forma particular de jugar(cara o sello) es mejor que otra, y si todo lo que importa es averiguar las intencionesdel oponente, no tendremos manera de encontrar una solucion. Pero si el jugadorno solo intenta averiguar lo que el otro jugador va a mover, sino que tambien seconcentra en que no descubran sus intenciones, jugar irregularmente cara y sellopodra ser una estrategia conveniente. Esto ultimo es lo que se presenta como 12 deprobabilidad de jugar cara; y 12 de probabilidad de jugar sello. El punto aqu esque este procedimiento protege de perdidas. De todas formas, el pago esperado dejugar esta estrategia es cero para ambos.

    Para confirmarlo, grafiquemos el primer cuadrante donde el eje X esta determinadopor la probabilidad p y el eje Y esta determinado por el pago esperado E(p) deljugador 1.

  • Juegos No-Cooperativos con Informacion Simetrica 23

    Figura 5: lanzar la moneda

    112

    E(p)

    p

    E( p, sello ) = 2p + 1

    E( p, cara ) = 2p 1

    Observemos que para el jugador 1,

    E( p, cara ) = p( 1 ) + ( 1 p )(1 ) = 2p 1E( p, sello ) = p(1 ) + ( 1 p )( 1 ) = 2p+ 1

    La lnea resaltada, formada por los dos segmentos, es la grafica de la funcion

    E( p ) = mn{E( p, cara ), E( p, sello ) } ={

    2p 1 si p 1/22p+ 1 si p 1/2

    y el problema del jugador 1 es encontrar p que haga E( p ) lo maximo posible. Estevalor ocurre en p = 1/2 y v1 = 0 que es el mas alto pago esperado por el jugador1, independientemente de lo que haga el jugador 2. El jugador 2 tiene un problemasimilar que se resuelve mediante el mismo tipo de analisis. Su solucion muestra que,al igual que el jugador 1, puede dejarle su decision a una moneda; es decir, adoptarq = 1/2. Luego el valor del juego es v1 = v2 = 0, que se alcanza cuando p = q = 1/2.

    M

    Ejemplo 6 (piedra-papel-tijera).La situacion en piedra-papel-tijera es enteramente similar a la de lanzar la moneda.El sentido comun dice que la forma correcta de jugar este juego es jugar las tresalternativas cada una con probabilidad 13 . Y la teora lo corrobora. Decamos antesque la matriz de pagos en este caso era la de la figura 6.

  • 24 Un Curso de Teora de Juegos Clasica

    Figura 6: piedra-papel-tijera

    [q1] [q2] [1 q1 q2]piedra (Pi) papel (Pa) tijera (Ti)

    [p1] piedra (Pi) 0 -1 1

    [p2] papel (Pa) 1 0 -1

    [1 p1 p2] tijera (Ti) -1 1 0

    All, para el jugador 1, si p = ( p1, p2, 1 p1 p2 ) y q = ( q1, q2, 1 q1 q2 ) son lasprobabilidades de juego de los jugadores 1 y 2, respectivamente, entonces

    E( p, P i ) = p1( 0 ) + p2( 1 ) + ( 1 p1 p2 )(1 )E( p, Pa ) = p1(1 ) + p2( 0 ) + ( 1 p1 p2 )( 1 )E( p, T i ) = p1( 1 ) + p2(1 ) + ( 1 p1 p2 )( 0 )

    Luego,

    E( p ) = mn{E( p, P i ), E( p, Pa ), E( p, T i ) }= mn{ p1 + 2p2 1, 2p1 p2 + 1, p1 p2 }

    =

    p1 + 2p2 1 si 0 p1; p2 13 ; o si 13 p1 23 ,0 p2 23 p1

    2p1 p2 + 1 si 13 p1 1, 23 p1 p2 1p1 p2 si 0 p1 13 , 23 p2 1

    Pero en tales regiones, las tres funciones p1 + 2p2 1, 2p1 p2 + 1, y p1 p2 sonnegativas o cero. Luego para encontrar maxE( p ) debemos buscar donde se anulaE( p ); y esto se logra igualando las tres funciones anteriores:

    p1 + 2p2 1 = 2p1 p2 + 1 = p1 p2De este sistema de ecuaciones con dos incognitas se encuentra, facilmente, que p1 =p2 =

    13 y, por tanto, tambien 1 p1 p2 = 13 . Similarmente para el jugador 2. De

    esta manera, el valor de este juego es v1 = v2 = 0.M

    Ejemplo 7.Encontremos el valor del juego de la figura 7.

  • Juegos No-Cooperativos con Informacion Simetrica 25

    Figura 7: Ejemplo 7

    Jugador 1

    Jugador 2

    a b c

    [p] A 3 4 1

    [1 p] B 2 0 3

    Solucion

    Para el jugador 1 se tiene que

    E( p, a ) = 3p+ 2( 1 p )E( p, b ) = 4p

    E( p, c ) = p+ 3( 1 p )

    y estas funciones lineales estan ilustradas en la siguiente figura:

    E( p ) = mn{E( p, a ), E( p, b ), E( p, c )}

    112

    E(p)

    p

    E( p, c )

    E( p, a )

    E( p, b )

    All, la lnea punteada muestra la funcion E( p ) formada por dos segmentos lineales:

    E( p ) =

    {4p si 0 p 1/2p+ 3( 1 p ) si 1/2 p 1

    Claramente, E( p ) es maximo cuando p = 1/2 y, as, v1 = 2. Similarmente, para eljugador 2 se tiene que q = 1/2 y v2 = 2. El valor del juego es entonces v1 = v2 = 2.

    M

    Ejemplo 8.Los grupos armados irregulares de izquierda y derecha de un pas estan decidi-endo de forma independiente sobre el numero de comandos que van a enviar a cadauno de dos frentes de batalla: X e Y . El grupo de derecha cuenta con 2 comandos

  • 26 Un Curso de Teora de Juegos Clasica

    armados, mientras que el de izquierda cuenta con 4. El grupo armado que envemas comandos a un frente dado gana el combate en ese frente. En caso de que envenel mismo numero de comandos hay un empate. En la matriz de la figura 8 aparecenlas victorias del ejercito de derecha para las posibles decisiones de ambos ejercitossobre el numero de comandos enviados al frente X.

    Figura 8: Victorias de cada ejercito

    Ejercito de Derecha

    Ejercito de Izquierda

    0 1 2 3 4

    0 -1 -2 -1 0 0

    1 0 -1 -2 -1 0

    2 0 0 -1 -2 -1

    As, por ejemplo, si el ejercito de derecha enva 2 comandos al frente X, y elejercito de izquierda enva solo 1, el ejercito de derecha gana en el frente Xpero, entonces, como el ejercito de izquierda enva sus otros 3 comandos al frenteY , este ultimo gana en tal frente, con lo que se genera un empate, otorgando unpago de cero para el ejercito de derecha.

    Para resolver este juego, inicialmente observemos que para el ejercito de izquierdaenviar un comando al frente X genera pagos al menos tan deseables como no enviarcomandos, independientemente de la eleccion de su oponente. De forma similar,enviar tres comandos genera pagos al menos tan deseables como enviar cuatro. Portal razon, el ejercito de izquierda nunca enviara 0 ni 4 comandos al frente X.Como esta informacion es comun a ambos ejercitos, el juego puede reducirse a lamatriz de la figura 9.

    Figura 9: Juego reducido

    Ejercito de derecha

    Ejercito de izquierda

    [q1] [q2] [1 q1 q2]1 2 3

    [p1] 0 -2 -1 0

    [p2] 1 -1 -2 -1

    [1 p1 p2] 2 0 -1 -2

  • Juegos No-Cooperativos con Informacion Simetrica 27

    Con un procedimiento igual al que hemos desarrollado encontramos para el jugador1, que

    E(p, 1) = 2p1 p2E(p, 2) = 1 p2E(p, 3) = 2p1 + p2 2

    y, para el jugador 2, que

    E(0, q) = 2q1 q2E(1, q) = 1 q2E(2, q) = 2q1 + q2 2

    Buscando los puntos donde E(p) alcanza su valor maximo, que resulta de igualarlos pagos esperados para las tres posibles estrategias de su oponente, se obtienep1 = 1/2; p2 = 0; 1 p1 p2 = 1/2; de forma analoga, para el jugador 2, encon-tramos q1 = 1/2; q2 = 0; 1 q1 q2 = 1/2, luego el valor del juego es v1 = v2 = 1.

    La conclusion de lo anterior es que, solo con la informacion de que disponen, elejercito de derecha debe optar por lanzar una moneda para determinar si va contodos sus comandos al frente X o al frente Y , mientras que el ejercito de izquierdaenva 3 comandos a un frente y 1 al otro; para decidir a cual frente enviar mascomandos tambien debe lanzar una moneda.

    M

    El Teorema Minmax (von Neumann [1928])

    Cuando tenemos dos jugadores, 1 y 2, el primero con m posibles estrategias, y elsegundo con n estrategias, y el juego es de suma cero (lo que pierde un jugadorlo gana el otro), se acostumbra llamarlo un juego de matriz pues, obviamente, ladescripcion del juego es una matriz m n de la forma

    A =

    pi11 pi1n... ...pim1 pimn

    donde la entrada piij representa el pago recibido por el jugador 1 cuando este escogela estrategia i y su oponente, el jugador 2, escoge la estrategia j. Aun as, la existenciade un punto de equilibrio de silla no es, en absoluto, obvia.

    Si el jugador 1 asigna las probabilidades p = ( p1, . . . , pm ) sobre sus respectivasestrategias, y el jugador 2 asigna sobre sus respectivas estrategias las probabilidadesq = ( q1, . . . , qn ), entonces el pago esperado por el jugador 1 si juega la estrategiai y su oponente la estrategia j es piijpiqj. As que ex ante, sin condicionamientosobre las jugadas de los jugadores, el pago esperado total es

    nj=1

    mi=1 piij pi qj.

  • 28 Un Curso de Teora de Juegos Clasica

    Esto puede escribirse mas facilmente en notacion matricial como qApT .4 Es decir,lo que el jugador 1 busca maximizar y el jugador 2 minimizar

    Por ejemplo, en el juego de lanzar la moneda,

    A =

    [1 1

    1 1]

    se tiene que

    qApT = ( q, 1 q )[

    1 11 1

    ] [p

    1 p]

    = ( q, 1 q ) ( 2p 1, 1 2p )= 2pq q + 1 2p q + 2pq= (2 + 4q )p 2q + 1;

    luego si el jugador 1 quiere minimizar este valor controlando p, entonces hara losiguiente:

    1. Escoger p = 1 si 2 + 4q > 0; es decir, si q > 1/2.2. Escoger p = 0 si 2 + 4q < 0; es decir, si q < 1/2.3. Escoger cualquier p si q = 1/2.

    Similarmente, si el jugador quiere minimizar el mismo valor qApT = (2 + 4p )q 2p+ 1, hara lo siguiente:

    1. Escoger q = 1 si 2 + 4p < 0; es decir, si p < 1/22. Escoger q = 0 si 2 + 4p > 0; es decir, si p > 1/23. Escoger cualquier q si p = 1/2

    Para lograr ambos objetivos, claramente, la solucion es que los dos jugadores escojan12 como su probabilidad; es decir, p

    = q = 1/2. Observemos que el valor del juegoen tal caso es, efectivamente, qApT = 0.

    Regresando al problema general, hemos entonces entendido que el jugador 1 hagarantizado que ganara al menos la cantidad

    maxp

    mnq

    qApT

    y no puede esperar ganar mas; y el jugador 2 hace lo opuesto: escogera de tal maneraque no pierda mas de

    mnq

    maxp

    qApT

    4Donde pT significa el vector p traspuesto.

  • Juegos No-Cooperativos con Informacion Simetrica 29

    y no espera mejorar mas esta situacion. Luego si queremos asegurar que la cantidadque 1 busca ganar coincida con la que 2 esta dispuesto a perder, la existencia de p

    y qtales que resuelvan

    maxp

    mnq

    qApT = mnq

    maxp

    qApT

    debera probarse. Como dijimos, la existencia de este punto de silla fue probadopor von Neumann en 1928 (16 anos antes de su Theory of Games and EconomicBehavior) en un artculo que, en su momento, paso desapercibido: Zur Theorie derGesellschaftspiele, inicialmente publicado en Mathematische Annalen y traduci-do al ingles en 1959 en Contributions to the Theory of Games (A. W. Tucker y D.Luce [eds.]). En version moderna dice as:

    Teorema 1 (Teorema Minmax (von Neumann [1928])).Para cualquier matriz Amn, existen distribuciones de probabilidad p

    Rn y q R

    m tales quemax

    pmn

    qqApT = mn

    qmax

    pqApT ;

    es decir, el valor minmax sobre todas las estrategias mixtas iguala al valor maxmin;mas aun, si el maximo en el lado izquierdo se alcanza en p y el mnimo en el ladoderecho se alcanza en q, entonces ninguno querra cambiar su estrategia unilateral-mente; es decir,

    qApT qApT qApT

    para todos los vectores de probabilidad p, q.

    Demostracion.Ver von Neumann [1928]

    Sin embargo, debemos hacer aqu la observacion que el teorema minmax haba sidopreviamente verificado por Emile Borel en 1924, pero solo para casos especiales:nunca obtuvo una prueba general como la que von Neumann alcanzo en 1928. Pormuchos anos el teorema minmax fue considerado como la pieza maestra de la teorade juegos. Y no debera reducirse su aporte. De hecho, el concepto fundamental dela teora de juegos de suma no-cero (el equilibrio de Nash [1950b]) es un resultadodel teorema del minmax, y la prueba original de la existencia del equilibrio de Nashse modelo imitando la conocida prueba del minmax. Tambien, como veremos, elconcepto de minmax aparece en el estudio de los juegos repetidos y en la teorade los juegos coalicionales, y es pensable que si un concepto aparece en lugaresaparentemente diferentes en la teora entonces, quizas, deberamos creer que algoimportante hay en el.

  • 30 Un Curso de Teora de Juegos Clasica

    Ejercicios 1.

    1. Encuentre los valores de los siguientes seis juegos:

    [0 51 3

    ],

    [5 3 23 4 0

    ],

    3 2 11 0 10 3 1

    , 4 5 31 2 1

    5 3 3

    2 1 43 2 10 3 2

    ,

    2 1 0 0 10 0 1 2 1

    1 0 1 1 11 2 1 0 2

    2. Para que valores de los siguientes juegos tienen un valor en estrategias

    puras?

    [1 0 3

    ],

    [0 3

    ]3. Para el juego de la matriz

    1 2 2 0 12 1 3 2 0

    2 1 0 1 20 0 2 1 11 1 0 2 1

    verifique que

    p = (5/52, 0, 11/52, 17/26, 1/26)

    q = (21/52, 3/13, 0, 3/52, 4/13) y

    v = 19/52

    es una solucion.

    4. Para el juego de la matriz

    [0 2 3/22 0 1/2

    ]encuentre el valor, la estrategia optima para el jugador 1, y dos estrategiasoptimas para el jugador 2.

  • Juegos No-Cooperativos con Informacion Simetrica 31

    5. (Ross [2002]) Los jugadores A y B enfrentan el siguiente juego. A escribe elnumero 1 o el 2, y B debe elegir entre uno de estos. Si el numero que Aha escrito es i y B adivina correctamente, B recibe i unidades de A. Si Bfalla, entonces le paga 3/4 a A. Si B aleatoriza su decision, eligiendo 1 conprobabilidad q y 2 con probabilidad 1 q, determine su ganancia esperada sia. A escribe 1, y b. A escribe 2. Encuentre el valor de q que maximiza el menorvalor posible de la ganancia de B. Cual es este valor maxmin? Considereahora que el jugador A escribe 1 con probabilidad p y 2 con probabilidad1 p. Encuentre el valor minmax.

    6. Suponga que al inicio de una semana hay 2 temas de actualidad que interesanal publico: el intercambio de rehenes entre los dos bandos de una guerra, yla nueva poltica gubernamental contra el desempleo. Las dos revistas masimportantes del pas estan decidiendo cual de las dos noticias exhibiran en suportada. El 60 % de los compradores de revistas esta interesado principalmenteen el intercambio de rehenes, mientras el 40 % restante en la poltica contrael desempleo. Los compradores potenciales solo tienen en cuenta la portadade la revista para realizar su eleccion. En caso de que ambas elijan la mismaportada, se reparten por mitades el porcentaje de la poblacion interesada enel tema; en caso de que elijan portadas diferentes, cada una vende todas lasrevistas a los compradores interesados.

    a. Presente la matriz de este juego.

    b. Encuentre el valor de este juego.

    c. Explique su respuesta.

    7. Puede verse que en el juego de suma cero (juego de matriz) de lanzar lamoneda, la matriz A es simetrica: AT = A. Sin embargo, en el juego depiedra-papel-tijera, la matriz

    A =

    0 1 11 0 11 1 0

    es antisimetrica, pues AT = A. Esto tiene un significado que no deberaescapar al comentario. Cuando la matriz es antisimetrica los agentes enfrentansimilares decisiones ya que aij = aij y lo que gana 1 por jugar i, mientras 2juega j, que es aij , es exactamente igual a lo que recibe 2 por jugar i, mientras1 juega j, que es aij. A este tipo de juegos suele llamarseles juegos justos.Es natural que el valor esperado en tales casos sea qApT = 0 y p = q.Claramente el juego de lanzar la moneda no es justo. Por que?

  • 32 Un Curso de Teora de Juegos Clasica

    III. Juegos Estaticos con Informacion Simetrica

    Ahora entendemos que el comportamiento estrategico de dos o mas agentes podrasurgir cuando los pagos que estos obtienen y, mas aun, la decision de cada unode ellos, depende de lo que estos esperan que sean las decisiones de los demas.Despues de von Neumann y Morgenstern (e inspirada en su trabajo) la teora dejuegos modela esta situacion por medio del concepto de juego en forma estrategica(o forma normal). Un juego en forma estrategica esta conformado basicamente portres elementos:

    a. Los jugadores (agentes)

    b. Las estrategias disponibles

    c. El pago que cada jugador recibe por cada posible combinacion de estrategias

    Identificar a los jugadores es, en principio, facil. Determinar las estrategias disponiblespara cada jugador (tambien llamadas estrategias puras) es el paso clave en la con-struccion del modelo, ya que el rango de acciones disponibles para cada jugadorpuede ser muy amplio y en muchas ocasiones no es totalmente conocido. La selec-cion de las acciones conocidas por los agentes depende del proposito del estudio.Para seleccionar la estructura de pagos (o funcion de utilidad) se debe examinar ca-da una de las posibles combinaciones de estrategias disponibles para los jugadores yespecificar que le sucede a cada jugador en cada caso, asignandole cierto valor. Estavaloracion numerica algunas veces resulta complicada, razon por la cual deben hac-erse un par de aclaraciones a este respecto: primero, el caracter de los pagos (comoen cualquier funcion de utilidad) se refiere (dentro de la tradicion von Neumann-Morgenstern-Savage) a la representacion numerica de un ordenamiento previo de laspreferencias respecto a los posibles estados resultantes del juego; as, por ejemplo,cualquier transformacion lineal de los pagos no altera el resultado del juego. Por otrolado, un juego debe considerarse, a priori, como una descripcion cualitativa de cier-ta situacion, por lo cual sus resultados cuantitativos no establecen mas que ciertasrelaciones entre probabilidades, porcentajes de poblacion, creencias, etc. En general,no deberan extraerse conclusiones numericas de los fenomenos modelados de estaforma; o, al menos, esto es cierto, seguramente, en los casos mas elementales.

    Con base en las nociones de jugadores, espacios de estrategias y funciones de pagopodemos, entonces, definir formalmente lo que es un juego en forma estrategica.

    Definicion 1. (Juego finito en forma estrategica [Borel [1921], von Neu-mann [1928]])

    a. Un juego finito en forma estrategica (o normal) es una 3n-tupla

    = (N, (Ci)iN , (ui)iN )

    donde:

  • Juegos No-Cooperativos con Informacion Simetrica 33

    - N = {1, . . . , n} es el conjunto de jugadores- Ci es el conjunto finito

    5 de estrategias puras para el jugador i N- ui : ni=1Ci R es la funcion de pagos (utilidad) para el jugador i N que

    asigna un pago (numero real) a cada combinacion de estrategias (c1, . . . , cn),donde el producto cartesiano ni=1Ci = C1 C2 ... Cn es el conjunto deestrategias conjuntas6

    b. Un juego finito en forma estrategica = (N, (Ci)iN , (ui)iN ) es un juego coninformacion simetrica7 o completa8 si es conocimiento comun9. Es decir, todos losjugadores conocen , cada uno sabe que los demas conocen , cada uno sabe quelos demas saben que el conoce , etc.

    La representacion mas tpica de un juego es aquella que comprende solo dos jugadoresque escogen entre un numero pequeno de estrategias diferentes descritas medianteuna bimatriz. En la bimatriz, las celdas contienen los pagos de cada jugador paralas posibles combinaciones de estrategias.

    La figura 10, utilizando una bimatriz, ilustra un juego particular conformado pordos jugadores, pas grande y pas pequeno, cada uno de los cuales dispone dedos estrategias: armarse (a) y permanecer desarmado (pd).

    Figura 10: Dilema de seguridad

    Pas grande

    Pas pequeno

    a pd

    a 0,-2 5,-5

    pd -2,2 3,3

    a armarse; pd permanecer desarmado

    Por convencion, el primer puesto en cada celda corresponde al pago del jugador fila(en este caso, pas grande) y el segundo corresponde al pago del jugador columna(en este caso, pas pequeno).

    5De all la condicion de finitud del juego.6Observemos como la funcion de utilidad captura la nocion de interaccion estrategica; es decir,

    el pago que un agente recibe al realizar su propia accion depende tambien de las acciones de losdemas.

    7Una interpretacion estandar subyacente a la definicion de un juego finito en forma estrategicacon informacion completa es la de que el grupo de jugadores elijan sus estrategias simultaneamente;o, secuencialmente pero sin que ninguno de los dos jugadores sepa que estrategia eligio su adversarioen el momento de hacer su eleccion.

    8Termino acunado por Luce y Raiffa [1957].9Termino acunado por D.K. Lewis [1964].

  • 34 Un Curso de Teora de Juegos Clasica

    Todo juego en bimatriz es, a menos que se diga algo distinto, un juego con infor-macion completa pero imperfecta. La imperfeccion en la informacion proviene dela hipotesis implcita de que los agentes toman sus decisiones, o bien simultanea-mente, o sin que ninguno conozca la decision del otro, hasta tanto ambas decisioneshayan sido tomadas. La completitud en la informacion proviene de la hipotesis deconocimiento comun del juego por parte de los jugadores.

    Teniendo presente esto, analicemos, entonces, el dilema de seguridad. Si ambospases eligen armarse, pas grande no resulta afectado ni beneficiado, pero paspequeno incurre en una perdida porque, digamos, podra haber asignado los recur-sos destinados a armarse a una actividad diferente que generara mayor bienestarpara la sociedad del que genera haberse armado, dado que su vecino grande tam-bien lo hizo. En caso de que ambos decidan permanecer desarmados, ambos seven beneficiados por haber detenido una eventual costosa carrera armamentista. Encaso de que uno de los dos se arme y el otro no, el pas que se arma obtiene unbeneficio igual a la perdida del otro.

    Ejercicios 2.

    Para cada uno de los juegos finitos en forma estrategica que se presentan a contin-uacion, describa, si es posible, alguna situacion que se ajuste al juego presentado:

    A B

    A 10,10 0,0

    B 0,0 3,3

    C Q

    C 1,1 -5,-5

    Q 5,-5 -10,-10

    R D

    R 4,4 4,10

    D -2,0 3,3

    C F

    C 4,4 1,5

    G 5,1 2,2

    IV. Principios-Solucion Fundamentales

    Una vez reducida la interaccion entre los agentes a un juego en forma estrategica,el siguiente paso es resolver el conflicto; es decir, resolver el juego. Hacer estosignifica establecer los principios que seguiran los agentes al escoger las estrategiase indicar, en consecuencia, las acciones que los agentes podran tomar.

  • Juegos No-Cooperativos con Informacion Simetrica 35

    Todo principio de solucion dentro de la vasta literatura en teora de juegos clasicaesta sustentado en la siguiente hipotesis: los agentes son racionales, en el sentidode que siempre prefieren resultados con pagos altos a aquellos con pagos bajos. Esteprincipio de racionalidad esta en el corazon del modo de analisis de la teora de juegosclasica y dice, esencialmente, que cada agente toma la decision que le de mayorespagos, dada su creencia sobre lo que haran los otros agentes.

    Los principios de solucion mas utilizados en la teora clasica pueden resumirse de lasiguiente forma.

    a. Primer principio de solucion: estrategias estrictamente dominantes

    Una estrategia estrictamente dominante para un jugador es aquella que al ser elegidale otorga un mayor pago que cualquier otra estrategia de su conjunto de estrategiasposibles, sin importar que eleccion hagan los demas jugadores. De forma similar, unaestrategia es estrictamente dominada para un jugador si existe otra que le generamayores pagos, independientemente de las acciones que tomen sus oponentes.

    Definicion 2 (Dominancia estricta en estrategias puras).En un juego finito en forma estrategica = (N, (Ci)iN , (ui)iN ), la estrategia puraci del jugador i domina estrictamente a otra estrategia c

    i del mismo jugador si, y

    solo si, ui(ci, ci) > ui(ci, ci) para cualquier ci de los demas jugadores, donde

    ci = (c1, . . . , ci1, ci+i, . . . , cn)10.

    Definicion 3 (Dominancia debil en estrategias puras).En un juego finito en forma estrategica = (N, (Ci)iN , (ui)iN ), cuando la utilidadproveniente de elegir la estrategia ci es mayor o igual que la utilidad proveniente deelegir la estrategia ci dado cualquier ci (es decir, cuando ui(ci, ci) ui(ci, ci)para todo ci) decimos que la estrategia ci domina debilmente a la estrategia c

    i y,

    por tanto, esta ultima es una estrategia debilmente dominada.

    Con base en estas nociones, podramos describir el primer principio basico as:

    Siempre que sea posible, un jugador escogera estrategias estrictamentedominantes y no elegira ninguna que sea estrictamente dominada.

    Ejemplo 9 (Dominancia en el dilema de seguridad).Analicemos, con el criterio de dominancia estricta, el juego de pas grande y paspequeno discutido en la seccion anterior (ver figura 10). Una vez asumimos queel comportamiento de los individuos es racional en el sentido dicho, podramospredecir la estrategia que pas grande escogera. En este juego, dado que pasgrande siempre obtiene un mayor beneficio armandose que permaneciendo desar-mado (armandose obtiene 0 o 5; y permaneciendo desarmado -2 o 3), es posiblepredecir que jugara la estrategia armarse ya que esta es mejor para el sin importarque haga pas pequeno. Diremos aqu que la estrategia armarse domina estric-tamente a la estrategia permanecer desarmado desde el punto de vista de pas

    10Observese que en ci se ha retirado la entrada de i, ci.

  • 36 Un Curso de Teora de Juegos Clasica

    grande. Notemos, sin embargo, que todava no podemos afirmar nada acerca delcomportamiento de pas pequeno ya que ninguna de sus estrategias domina a laotra: su mejor eleccion depende de la eleccion de pas grande.

    M

    Ejemplo 10.Consideremos el siguiente ejemplo que describe alguna situacion interactiva que esrepresentada por la siguiente bimatriz:

    Jugador 1

    Jugador 2

    a2 b2

    a1 8,5 6,4

    b1 7,3 5,2

    Aqu,

    N = {1, 2}, C1 = {a1, b1}, C2 = {a2, b2}u1(a1, a2) = 8, u1(a1, b2) = 6, u1(b1, a2) = 7, u1(b1, b2) = 5

    u2(a1, a2) = 5, u2(a1, b2) = 4, u2(b1, a2) = 3, u2(b1, b2) = 2

    Este juego muestra que tanto el jugador 1 como el jugador 2 tienen una estrategiaestrictamente dominante. Si el jugador 1 elige su estrategia a1 siempre obtendra unpago mayor que si elige su estrategia b1, independientemente de la eleccion querealice el jugador 2. Haciendo el mismo analisis para el jugador 2, encontramos quesu estrategia a2 domina estrictamente a su estrategia b2. As, se podra senalar queel resultado del juego sera la eleccion de las estrategias (a1, a2).

    M

    Ejemplo 11 (El Dilema del Prisionero [Albert W. Tucker [1950]). ]Uno de los juegos mas importantes de la teora de juegos clasica es el dilema delprisionero. El juego consiste, en su version estandar, en lo siguiente: dos sospechososde un delito son detenidos y ubicados en celdas diferentes de tal manera que nopuedan comunicarse. La pena para el delito son cinco anos de prision. La unicaforma en que las autoridades pueden condenar a los sospechosos es haciendo queal menos uno de ellos confiese. La descripcion del juego es la siguiente: si ambossospechosos confiesan, la sentencia sera de cuatro anos de carcel para cada uno. Sininguno de los dos confiesa, la sentencia sera de tan solo un ano en la carcel paracada uno, dada la falta de pruebas para realizar una condena. Y si uno confiesa y elotro no, el que confiesa sera puesto en libertad por colaborar con la justicia mientrasel otro sera sentenciado a los cinco anos de prision. El juego en su forma estrategicaes como aparece en la bimatriz de la figura 11.

  • Juegos No-Cooperativos con Informacion Simetrica 37

    Figura 11: Dilema del Prisionero

    Sospechoso 1

    Sospechoso 2

    c nc

    c -4,-4 0,-5

    nc -5,0 -1,-1

    c confesar; nc no confesar

    Para resolver el juego, bastara eliminar estrategias estrictamente dominadas: ob-servemos que para ambos jugadores confesar domina estrictamente a no confesar.De modo que la solucion predecible por eliminacion de estrategias estrictamentedominadas es (confesar, confesar) con pagos de -4 para cada uno (es decir, 4 anosde carcel), que no es necesariamente la mejor eleccion de los jugadores: si ningunoconfesara obtendran ambos solo un ano de carcel, en lugar de los cuatro anos a queson condenados a raz de su confesion. Sobre esta aparente paradoja volveremos masadelante.

    M

    Ejemplo 12 (Juego del Ultimatum).Este es un juego de dos individuos, uno de los cuales debe hacer una oferta al otroacerca de la reparticion de 4 unidades monetarias11. Las propuestas que el ofer-ente puede hacer son una reparticion equitativa (E) o una en la que el se vea masfavorecido (F ). En caso de que la oferta sea equitativa, es llevada a cabo indepen-dientemente de lo que planee hacer el jugador 2 quien, en caso de que deba jugar,solo puede decidir si acepta (A) o no acepta (N) la oferta recibida. Con el fin deeliminar del juego su apariencia secuencial, supongamos, por ahora, que cada unodebe tomar su decision de antemano y que los resultados estan determinados por lacombinacion de sus elecciones. Representamos este juego por medio de la bimatrizde la figura 12.

    En este juego, la estrategia A del jugador 2 domina debilmente a su estrategia N .Si eliminamos esta estrategia, la prediccion es (F,A) y reciben pagos de 3 para eljugador 1 y de 1 para el jugador 2; sin embargo, como veremos, no es convenienteeliminar por dominancia debil ninguna de las estrategias de este juego. Ya veremospor que resolver un juego a traves de este criterio nos puede conducir a descartarsoluciones tambien factibles.

    M

    El principio de solucion de dominancia estricta es bastante debil ya que, por ejem-plo, en el caso de pas grande y pas pequeno (figura 10) solo nos dice lo que

    11Imaginemos cuatro millones de pesos.

  • 38 Un Curso de Teora de Juegos Clasica

    Figura 12: Juego del ultimatum

    Jugador 1

    Jugador 2

    A N

    E 2,2 2,2

    F 3,1 0,0

    A Acepta E Oferta equitativaN No acepta F Oferta favorable

    hara pas grande. Recordemos que en tal caso no es posible utilizar este conceptopara predecir el comportamiento de pas pequeno; como dijimos, ninguna de lasestrategias disponibles a pas pequeno domina estrictamente a la otra; cualquieraccion de este pas podra ser mejor o peor que la otra, dependiendo de lo que hagapas grande. Basados en esto, establecemos el segundo principio-solucion.

    b. Segundo principio de solucion: eliminacion iterada de estrategiasestrictamente dominadasPodemos refinar el primer principio de solucion y asumir, no solo que cada agenteadoptara estrategias estrictamente dominantes y desechara las estrictamente domi-nadas, sino que cada agente sabe que los otros haran lo mismo y actuaran en con-secuencia. De esta forma:

    Todo jugador aplica el primer principio de solucion en su decision. Ycada jugador sabe que los otros tambien aplicaran ese principio, y losotros saben que los otros tambien aplicaran ese principio; etc.

    Como su nombre lo indica, el proceso de eliminacion iterada de estrategias estric-tamente dominadas consiste en eliminar a traves de rondas las estrategias que sondominadas por otras. Observemos que bajo este supuesto, podramos predecir quepas pequeno sabe que pas grande se armara y, actuando en consecuencia,tambien se armara ya que en tal caso su pago sera 2, en lugar de permanecerdesarmado, caso en el cual su pago sera 5.

    Ejemplo 13 (Solucion por rondas de eliminacion).Consideremos el juego de la figura 13. En la primera ronda de eliminacion iteradadel juego de la figura 13, podemos eliminar la estrategia c2 del jugador 2 ya que suestrategia b2 la domina estrictamente. De esta forma, el juego queda reducido a unjuego de dos estrategias para cada jugador, como se muestra en la figura 14.

    Ahora: como el jugador 1 preve que el 2 nunca jugara c2, elimina su estrategia b1 ya

  • Juegos No-Cooperativos con Informacion Simetrica 39

    Figura 13: Eliminacion por rondas

    Jugador 1

    Jugador 2

    a2 b2 c2

    a1 2, 4 3, 2 3, 1

    b1 0, 3 1, 6 7, 5

    Figura 14: Primera ronda de eliminacion

    Jugador 1

    Jugador 2

    a2 b2

    a1 2, 4 3, 2

    b1 0, 3 1, 6

    que a1 la domina estrictamente12, con lo que el juego se reduce al de la figura 15.

    Eliminamos luego la estrategia b2 del jugador 2 por estar dominada estrictamentepor la estrategia a2, quedando como solucion al juego el par de estrategias (a1, a2)con pagos de 2 para el jugador 1 y de 4 para el jugador 2.

    Figura 15: Segunda ronda de eliminacion

    Jugador 1

    Jugador 2

    a2 b2

    a1 2, 4 3, 2

    Ejercicios 3.

    1. La Guardia Imperial de Napoleon Bonaparte se enfrenta a las tropas inglesasdel general Wellington. Para esta contienda, hay diez campos de batalla convalores militares a1 < ... < a10. Cada jugador (Bonaparte y Wellington) esdotado con ni < 10 escuadrones (i = 1, 2). La estrategia de cada jugador es

    12Notese que a1 no domina a b1 a menos que la estrategia c2 haya sido eliminada en una rondade eliminacion previa.

  • 40 Un Curso de Teora de Juegos Clasica

    la decision de enviar sus escuadrones a estos campos de batalla. Un jugadorpuede enviar, maximo, un escuadron a cada campo de batalla. Cuando la peleaempieza, cada jugador gana aj por cada campo de batalla en el que tenga unescuadron pero su oponente no. El ganador de la guerra es el ejercito cuyoterritorio ocupado represente el mayor valor militar total. Muestre que estejuego tiene una unica solucion en estrategias dominantes.

    2. Para cada uno de los siguientes juegos finitos en forma estrategica, resuelvasegun el principio-solucion de eliminacion iterada de estrategias estrictamentedominadas:

    J. 1

    J. 2

    C D

    A 8,2 6,4

    B 3,9 4,2

    J. 1

    J. 2

    H I

    F 10,5 1,2

    G 6,10 10,7

    J. 1

    J. 2

    C D R

    A 5,4 3,8 1,5

    F 6,6 6,-2 -5,-3

    J. 1

    J. 2

    H I J

    F 8,8 6,-2 2,1

    Q 0,-2 4,8 0,1

    3. Considere un juego con n-jugadores en el que cada jugador anuncia, simultanea-mente, un numero entero entre 1 y 1.000. El ganador es el jugador cuyo anuncioes el numero mas cercano a 1/2 del promedio de todos los anuncios. En casode empate, el premio es entregado de manera aleatoria entre los ganadores.

    a. Utilizando la eliminacion iterada de estrategias dominadas determine lasolucion de este juego. Si los jugadores son racionales y la racionalidad esconocimiento comun cual sera la unica estrategia que sobrevivira?

    b. Cree usted que la solucion encontrada en a es consistente con lo obser-vado en la realidad? Si no lo es, como cree usted que razonara la genteen un juego de este estilo?

    4. Resuelva los siguientes juegos con el principio-solucion de eliminacion de es-trategias estrictamente dominadas.

  • Juegos No-Cooperativos con Informacion Simetrica 41

    J. 1

    J. 2

    A B C

    A 73, 25 57, 42 66, 32

    B 80, 26 35, 12 32, 54

    C 28, 27 63, 31 54, 29

    J. 1

    J. 2

    A B C D E

    A 63,-1 28,-1 -2,0 -2,45 -3,19

    B 32,1 2,2 2,5 33,0 2,3

    C 54,1 95,-1 0,2 4,-1 0,4

    D 1,-33 -3,43 -1,39 1,-12 -1,17

    E -22,0 1,-13 -1,88 -2,-57 -3,72

    V. Principio-Solucion de Equilibrios de Nash enEstrategias Puras

    En la mayora de los juegos estudiados en la teora sucede, sin embargo, que asumirsolo el segundo principio de solucion nos puede dejar, todava, con muchas predic-ciones posibles. Es el caso del juego de la figura 16 en donde, adicional a la situaciondescrita en la figura 10, cada pas tiene una nueva estrategia (anunciar el problemaante una comision internacional (ap), y unos nuevos pagos (debido a la penalizacionque tal comision impone sobre los pases en caso de encontrar armamento). Se puedeobservar que ninguno de estos tiene una estrategia estrictamente dominante.

    Una forma con la que podemos resolver este tipo de juegos esta fundamentada en elsiguiente principio:

    La combinacion de estrategias que los jugadores predeciblemente escogeranes aquella en la cual ningun jugador podra mejorar su pago escogiendounilateralmente una estrategia diferente, si supone que los otros sigueneligiendo la estrategia previamente escogida.

    El concepto-solucion basado en este principio se conoce como equilibrio de Nashdel juego. Fue introducido por John Nash [1950b]13 en su artculo Equilibrium

    13Premio Nobel en Economa de 1994.

  • 42 Un Curso de Teora de Juegos Clasica

    Figura 16: Dilema de seguridad extendido

    Jugador 1

    Jugador 2

    a pd ap

    a 0,2 5,5 5, 2pd 2, 2 4, 4 0, 0ap 2,5 0, 0 3, 3

    a armarse pd permanecer desarmadoap anunciar el problema

    Points in n-Person Games, y se ha posicionado como el concepto solucion centralen la teora de juegos clasica. Esta es la definicion:

    Definicion 4 (Equilibrio de Nash en Estrategias Puras (Nash [1950b])).Sea = (N, (Ci)iN , (ui)iN ) un juego finito en forma estrategica. Una combinacionde estrategias puras c = (ci )iN es un equilibrio de Nash en estrategias puras parael juego si, y solo si,

    ui(ci , c

    i) ui(ci, ci)

    para todo ci Ci y para todo i NEjemplo 14.Consideremos el juego de la figura 17 y encontremos sus equilibrios de Nash.

    Figura 17: Busqueda de equilibrios de Nash

    Jugador 1

    Jugador 2

    t s

    k 3, 1 1, 3

    m 5, 5 4, 2

    Para buscar los equilibrios de Nash de este juego, procederemos tomando cada posi-ble combinacion de estrategias, y verificaremos si, en cada una de estas, al menosun jugador tiene incentivos unilaterales para desviarse. Para empezar, tomemos lacombinacion de estrategias en la que el jugador 1 juega la estrategia k y el jugador2 juega la estrategia t. Si el jugador 1 espera que el 2 juegue t, para el sera mejor

  • Juegos No-Cooperativos con Informacion Simetrica 43

    desviarse de la estrategia establecida y jugar m ya que, de esta forma, obtiene unpago de 5, superior al pago de 3 que obtendra de mantenerse jugando k. De man-era similar, el jugador 2 tambien se desviara a jugar s para obtener un pago de 3en vez de 1; por lo tanto, la combinacion de estrategias (k, t) no es un equilibriode Nash. Tomemos ahora la combinacion de estrategias (k, s); el jugador 2 no ten-dra incentivos para desviarse unilateralmente ya que reducira su pago de 3 a 1. Sinembargo, el jugador 1 s tendra incentivos para desviarse, ya que si cree que el 2seguira jugando s, escoger m en vez de k le genera un pago de 4 en vez de 1. As,esta combinacion de estrategias tampoco constituye un equilibrio de Nash. Tomemosahora la combinacion (m, t). Si el jugador 1 se desva de su estrategia m a k, pasade ganar 5 a ganar solo 3, luego sera mejor que no lo haga; por su parte, si es eljugador 2 quien se desva de t a s, pasa de recibir un pago de 5 a recibir un pago de2, luego tampoco se desviara; Como ninguno de los jugadores tiene incentivos paradesviarse unilateralmente, la combinacion de estrategias puras (m, t) constituye unequilibrio de Nash de este juego. Para terminar, consideremos la estrategia conjunta(m, s); el jugador 1 no tiene incentivos para desviarse ya que obtendra un pago de 1en vez de 4, pero el jugador 2 s tendra incentivos para hacerlo ya que ganara 5 envez de 2. As, el unico equilibrio de Nash de este juego esta dado por la combinacionde estrategias (m, t).

    M

    Ejemplo 15. (La Batalla de los Sexos [Luce y Raiffa (1957)])En este juego, un matrimonio esta tratando de decidir que hacer el fin de semana. Lasposibilidades que tienen son: ir al futbol (F ) o ir al teatro (T ). El esposo prefiere iral futbol con su esposa, y la esposa ir al teatro con su esposo. Los pagos estan dadospor la bimatriz de la figura 18. No es posible resolver este juego por dominanciaiterada ya que ninguna estrategia pura es estrictamente dominada. Ahora bien: eljuego tiene dos equilibrios de Nash en estrategias puras: (F, F ) y (T, T ). Veamos:si la esposa cree que su esposo ira al futbol (F ) lo mejor que ella puede hacer estambien ir al futbol (F ), ya que esta eleccion la deja con un mayor pago que suestrategia ir al teatro (T ), en la que estara sola. A su vez, si el esposo cree que suesposa ira al futbol, lo mejor que puede hacer es tambien ir al futbol (F ).

    Figura 18: La batalla de los sexos

    Esposo

    Esposa

    F T

    F 2,1 0,0

    T 0,0 1,2

    F Futbol; T Teatro

  • 44 Un Curso de Teora de Juegos Clasica

    De manera que (F, F ) es un equilibrio de Nash del juego que deja a cada uno de losjugadores (esposo, esposa) con pagos (2, 1). Si, por el contrario, la esposa cree quesu esposo ira al teatro (T ), lo mejor que puede hacer es ir al teatro (T ), ya que estaeleccion la dejara con un pago de 2 mientras que ir al futbol la dejara con un pagode cero. De igual forma, si el esposo piensa que su esposa ira al teatro (T ), lo mejorque puede hacer es ir al teatro (T ). Por lo tanto (T, T ) tambien es un equilibrio deNash del juego y deja a cada uno de los jugadores (esposo, esposa) con pagos (1, 2),respectivamente. De esta manera, segun Nash, que ambos vayan juntos al futbol oal teatro son posibilidades predichas por la teora.

    M

    Ejemplo 16 (El Dilema de Seguridad, otra vez).Habamos visto que en el dilema de seguridad extendido no haba solucion por mediodel concepto de eliminacion de estrategias estrictamente dominadas, sin embargopodemos ver que s hay solucion por medio del concepto de equilibrio de Nash. Note-mos que la combinacion de estrategias (ap, ap) es estrategicamente estable; esto es,si ambos jugadores eligen su estrategia anunciar el problema, ninguno tendra in-centivos unilaterales para desviarse, ya que los pagos que obtendran por hacerlo sonestrictamente menores a los que obtendran por seguir fieles a su estrategia: en apcada uno de los jugadores obtiene un pago de 3; desviarse a pd le genera un pago de0, mientras que desviarse a a le genera un pago de -5. As, (ap, ap) es un equilibrio deNash. Notese, sin embargo, que la combinacion de estrategias (pd, pd) genera pagosestrictamente mayores y, no obstante, no es un equilibrio de Nash. Es decir, tenemosuna situacion similar a la observada en el dilema del prisionero. El analisis de estosdos casos lo veremos en breve.

    M

    Ejemplo 17 (Juego de Coordinacion Schelling [1957]).Consideremos el juego de la figura 19.

    Figura 19: Juego de coordinacion

    Jugador 1

    Jugador 2

    D I

    D 10,10 0,0

    I 0,0 1,1

    D Derecha; I Izquierda

    Este juego tampoco se puede resolver por dominancia estricta ya que ninguna es-trategia pura es estrictamente dominada. Sin embargo, el juego tiene dos equilibriosde Nash en estrategias puras: (D,D) y (I, I). Si el jugador 1 cree que el jugador 2escogera su estrategia D, su mejor-respuesta a esta eleccion es la estrategia D. De

  • Juegos No-Cooperativos con Informacion Simetrica 45

    igual forma, si el jugador 2 cree que el jugador 1 escogera su estrategia D, la mejor-respuesta a esta eleccion es su estrategia D. Por lo tanto, (D,D) es un equilibriode Nash del juego que deja a cada uno de los jugadores con un pago de 10. Ahora:si el jugador 1 cree que el jugador 2 elegira la estrategia I, su mejor-respuesta esla estrategia I, y si el jugador 2 cree que el jugador 1 escogera la estrategia I, sumejor-respuesta es tambien escoger I. Entonces (I, I) es otro equilibrio de Nash deljuego que deja a cada uno de los jugadores con un pago de 1. Observese que paralos dos jugadores es mejor jugar el primer equilibrio porque los deja con un pagomas alto. Este juego se conoce como un juego de coordinacion porque los jugadorespodran alcanzar el pago mas alto posible del juego cuando actuan coordinadamentey eligiendo, en concordancia, la estrategia del pago mas alto.

    Un ejemplo claro de un juego de coordinacion como el de la figura 19 se refierea la decision cotidiana sobre el lado de la calle por el cual deben desplazarse dosconductores que se dirigen en sentido contrario. Si cada uno escoge la derecha, pasansin ningun problema y tienen acceso facil a la senalizacion de la calle. Si ambosescogen la izquierda, la senalizacion se hace mas difcil, pero tampoco se accidentan,por lo cual ninguno tiene incentivos a desviarse. Caso contrario ocurre cuando unode los conductores decide irse por la derecha y el otro por la izquierda; en tal caso,el pago que obtienen es el menor posible. Este ultimo caso no es un equilibrio deNash ya que, por ejemplo, asumiendo como dada la eleccion del conductor 2, elconductor 1 tendra incentivos a cambiar de estrategia. Los dos tipos de equilibrio(todos conducen por la derecha o todos conducen por la izquierda) se ven clarosen pases como Colombia y Gran Bretana.

    Sin embargo, el campo de aplicacion de los juegos de coordinacion es mucho masamplio que lo que hemos mostrado, hasta el punto en que se han constituido en undestacado tema de estudio en las ciencias sociales. Supongamos, por ejemplo, quedos amigos estan perdidos en la selva y quieren encontrarse, a donde deben ir? y,en caso de que contaran con radios para comunicarse, que frecuencia elegiran parahacerlo? Por otro lado, si una sociedad reconoce que llevar a cabo sus transaccionespor medio del trueque es demasiado costoso, y cada individuo es consciente de queutilizar un metal como medio de pago solucionara el problema, que metal elegira?Suponga ahora que mientras un par de amigos hablan por telefono la llamada seinterrumpe, quien debera realizar la nueva llamada y quien debera esperar?

    Este es el tipo de situaciones que se pueden analizar por medio de los juegos decoordinacion; observemos que en cada uno de los ejemplos anteriores, para cadajugador no hay una mejor eleccion y, mas aun, no hay ningun procedimientoformal que determine que se debe hacer. Esta en el interes de cada jugador intentardescifrar lo que los otros piensan que el hara, y actuar en consecuencia. Es decir, paraobtener el mejor resultado para s mismo, y para el grupo, cada jugador debe hacerparte del proceso social; esto es, prescindir de un calculo aislado sobre posiblesestados del mundo y sustituirlo por normas que considere determinantes no solopara su toma de decisiones sino, principalmente, para la toma de decisiones de losdemas; tengamos en cuenta que en estos juegos un jugador gana si los demas ganan,

  • 46 Un Curso de Teora de Juegos Clasica

    y pierde si los demas pierden, luego su interes esta en buscar actuar de tal formaque sus acciones sean compatibles con las de los demas.

    Aspectos externos a los juegos, de la manera en que los hemos presentado, puedenservir para ayudar a coordinar a los jugadores en ciertos equilibrios. Siguiendo aSchelling [1960]:

    ...entre todas las opciones posibles suele haber alguna en particular queparece ser el punto focal de una seleccion coordinada, y, muy a menudo,la parte para quien es relativamente desfavorable la elige, simplemente,porque sabe que la otra espera que lo haga.

    As, aspectos como la moda, las convenciones sociales, las normas, la tradicion ocualquier otra informacion externa al juego, pueden determinar puntos focales,que cada jugador perseguira en los juegos de coordinacion, dado que haciendoloreduce la incertidumbre frente a lo que los otros esperan que el haga, y esto es desu beneficio.

    Algunas preguntas importantes, respecto a los juegos de coordinacion son entonces,por ejemplo, que determina el surgimiento de cierto curso de accion en estos juegos;de forma similar, sera interesante determinar como la informacion externa afecta lacoordinacion en uno u otro de los posibles equilibrios y, tal vez, lo mas interesante:que equilibrio es seleccionado por los agentes. Schelling [1960] responde parcialmentea esto diciendo que [una] parte esencial del estudio de los juegos de motivacionmixta es necesariamente emprica.

    Y si bien actualmente la teora de juegos no-clasica ofrece algunas respuestas in-teresantes a estos interrogantes, algunas otras pueden ofrecerse desde escenarioselementales, como los que hemos estudiado hasta ahora, analizando las dinamicasde interaccion entre individuos que deben enfrentar algunos juegos de coordinacion.

    M

    Ahora: regresando al curso central de la discusion, podramos preguntarnos: comose relacionan los distintos principios de solucion que estudiamos al comienzo de laseccion anterior? La respuesta la tenemos en los siguientes teoremas que, de paso,muestran la importancia central del concepto de equilibrio de Nash en un problemade decision interactiva.

    Teorema 2 (Un agente racional no utiliza estrategias estrictamentedominadas).Ninguna estrategia pura estrictamente dominada para un jugador puede hacer partedel perfil de estrategias de un equilibrio de Nash en estrategias puras.

    Demostracion.Si ci es estrictamente dominada por algun c

    i para algun jugador i, entonces

    ui(ci , c

    i) < ui(c

    i, c

    i)

    Luego (ci , ci) no puede ser un equilibrio de Nash.

  • Juegos No-Cooperativos con Informacion Simetrica 47

    Teorema 3 (Eliminacion por Rondas que conduce a equilibrios de Nash). Cuandoel proceso de eliminacion iterada de estrategias estrictamente dominadas arroja ununico perfil de estrategias puras c = (ci , c

    i), este es el unico equilibrio de Nash del

    juego.

    Demostracion.Sin perdida de generalidad, asumamos que solo es necesaria una ronda para todoslos jugadores. El caso general es similar (apoyados en el teorema 2). Debemos probarque c = (c1, . . . , c

    n) es un equilibrio de Nash y que es unico.

    a. Es un equilibrio de Nash. Sea ci 6= ci , entonces ci es estrictamente dominadapor ci , para todo i. As, ui(c

    i , ci) > ui(ci, ci), para todo ci Ci. Luego,

    en particular si ci = ci, entonces, ui(c

    i , c

    i) > ui(ci, c

    i) para todo i. Por

    tanto, c = (c1, . . . , cn) es un equilibrio de Nash.

    b. Es unico. Es consecuencia del teorema 2.

    Teorema 4.Si la combinacion de estrategias c = (ci , c

    i) es un equilibrio de Nash, entonces

    sobrevive al proceso de eliminacion iterada de estrategias estrictamente dominadas.

    Demostracion.Es una aplicacion directa del teorema 2.

    Ejemplo 18 (El Dilema del Prisionero, otra vez).Como ilustracion de los teoremas que acabamos de establecer, retomemos el juego deldilema del prisionero de la figura 11. Cuando resolvimos por estrategias dominantes,encontramos que la solucion predecible era (confesar, confesar). Ahora, resolviendopor equilibrios de Nash, encontramos que si el sospechoso 1 cree que el sospechoso 2va a confesar, la mejor decision que el puede tomar es tambien confesar, con lo quese quedara con un pago de -4. Si a su vez, el sospechoso 2 cree que el sospechoso 1va a elegir su estrategia, confesar, lo mejor que puede hacer es confesar y recibir unpago de -4. De manera que el par de estrategias (confesar, confesar) es un equilibriode Nash en estrategias puras del juego y entrega a los jugadores un pago de -4 acada uno. Observemos que, tal como establece el teorema 2, el par de estrategiasdominadas no confesar no hacen parte del equilibrio de Nash. Como resultadodel teorema 3, notemos que la unica combinacion de estrategias que sobrevive a laeliminacion iterada de estrategias estrictamente dominadas es el equilibrio de Nashdel juego. Y, finalmente, notemos, como aplicacion del teorema 4, que el equilibriode Nash sobrevive al proceso de eliminacion de estrategias.

    Es importante destacar aqu que en este juego es imposible alcanzar, a traves deestos principios de solucion, la asignacion cooperativa resultante de la combinacionde estrategias (no confesar, no confesar) ya que los jugadores no tienen incentivos

  • 48 Un Curso de Teora de Juegos Clasica

    para mantenerse en esta eleccion. Cada uno de ellos hace lo mejor que puede in-dependientemente de lo que el otro jugador haga. Hara falta, en este caso, algunmecanismo externo que hiciera a los jugadores jugar cooperativamente, haciendo deesta eleccion lo mejor para ellos. La moraleja es importante: el concepto de equilibriode Nash muestra que una sociedad podra, solo a traves de incentivos individuales,llegar a estados que no son optimos socialmente. O, como afirma Aumann [1987b]:la gente que no coopera porque busca su propio beneficio no es necesariamenteestupida o irracional: puede estar actuando de manera perfectamente racional. Enefecto: en este ejemplo, un equilibrio de Nash no es necesariamente optimo de Pare-to14: (4,4) son los pagos correspondientes al unico equilibrio de Nash y (1,1)los correspondientes al unico optimo de Pareto. De hecho, se considera el dilema delprisionero como piedra filosofal en muchas discusiones de la economa moderna ycomo una metodologa util para abordar problemas en poltica y sociologa. Ejemp-los de esto son dos partidos polticos considerando su voto frente a un incremento enlos impuestos: conjuntamente sera mejor para ambos votar favorablemente por talpropuesta, pero en caso de que uno de ellos decida apoyarla, es mejor para el otro nohacerlo con el animo de ganar popularidad. Especficamente, no apoyar la propuestaes una estrategia dominante para cada partido. Otro ejemplo lo ilustran los pasesmiembros de la OPEP: para todos sera deseable que el precio del petroleo fueraalto, lo que se lograra si todos recortaran su produccion. No obstante, esta en elinteres de cada pas miembro aumentar su produccion, y esto hara que el precio de-scendiera y afectara negativamente los ingresos de todos. Otro ejemplo es el dilemade la seguridad extendido que estudiamos antes.

    M

    Una Nota sobre Evidencia Experimental

    a. El dilema del prisioneroEn los experimentos realizados para jugar el dilema del prisionero una solavez se ha encontrado un nivel de cooperacion que vara de acuerdo con lasmanipulaciones experimentales de cada caso. Entre los factores manipulablesse destacan los ensayos que cada jugador tiene antes de enfrentar el juegoverdadero, y sus caractersticas personales (sexo, edad, raza, religion, etc.).El nivel de cooperacion observado se encuentra suficientemente alejado de 0 %y 100 %. Esto ha llevado a muchos investigadores a conjeturar que hay ciertaevidencia de altruismo en los agentes que juegan el Dilema del Prisionero. Paraverificar esta hipotesis, Shafir y Tversky [1992] compararon el juego original conuna modificacion de este en la cual uno de los jugadores deba jugar primero,y el otro era informado de la eleccion de su oponente; el analisis era llevado acabo sobre los jugadores de la segunda etapa. Se encuentra en estos juegos unmenor nivel de cooperacion que en el juego original, tanto en el caso en que seinforma de una defeccion, como cuando se informa de una previa cooperacion.

    14Es decir, existe alguna otra eleccion tal que al menos un jugador puede mejorar sin que el otroempeore.

  • Juegos No-Cooperativos con Informacion Simetrica 49

    Con base en estos resultados, Shafir y Tversky argumentan que la cooperacionen el juego original no se alcanza gracias al altruismo de los agentes (que almenos generara cooperacion cuando se informa de una previa cooperacion)sino por la dificultad de evaluar acciones cuando sus consecuencias no sonclaras. Es decir, cuando un agente no conoce la eleccion de su oponente, no escapaz de evaluar todos sus pagos posibles, y esto hace que busque la accioncooperativa.

    b. Juegos de coordinacionLos tipos de experimentos que presentamos a continuacion tienen como propositoatacar tres interrogantes respecto a los juegos de coordinacion; en principio,determinar que equilibrio se elige dada cierta estructura de interaccion; segun-do, analizar como aspectos historicos inciden en la eleccion de un equilibrio;y finalmente, determinar si aspectos exogenos, en particular, los pagos en es-tados que no seran alcanzados por agentes racionales, determinan la eleccionde uno u otro equilibrio.

    En un primer experimento, van Huyck, Battalio y Beil [1990] se proponenrecopilar evidencia experimental para determinar si la dominancia en el sentidode Pareto, as como ciertos aspectos historicos, determinan los equilibrios queseran seleccionados por los agentes en juegos de coordinacion pura. Para estodisenan experimentos con sesiones de alrededor de 15 jugadores que debenelegir aisladamente un numero entero de 1 a 7. Los pagos de cada jugador estandeterminados por la eleccion que este realice y por el menor valor seleccionadopor los miembros del grupo: especficamente, los pagos para cada jugador enlos dos escenarios disenados, son como aparecen en las figuras 20 y 21.

    Figura 20: Escenario A

    Valor escogido

    Menor valor escogido7 6 5 4 3 2

    7 1.3 1.1 0.9 0.7 0.5 0.36 - 1.2 1.0 0.8 0.6 0.45 - - 1.1 0.9 0.7 0.54 - - - 1.0 0.8 0.63 - - - - 0.9 0.72 - - - - - 0.31 - - - - - -

    Observemos que, en ambos escenarios, la situacion en la que todos los indi-viduos eligen el mismo numero constituye un equilibrio de Nash, independi-entemente de cual sea tal numero. De forma similar, observemos que estosequilibrios de Nash estan ranqueados en el sentido de Pareto de acuerdo conel numero que sea elegido por todos; es decir, el equilibrio optimo de Pareto

  • 50 Un Curso de Teora de Juegos Clasica

    corresponde a la situacion en que todos los jugadores eligen 7, mientras queel peor equilibrio ocurre cuando todos eligen 1. Finalmente, notemos queen el escenario B la eleccion del numero 7 es una estrategia dominante paracada jugador. Uno de los objetivos buscados por los experimentadores con eldiseno de este escenario B era determinar si los participantes comprendansuficientemente bien el experimento en el sentido de que percibieran (y eligier-an) la estrategia dominante; esto es, si el experimento no era claro para losparticipantes, estos no elegiran el numero 7.

    Figura 21: Escenario B

    Valor escogido

    Menor valor escogido7 6 5 4 3 2

    7 1.3 1.2 1.1 1.0 0.9 0.86 - 1.2 1.1 1.0 0.9 0.85 - - 1.1 1.0 0.9 0.84 - - - 1.0 0.9 0.83 - - - - 0.9 0.82 - - - - - 0.81 - - - - - -

    La dinamica del experimento consista en que todos los jugadores enfrentaranel escenario A en 10 ocasiones, conociendo siempre las elecciones de la etapainmediatamente anterior; luego deban pasar al escenario B en 5 ocasiones y,posteriormente, regresaran al escenario A para jugar 5 o 7 veces mas.

    El proposito de esta dinamica era, por un lado, observar cual equilibrio emergaen cada escenario a partir de la informacion que iban adquiriendo los jugadoresy, por otro lado, determinar si el equilibrio alcanzado en el escenario B seconstitua en un punto focal para la ultima fase a desarrollarse en el escenarioA.

    Algunos de los resultados obtenidos fueron los siguientes:

    a. Luego de algunas repeticiones en el escenario B, el 96 % de los partici-pantes en el experimento eligen el numero 7, lo que indica que el juegoera comprendido y que los jugadores tenan incentivos para participar enel experimento.

    b. Aunque en las etapas iniciales en el escenario A (antes y despues de jugaren B) se presenta una alta dispersion en las elecciones realizadas por losjugadores, rapidamente estos se coordinan en la eleccion del numero 1;es decir, en el peor de los equilibrios de Nash en terminos de pagos.

  • Juegos No-Cooperativos con Informacion Simetrica 51

    El hecho de que los jugadores se coordinen nuevamente en 1 despues de haberparticipado en el escenario B indica que haberse coordinado en 7 en tal esce-nario, no genera un punto focal para la fase siguiente del juego.

    Notemos que, contrariamente a lo que sugiere la intuicion, el criterio de op-timalidad paretiana no es suficiente para la generacion de puntos focales; dehecho, la coordinacion, de presentarse, se lleva a cabo sobre el equilibro quegenera los menores pagos conjuntos; luego son aspectos como el riesgo, y laincertidumbre respecto a la racionalidad de los demas, lo que probablementeincide de manera mas importante en la decision de los jugadores.

    Un aspecto controlado por los experimentadores era el numero de jugadores encada sesion; cuando los grupos se reducen a solo 2 jugadores, estos se coordinanmas rapidamente en la eleccion del numero 7; lo anterior sugiere que el tamanodel grupo importa, en el sentido que reduce la probabilidad subjetiva que cadaindividuo asigna a que los demas elijan numeros pequenos, y a que permitepensar que los individuos eligen estrategias de largo plazo que les garanticenpagos altos gracias a la reputacion adquirida en la etapas iniciales. Sobre estohablaremos mas adelante en la seccion de juegos repetidos.

    En otro experimento con juegos de coordinacion Copper, DeJong y Ross [1990]se proponen estudiar como el poder focal de un equilibrio en un juego decoordinacion es influenciado por los pagos de estrategias que no son jugadasen equilibrio. As, proponen juegos como los de la figura 22 donde aparecendos equilibrios de Nash puros (1, 1) y (2, 2), y donde la tercera estrategia esestrictamente dominada para cada jugador.

    Figura 22: Coordinacion con estrategias dominadas

    Juego 1

    1 2 3

    1 350,350 350,250 700,0

    2 250,350 550,550 0,0

    3 0,700 0,0 600,600

    Juego 2

    1 2 3

    1 350,350 350,250 700,0

    2 250,350 550,550 1000,0

    3 0,700 0,1000 500,500

    Notemos que la unica diferencia entre los dos juegos son los pagos que obtienenlos jugadores por la estrategia 3 que, realmente, no es jugada en equilibrio.La dinamica del experimento consista en que cada jugador era emparejadoaleatoriamente con otro en 20 ocasiones. Algunos de los resultados aparecenen la figura 23.

  • 52 Un Curso de Teora de Juegos Clasica

    Figura 23: Experimento en juegos de coordinacion

    Juego 1 Juego 2

    Fuente: Cooper, DeJong, Forsythe y Ross (1990)

    Observemos que conforme los jugadores ganan experiencia, se coordinan enuno de los equilibrios del juego. Al igual que en el experimento anterior, ladominancia paretiana no es suficiente para determinar en que equilibrio se co-ordinan los agentes, ya que en el primero de los casos la coordinacion se hacesobre el equilibrio (1, 1) que es Pareto-dominado por (2, 2). De igual forma,notemos que los pagos de la estrategia dominada efectivamente afectan la co-ordinacion de los agentes sobre los equilibrios. Para explicar tal coordinacionCopper et al. recurren a dos hipotesis. La primera es que cada individuo cues-tiona la racionalidad de su companero y as elige la mejor-respuesta ante unaestrategia dominada de aquel (observemos que, en el primer juego, la coor-dinacion se alcanza sobre la estrategia 1 que es una mejor-respuesta ante 3,mientras que en el segundo juego la mejor respuesta ante 3 es la estrategia 2,y es precisamente all donde se da la coordinacion). La segunda hipotesis esque cada jugador espera encontrar una pareja con la que alcance el maximopago conjunto. Para inclinarse a favor de una u otra hipotesis, Copper et al.proponen dos juegos adicionales del estilo del de la figura 24.

    Figura 24: Juego de coordinacion adicional

    1 2 3

    1 350,350 350,250 700,0

    2 250,350 550,550 0,0

    3 0,700 0,0 500,500

    Notemos que la mejor-respuesta ante la estrategia 3 es la estrategia 1, luegola coordinacion en (1, 1) favorecera la primera hipotesis. Asimismo, notemosque el maximo pago conjunto se encuentra en (2, 2), luego la coordinacion en

  • Juegos No-Cooperativos con Informacion Simetrica 53

    este equilibrio favorecera la segunda hipotesis. Se encontro como resultado deeste nuevo experimento la coordinacion en el equilibrio (2, 2), lo que lleva aafirmar a Copper et al. que cada participante asigna una probabilidad positivaa encontrarse con un oponente que sea altruista, en el sentido de buscar elmaximo pago conjunto, y actua en consecuencia.

    Ejercicios 4.

    1. John Stuart Mill [1848] establece que, como excepcion del principio economi-co de laissez-faire, existen casos donde la ley es precisa no para predominarsobre el juicio de los individuos respecto de sus propios intereses, sino paradar efectividad a ese juicio. As, se refiere al caso particular de una reduccionde la jornada laboral de diez a nueve horas manteniendose el salario con-stante. Establece que aunque todos los obreros estuvieran convencidos de quese veran beneficiados por esta medida, esta no sera adoptada a menos que seestableciera una ley que obligara su cumplimiento, ya que:

    ...si casi todos se atuvieran a las nueve horas, los que prefirieran tra-bajar diez seran los que ganaran todas las ventajas de la restriccion,al mismo tiempo que el beneficio de infringirla: obtendran el salariocorrespondiente a las diez horas por nueve de trabajo y ademas elsalario de una hora [...] es probable que fueran tantos los que pre-firieran las diez horas en las condiciones mejoradas, que no pudieramantenerse la limitacion como una regla general. (Mill [1848], pp.948 a 951).

    a. Describa la situacion mencionada como un juego; defina los jugadores,sus estrategias y sus funciones de pagos.

    b. Encuentre el equilibrio de Nash de este juego.

    c. Comente.

    2. Discutiendo acerca de la evolucion social y sus beneficios, J. J. Rousseau [1755]describe la siguiente situacion a la que se enfrentan un conjunto de cazadoresque persiguen un venado:

    En el trabajo de cazar un venado cada cazador debe sentir quesu proposito es mantenerse fiel a su objetivo; sin embargo, si unaliebre pasara cerca a alguno de ellos, no habra duda de que este laperseguira sin escrupulos y que, habiendo obtenido su presa, poco leimportara haber causado a sus companeros la perdida de las suyas.

    a. Modele esta situacion en una bimatriz asumiendo que las unicas accionesdisponibles a cada agente son cazar venado y cazar liebre.

  • 54 Un Curso de Teora de Juegos Clasica

    b. Encuentre los equilibrios de Nash del juego.

    c. Interprete sus resultados.

    3. Calcule el equilibrio de Nash del siguiente juego:

    b1 b2 b3

    a1 0,0 50,40 40,50

    a2 40,50 0,0 50,40

    a3 50,40 40,50 0,0

    Muestre que si cualquier jugador adopta una estrategia distinta de la del equi-librio de Nash, la respuesta optima por parte del otro jugador resultara en unospagos superiores para ambos. As, el equilibrio de Nash es el peor resultadoposible!

    4. Suponga que a usted se le propone el siguiente juego: Escoja un numero de1 a 3. Yo trato de adivinarlo. Usted responde (con la verdad): alto, bajoo correcto dependiendo de si el numero que yo dije es mas alto, mas bajo ocorrecto, respecto al numero que usted escogio. Usted recibira el numero demiles de pesos igual al numero de intentos de adivinar que yo haya tenido quehacer antes de acertar. Construya un juego en forma estrategica que describala interaccion mencionada y encuentre los equilibrios de Nash.

    5. Resuelva los siguientes juegos mediante eliminacion de estrategias estricta-mente dominadas. Verifique que la solucion es un equilibrio de Nash.

    Jugador 1

    Jugador 2

    A B

    A 4,2 -6,5

    B 6,1 0,-1

    Jugador 1

    Jugador 2

    A B

    A 0,2 4,-25

    B -1,0 2,1

    6. Suponga que en un pas solo hay automoviles japoneses y franceses. Dos indi-viduos estan interesados en comprar cada uno un automovil y sus eleccionesposibles son:

    wi = 1 si i adquiere un vehculo japones

    wi = 1 si i adquiere un vehculo frances

  • Juegos No-Cooperativos con Informacion Simetrica 55

    y sus funciones de pago son

    v1(w1, w2) = u1(w1) + 2w1w2

    v2(w1, w2) = u2(w2) + 2w1w2

    donde u1(1) = 1, u1(1) = 2, u2(1) = 2, u2(1) = 1

    a. Describa este juego en una bimatriz 2 2.b. Encuentre los equilibrios de Nash de este juego.

    c. Cree usted que existe en este juego un efecto conformidad; es decir,que hace parte del beneficio de cada jugador adquirir un vehculo similaral del vecino?

    VI. Principio-Solucion de Equilibrios de Nash enEstrategias Mixtas

    La amplia posibilidad del concepto de equilibrio de Nash de resolver juegos, que elprincipio de dominancia iterada no tiene, hace de aquel un concepto mas potente ymas controversial que el concepto de solucion basado en la idea de que los jugadoresno escogen estrategias dominadas y tienen conocimiento comun. El problema secomplica aun mas si se tiene en cuenta que casi todos los juegos tienen otro tipo deequilibrios de Nash. Para ver esto, consideremos una vez mas el juego de lanzar lamoneda:

    Ejemplo 19 (Lanzar la moneda (von Neumann y Morgenstern [1944])).Ya sabamos que en el juego lanzar la moneda (matching pennies) dos agenteslanzan cada uno una moneda; si en ambas monedas aparece cara o sello, el jugador1 gana la moneda del otro; si difieren, es el jugador 2 el que la gana. Los pagos seilustran en la bimatriz de la figura 25.

    Figura 25: Juego de lanzar la moneda

    Jugador 1

    Jugador 2

    C S

    C 1,-1 -1,1

    S -1,1 1,-1

    C cara S sello

    Para intentar solucionar este juego, tomemos, por ejemplo, el par de estrategias(C,C); dado que el jugador 2 cree que el jugador 1 escogera su estrategia C, lo

  • 56 Un Curso de Teora de Juegos Clasica

    mejor que el puede hacer es escoger su estrategia S, lo que muestra que (C,C)no puede ser un equilibrio de Nash. De forma similar, el par de estrategias (C,S)tampoco puede ser un equilibrio de Nash ya que si el jugador 1 espera que 2 juegueS, lo mejor que este puede hacer es desviarse y jugar S. Por un argumento similar, sepuede mostrar que en las demas combinaciones de estrategias puras tambien existenincentivos para desviarse unilateralmente por parte de algun jugador. Esto muestraque no existe un equilibrio de Nash en estrategias puras para este juego. Sin embargo,como nos lo ensenaron von Neumann y Morgenstern, s existe un equilibrio de otrotipo, conocido como equilibrio en estrategias mixtas, en el que cada jugador adoptauna estrategia asignandole cierta probabilidad a cada una de las estrategias purasde los demas jugadores; es decir, cada jugador asume ciertas probabilidades sobre lasestrategias puras que los otros jugadores escogeran.

    M

    Definicion 5 (Estrategia Mixta (von Neumann [1928])).

    a. En un juego finito en forma estrategica = (N, (Ci)iN , (ui)iN ), una estrate-gia mixta del jugador i es una distribucion de probabilidad sobre el conjuntode estrategias puras Ci. Al conjunto de todas las estrategias mixtas del jugadori lo denotamos por i. Para i i y ci Ci, i(ci) es la probabilidad que ladistribucion i le asigna a la estrategia ci. El soporte de una estrategia mixtai es el conjunto de estrategias puras a las cuales i le asigna una probabilidadestrictamente positiva.

    b. Una estrategia mixta del juego es una combinacion de distribuciones

    = (1, 2, . . . , n)

    donde i i para todo i; es decir, ni=1i.De acuerdo con la definicion anterior, es claro que el conjunto de las estrategias mix-tas contiene al de las estrategias puras. En este caso, cada i le asigna probabilidad1 a cierta estrategia pura y probabilidad 0 a las demas estrategias.

    Definicion 6 (Utilidad Esperada (von Neumann y Morgenstern [1944])).Sea = (N, (Ci)iN , (ui)iN ) un juego finito en forma estrategica. Dado un perfil dedistribuciones = (1, ..., n) ni=1i, la utilidad esperada del jugador i asociadaa este perfil corresponde a la siguiente expresion:

    ui()

    cC(nj=1j(cj)ui(c))De esta forma, la utilidad esperada de un jugador tiene la misma naturaleza que unvalor esperado (matematico); es decir, corresponde a una suma ponderada de todaslas utilidades que puede alcanzar el jugador, donde la ponderacion de cada una deestas es la probabilidad de ocurrencia del resultado que genera tales pagos.

  • Juegos No-Cooperativos con Informacion Simetrica 57

    Ejemplo 20 (Un Calculo de Utilidades Esperadas).En el juego de la figura 26, dado que ningun agente tiene certeza acerca de la eleccionde su oponente, cada uno de ellos debe asignar probabilidades a las estrategias deacuerdo con sus creencias.

    Figura 26: Calculo de utilidades esperadas

    Jugador 1

    Jugador 2

    x2 y2

    x1 3, 2 5, 1

    y1 4, 1 2, 3

    El jugador 1 puede asignar una probabilidad q a la estrategia x2 del jugador 2 y porconsiguiente, una probabilidad 1 q a la estrategia y2. De igual forma, el jugador 2asigna una probabilidad p a la estrategia x1 del jugador 1 y una probabilidad 1 pa la estrategia y1. Esto puede observarse en la figura 27.

    Figura 27: (...continuacion)

    Jugador 1

    Jugador 2

    (q) (1-q)

    x2 y2

    (p) x1 3, 2