60
El Dilema del Prisionero y El Dilema del Prisionero y la Gestión de Proyectos la Gestión de Proyectos Ing. Pablo Ortiz, M.Sc., PMP 3 de Diciembre de 2009 Montevideo, Uruguay

El Dilema Del Prisionero y la Gestión de Proyectos

Embed Size (px)

DESCRIPTION

El Dilema del Prisionero y su aplicacion en algunas Areas de Conocimiento de la Gestion de Proyectos

Citation preview

El Dilema del Prisionero y la Gestin de Proyectos

Ing. Pablo Ortiz, M.Sc., PMP 3 de Diciembre de 2009 Montevideo, Uruguay

AgendaObjetivo Teora de Juegos El dilema del prisionero (DP) El equilibrio de Nash El dilema del prisionero iterado (DPI) Variaciones El DP y la Gestin de Proyectos

3-dic-09

Ing. Pablo Ortiz, MSc, PMP

2

ObjetivoPresentar un problema de la Teora de Juegos (una rama de las Matemticas) y ver su aplicacin en algunos temas de la Gestin de Proyectos (gestin de conflictos, gestin de personas, contratos, tica)

3-dic-09

Ing. Pablo Ortiz, MSc, PMP

3

Breve historia de la Teora de Juegos1913 - E. Zermelo provee el primer teorema de la teora de juegos; juegos del tipo del ajedrez pueden ser resueltos en un (gran!) nmero finito de movimientos (teorema de Zermelo) 1928 - John von Neumann provee el teorema minimax 1944 - John von Neumann & Oskar Morgenstern escriben "Theory of Games and Economic Behavior 1950-1953 - John Nash describe el equilibrio de Nash 1972 - John Maynard Smith escribe Game Theory and The Evolution of Fighting3-dic-09 Ing. Pablo Ortiz, MSc, PMP 4

Qu es la Teora de Juegos?La Teora de Juegos es el estudio de como matemticamente determinar la mejor estrategia para unas condiciones dadas con el fin de optimizar los resultados

J. Von Neumann

O. Morgenstern3-dic-09 Ing. Pablo Ortiz, PMP PMP MSc,

El dilema del prisionero

3-dic-09

Ing. Pablo Ortiz, MSc, PMP

6

El Dilema del PrisioneroLa polica arresta a dos sospechosos. No hay pruebas suficientes para condenarlos y, tras haberlos separado (estn incomunicados), los visita a cada uno y les ofrece el mismo trato. Si confiesa y su cmplice no, el cmplice ser condenado a la pena total, 20 aos, y l ser liberado. Si l calla y el cmplice confiesa, el primero recibir esa pena y ser el cmplice quien salga libre. Si ambos confiesan, ambos sern condenados a 5 aos. Si ambos lo niegan, todo lo que podrn hacer ser encerrarlos durante 1 ao por un cargo menor.

3-dic-09

Ing. Pablo Ortiz, PMP PMP MSc,

3-dic-09

Ing. Pablo Ortiz, MSc, PMP

8

Modelando el Juego con 2 Prisioneros

ConfiesaPrisionero 1

3-dic-09

Ing. Pablo Ortiz, MSc, PMP

9

Modelando el Juego con 2 Prisioneros

Prisionero 1

Calla

3-dic-09

Ing. Pablo Ortiz, MSc, PMP

10

Modelando el Juego con 2 Prisioneros Ambos confiesan (no cooperan) cooperan)Prisionero 2ConfiesaPrisionero 1

Calla

Confiesa

Ambos confiesan

Calla

3-dic-09

Ing. Pablo Ortiz, MSc, PMP

11

Modelando el Juego con 2 Prisioneros Ambos callan (cooperan) cooperan)Prisionero 2

ConfiesaPrisionero 1

Calla

Confiesa

Calla

Ambos callan

3-dic-09

Ing. Pablo Ortiz, MSc, PMP

12

Modelando el Juego con 2 PrisionerosPrisionero 2

ConfiesaPrisionero1

CallaP1 confiesa, P2 calla

Confiesa

Calla

3-dic-09

Ing. Pablo Ortiz, MSc, PMP

13

Modelando Juego con 2 PrisionerosPrisionero 2 Prisionero 1

Confiesa Confiesa

Calla

Calla

P1 calla, P2 confiesa

3-dic-09

Ing. Pablo Ortiz, MSc, PMP

14

Modelando el Juego con 2 PrisionerosPrisionero 2

ConfiesaPrisionero 1

Calla

Confiesa

Ambos confiesan

P1 confiesa, P2 calla

Calla

P1 calla, P2 confiesa

Ambos callan

3-dic-09

Ing. Pablo Ortiz, MSc, PMP

15

Trminos BsicosJugadores: tomadores de decisin (Prisionero 1 2") Estrategia: comportamiento de los jugadores (calla/delata) Pay-off: Pago/Rentabilidad/Ganancia (x aos de prisin) Estrategia dominante: el mejor resultado para un jugador sin importar la decisin del otro jugador Una Matriz de Pagos (Payoff matrix) es una tabla que muestra las ganancias de cada posible accin para cada jugador dada cada posible accin del otro jugador3-dic-09 Ing. Pablo Ortiz, PMP PMP MSc,

Dilema del PrisioneroConfieso o me callo?

Prisionero 2

ConfiesaPrisionero1

Calla0, 20

Confiesa

5, 5

Calla

20, 03-dic-09

1, 1Ing. Pablo Ortiz, MSc, PMP 17

Cul es la mejor estrategia? estrategia? Matriz de PagosQu hara si fuera el P1? Estrategia Dominante

Prisionero 2

Confiesa Confiesa

Calla

Prisionero1

1, 1 0, 3

3, 0 2, 2Ing. Pablo Ortiz, MSc, PMP 18

Calla

3.libre ; 2.1 ao ; 1. 5 aos; 0. 20 aos

3-dic-09

El Equilibrio de NashJohn Forbes Nash Premio Nobel de Economa, 1994

3-dic-09

Ing. Pablo Ortiz, MSc, PMP

19

In competition, individual ambition serves the common good

A. Smith, The Wealth of Nations, 1776

3-dic-09

Ing. Pablo Ortiz, MSc, PMP

20

Una mente brillanteJohn Nash revisa a Adam Smith

http://www.youtube.com/watch?v=_bI_7_abwfI

3-dic-09

Ing. Pablo Ortiz, MSc, PMP

21

DilogoJ.Nash: Adam Smith said: the best result comes from everyone in the group doing whats best for himself, right? Thats what he said, right? Incomplete, incomplete. OK? Because the best result will come from everyone in the group doing whats best for himself and the group. Governing dynamics. Adam Smith was wrong

J.Nash: haga lo que es mejor para Ud. y para su grupo de tal forma que Ud. SEPA que todo el mundo gana algo, tal vez no lo mejor, pero algo3-dic-09 Ing. Pablo Ortiz, MSc, PMP 22

Nash EquilibriumSi existe un conjunto de estrategias que cumplen la siguiente propiedad:ningn jugador puede beneficiarse (obtener una mejor ganancia) cambiando su estrategia en tanto el otro jugador mantiene su estrategias incambiada

entonces el conjunto de estrategias y las ganancias correspondientes constituyen el Equilibrio de NashFuente: http://www.lebow.drexel.edu/economics/mccain/game/game.html 3-dic-09 Ing. Pablo Ortiz, MSc, PMP 23

Equilibrio de Nash

ningn jugador puede beneficiarse cambiando su estrategia en tanto el otro jugador mantiene sus estrategia incambiada

Prisionero 2

Confiesa ConfiesaPrisionero1

Calla

1, 1

3, 0

Calla

0, 3

2, 2

Equilibrio de Nash: ningn jugador puede unilateralmente mejor su posicin3-dic-09 Ing. Pablo Ortiz, MSc, PMP 24

Equilibrio de Nash algo+ formal algo+Dado un juego G = (N = {1,2}; S1, S2 ; I, 2), el par de estrategias (s1*, s2*) constituyen un Equilibrio de Nash para G si: 1. Ningn jugador tiene un incentivo de cambiar a otra estrategia 2. 1 (s1*, s2*) 1 (s1, s2*) y 2 (s1*, s2*) 2 (s1*, s2) para todo s1 S1 para todo s2 S2

(por ej. 1 (calla, confiesa)=0 1 (confiesa, confiesa)=1 ; NO cumple) 3. I (s1*, s2*) es el mximo de las columnas y 2 (s1*, s2*) es el mximo de las filasConfiesa

Calla 3, 0

Nota: i es una funcin de pago para cada jugador i s1=calla ; s2=confiesa3-dic-09

Confiesa

1, 1

Ing. Pablo Ortiz, MSc, PMP

Calla

0, 3

2, 2 25

La paradoja. paradoja.Prisionero 2

Confiesa ConfiesaPrisionero1 1, 1

Calla3, 0

Calla

0, 3

2, 2

Existe una estrategia cooperativa que podra resultar en mejores ganancias para ambos prisioneros 3-dic-09 Ing. Pablo Ortiz, MSc, PMP

26

CorolarioSi se razona desde la perspectiva del inters ptimo del grupo (de los dos prisioneros), el resultado correcto sera que ambos cooperasen, ya que esto reducira el tiempo total de condena del grupo a un total de un ao. Cualquier otra decisin sera peor para ambos si se consideran conjuntamente. A pesar de ello, si siguen sus propios intereses egostas, cada uno de los dos prisioneros recibir una condena mas largaPorqu?3-dic-09 Ing. Pablo Ortiz, MSc, PMP 27

Torneos del DPIRobert Axelrod, en su libro La evolucin de la cooperacin: el dilema del prisionero y la teora de juegos (1984), estudi una extensin al escenario clsico del dilema del prisionero que denomin dilema del prisionero iterado (DPI). Aqu, los participantes deben escoger una y otra vez su estrategia mutua, y tienen memoria de sus encuentros previos3-dic-09 Ing. Pablo Ortiz, MSc, PMP 28

Dilema del Prisionero Iterado1. 2.

Dos jugadores

El Dilema del Prisionero se juega repetidamente

3.

La historia de las interacciones previas es recordada por cada jugador (tiene memoria) No existe otro conocimiento externo3-dic-09 Ing. Pablo Ortiz, MSc, PMP 29

4.

El Torneo sobre el DPIEn los 80s Axelrod invit a colegas acadmicos de todo el mundo a idear estrategias automatizadas para competir en un torneo de DPI. Los programas que participaron variaban ampliamente en la complejidad del algoritmo, hostilidad inicial, capacidad de perdn y similares. Se realizaron dos torneos, ambos de 200 jugadas, el primero cont con 14 participantes (programas) y el segundo con 72 programas (ver http://www.prisoner-dilemma.com )3-dic-09 Ing. Pablo Ortiz, MSc, PMP 30

Tit for Tat (ojo por ojo;toma y daca)Se descubri que la mejor estrategia determinista era "tit for tat, que fue desarrollada y presentada en el torneo por Anatol Rapoport. Era el ms simple de todos los programas presentados, conteniendo nicamente cuatro lneas de BASIC, y fue el que gan el concurso.

3-dic-09

Ing. Pablo Ortiz, MSc, PMP

31

Algoritmo Tit for Tat (TFT)1. Comience el juego

eligiendo Cooperar2. Elija lo mismo que su

oponente eligi en la ronda previa (mov. espejo), esto es, si tu cooperas yo coopero, si tu no cooperas, yo tampoco

http://www.youtube.com/watch?v =IzddJ4TyeA8

3-dic-09

Ing. Pablo Ortiz, MSc, PMP

32

Ejemplo TFTRonda 1 2 3 4 Promedio3-dic-09

TFT C D D C

Eleccin del oponente D D C C

Pago 0/3 1/1 3/0 2/2 1,5/1,5

C-Cooperar ; D-Desertar=Defeccionar=No cooperar=Traicionar, etc.

Ing. Pablo Ortiz, MSc, PMP

33

Ejemplo ideal TFTRonda 1 2 3 4 Promedio TFT C C C C Eleccin Oponente C C C C Pago 2/2 2/2 2/2 2/2 2.0/2.0

3-dic-09 Ing. Pablo Ortiz, MSc, PMP

34

Tit for Tat (TFT)Axelrod concluy que cuando se repiten estos encuentros durante un largo periodo de tiempo con muchos jugadores, cada uno con distintas estrategias, las estrategias "egostas" tendan a ser peores a largo plazo, mientras que las estrategias "altruistas" eran mejores, juzgndolas nicamente con respecto al inters propio. Us esto para mostrar un posible mecanismo que explicase lo que antes haba sido un difcil punto en la teora de la evolucin: cmo puede evolucionar un comportamiento altruista desde mecanismos puramente egostas en la seleccin natural?3-dic-09 Ing. Pablo Ortiz, MSc, PMP 35

La parajoja del juego del DPMientras la cooperacin es colectivamente racional, la desercin es individualmente racional.

3-dic-09

Ing. Pablo Ortiz, MSc, PMP

36

Puntos claves de TFTAmable (agradable). Comienza cooperando y slo deserta como respuesta a la desercin de otro jugador. Nunca es responsable de empezar un ciclo de deserciones mutuas Provocable (vindicativa). Responde siempre a lo que el otro jugador hace. Castiga inmediatamente al otro jugador si este deserta, pero igualmente responde adecuadamente si cooperan de nuevo3-dic-09 Ing. Pablo Ortiz, MSc, PMP 37

Puntos claves de TFT (II)Capacidad de perdn (indulgente). Vuelve rpidamente a la cooperacin si el oponente lo hace Es Clara. Este comportamiento claro y directo significa que el otro jugador entiende fcilmente la lgica detrs de las acciones de TFT y puede as provocar una cooperacin a largo plazo

3-dic-09

Ing. Pablo Ortiz, MSc, PMP

38

Mutaciones y Deadlocks DeadlocksDixit y Nalebuff (1991) afirman que TFT es demasiado fcilmente provocable. Veamos la siguiente secuencia:Malinterpreta Desconfianza Ronda J1: J2: 1 C C 2 C C 3 C C 4 C D 5 D C 6 C D 7 D D 8 D D . D D

Se cae en una espiral de Deserciones. La Teora Evolutiva de juegos llama a este desarrollo mutaciones. Solucin: agregar mas movimientos cooperativos3-dic-09 Ing. Pablo Ortiz, MSc, PMP

39

VariantesTF2T (Tit For 2 Tat). Responde a la primer Desercin Cooperando, si el oponente vuelve a desertar, el TF2T responde desertando TFT con capacidad de perdn (TFT with forgiveness; generous TFT). Estrategia estocstica, se asume una probabilidad w en la siguiente ronda. Cuando el oponente deserta se coopera con l con una pequea probabilidad (del 1% al 5%). Es ligeramente mejor.3-dic-09 Ing. Pablo Ortiz, MSc, PMP 40

4 Consejos de Axelrod1. No ser el primero en no cooperar. Comenzar cooperando 2. Devolver tanto la cooperacin como la defeccin (provocable; vindicable) 3. No ser envidioso (el xito del otro a la larga es mi xito) 4. No ser demasiado listo (no pasarse de listo)3-dic-09 Ing. Pablo Ortiz, MSc, PMP 41

El DP como modelo de escenarios de la vida real

Publicidad competitiva Colaboracin en Investigacin

Tragedia de los Comunes

Relaciones biolgicas Manejo en el trfico3-dic-09

GuerraIng. Pablo Ortiz, MSc, PMP 42

El DP y la Gestin de Proyectos

Gestin de conflictos

tica

Gestin de personas

Gestin de Adquisiciones (Contratos)3-dic-09 Ing. Pablo Ortiz, MSc, PMP 43

Gestin de Conflictos

PMBOK, 4ta. Ed., Cap. 9-Gestin de Conflictos (T&H, Gestionar Equipos de Proyectos)3-dic-09 Ing. Pablo Ortiz, MSc, PMP 44

Negociacin efectivaEl objetivo de la negociacin es resolver las fuerzas en competencia, logrando que ambas partes acuerden una solucin razonable al conflicto. Generalmente el conflicto se origina debido a la necesidad que cada parte de buscar la posicin personal mas ventajosa. Un proyecto requiere una alineacin cercana, cooperativa entre las dos partes, de tal forma que sea beneficiosa para ambos3-dic-09 Ing. Pablo Ortiz, MSc, PMP

45

El Dilema del NegociadorEs como Lax y Sebenius denominan a la tensin entre crear valor (que se enfoca en el acuerdo; agrandar la torta; cooperar) y reclamar valor (que se enfoca en obtener tanto como sea posible de ese valor; dividir la torta; confrontar)

Fuente: Lax y Sebenius, 1986, p.158

3-dic-09

Ing. Pablo Ortiz, MSc, PMP

46

TFT aplicada al dilema del negociador Aparece como una buena estrategia Esto se traduce en crear valor al comenzar y solo reclamar valor si la otra parte lo hizo, aunque se recomienda hacerlo si las deserciones previas no fueron debido al miedo, falta de conocimiento o escepticismo de la otra parte (de ah que una mejor estrategia sea el TFT con capacidad de perdn)3-dic-09 Ing. Pablo Ortiz, MSc, PMP 47

TFT aplicada al dilema del negociador (II)Cmo evitar el deadlock que lleva la competencia y resultados sub-ptimos?

1.

2. 3. 4.

La clave es mejorar la comunicacin entre ambas partes. Recordemos que el Dilema se da porque una parte desconoce las intenciones de la otra parte Incrementar la importancia del futuro en comparacin con el presente Modificar los pagos asignados a los jugadores Ensear a los jugadores valores, hechos y destrezas que sirvan para promover la cooperacin3-dic-09 Ing. Pablo Ortiz, MSc, PMP 48

Gestin de Recursos. El Dilema del GPSupongamos un GP hizo todo lo posible para terminar el proyecto en tiempo, pero cometi un error y necesita mas tiempo de un recurso crtico. El problema es que otro GP tambin necesita de ese recurso. En resumen: Si el GP1 confiesa que necesita ese recurso y el GP2 no,entonces tendr el recurso 100% y estar a salvo Si el GP1 confiesa que lo necesita y el GP2 tambin, existir una evaluacin y ambos proyectos perdern el recurso Si el GP1 no confiesa y el GP2 lo hace, l obtendr el recurso y el GP1 perder su proyecto y eventualmente ser sancionado Si ninguno de los dos confiesa, y se quedan en silencio, probablemente ambos proyectos se atrasen, pero se terminarn3-dic-09 Ing. Pablo Ortiz, MSc, PMP 49

Gestin de RecursosEn este juego en particular si ambos GP reclaman la persona para su proyecto, ambos pierden, dado que ninguno tiene el recurso, ambos tienen 1 pto. dado que ste todava est disponible. Si ambos comparten el recurso tienen 3 puntos de ganancia. Si el GP 1 reclama son 5 ptos. y el GP 2 no gana nada, y recprocamente

GP2Comparte Comparte Reclama 3,3 5,0 Reclama 0,5 1,1

Fuente: http://blog.softwareprojects.org/how-one-thing-leads-to-another-44.html3-dic-09 Ing. Pablo Ortiz, MSc, PMP 50

GP1

Ejemplo de Contratos en el Desarrollo de Software Cada contrato en el Desarrollo de Software es un DP:1. Si el desarrollador (o software house) entrega algo que no funciona y el cliente paga, aquel recibe el beneficio y el cliente nada 2. Si el desarrollador entrega algo que funciona y el cliente no paga, el cliente se queda con el producto y el desarrollador sin nada3-dic-09 Ing. Pablo Ortiz, MSc, PMP 51

(cont) cont)3. Si ambos trabajan cooperativamente, el desarrollador entrega el software funcionando y el cliente paga 4. Si ambos no cooperan, ambos pierden, pero al menos, el desarrollador retiene el cdigo y el cliente el dinero

3-dic-09

Ing. Pablo Ortiz, MSc, PMP

52

Pagos por fases y el DPIRealmente el pago del software se establece actualmente en un contrato multifases, en el cual de hecho cada fase es un DP Un problema que se puede presentar es el no pago del ltimo pago (defeccin en la ultima ronda), de ah que se fijan normalmente estrategias tales como: incluir una clave de software, no entregar el cdigo hasta el ltimo pago, incluir el mantenimiento en el contrato, etc.3-dic-09 Ing. Pablo Ortiz, MSc, PMP 53

ticaThere must be some coercive power to compel men equally to the performance of their covenants by the terror of some punishment greater than the benefit they expect by the breach of their covenant....T. Hobbes- Leviathan, XV

It's a mutual, joint-stock world, in all meridians. We, cannibals, must help these Christians.H. Melville- Moby Dick , comentario de Ismael sobre el canbal Queequeg3-dic-09 Ing. Pablo Ortiz, MSc, PMP 54

EticaAxelrod , recordemos, se haca la siguiente pregunta en su trabajo: en qu condiciones llegar a surgir la cooperacin en un mundo de egostas no sometidos a una autoridad central? Todos sabemos que la mayora de nosotros no somos santos y que tendemos a ocuparnos preferentemente de nosotros mismos y de los nuestros. Sin embargo, sabemos igualmente que la cooperacin existe, y que nuestra civilizacin est fundada en ella. Ahora bien, en situaciones en las que cada uno de los individuos tenga incentivos para ser egosta, cmo podr llegar a desarrollarse la cooperacin?.Interacciones frecuentes + sombra del futuro3-dic-09 Ing. Pablo Ortiz, MSc, PMP 55

Cdigo de tica Profesional y TFTResponsabilidad Amable Provocable (C con C, NC con NC) No ser envidioso No pasarse de listo (no hacer trampas)

Respeto

Equidad

Honestidad

Axelrod: Promover el altruismo para desarrollar la cooperacin en la sociedad. Regla Dorada (tica de la Reciprocidad): Tratar a las otras personas como nos gustaran que nos trataran 3-dic-09 Ing. Pablo Ortiz, MSc, PMP

56

Cul es la clave del xito de los Proyectos?Apoyo de la Alta Gerencia Experiencia del Gte. de Proyecto Involucramiento de los usuarios

Cooperacin???

Etc..

interacciones

3-dic-09

Ing. Pablo Ortiz, MSc, PMP

Futuras relac.

57

EjercicioEn la reciente contienda poltica el Partido Nacional ofreci debatir ideas y programas al Frente Amplio. Finalmente ste declin la propuesta. Cul fue la estrategia aplicada? b) Cul es la estrategia dominante? c) Es la mejor estrategia (desde el punto de vista de la TG y tal vez de los votantes)?a)3-dic-09 Ing. Pablo Ortiz, MSc, PMP 58

Bibliografa breveAxelrod, R. (1984). The Evolution of Cooperation. BasicBooks, Inc., Publishers. (Trad. Alianza Editorial, 1986). Dixit, A.K. y Nalebuff B.J. (1991). Thinking Strategically. The Competitive Edge in Business, Politics and Everyday Life, New York, 1991 Wikipedia. Game Theory. http://en.wikipedia.org/wiki/Game_theory Wikipedia. Prisoner Dilemma. http://en.wikipedia.org/wiki/Prisoner_dilemma Tenbergen R. (2001): Principled Negotitation and Negotiatiors Dilemma- is the Getting to Yes approach too soft?. Harvard University, 2001 The Ethical Spectacle (1995). The Prisioners Dilemma in Software Development. http://www.spectacle.org Sitios del Dilema del Prisionero. http://www.prisoner-dilemma.com http://www.gametheory.net/Dictionary/PrisonersDilemma.html http://www.princeton.edu/~mdaniels/PD/PD.html (juego en lnea) http://serendip.brynmawr.edu/playground/pd.html (otro juego en lnea)3-dic-09 Ing. Pablo Ortiz, MSc, PMP 59

3-dic-09

Ing. Pablo Ortiz, MSc, PMP

60