Capitulo IV Teoria Decisiones 12mar2012

Embed Size (px)

Citation preview

CAPITULO IV

Teora de decisin y anlisis de decisiones4.1 INTRODUCCIN La mayora de las acciones de la vida requieren la eleccin de alternativas bajo incertidumbre, esto es, elegir entre un conjunto de cursos alternos de accin en condiciones en donde uno tiene incertidumbre sobre las consecuencias reales de cada curso de accin. A menudo, sin embargo, debemos elegir una alternativa y frecuentemente nos preocupa que sea la alternativa mejor u optima. Considere, por ejemplo, el rea de diseo y desarrollo de productos nuevos y mejorados y de equipo. Los problemas de desarrollo de productos relacionados con la investigacin y desarrollo (I & D), produccin, finanzas y actividades de mercadeo, abundan tanto en el campo tcnico como estratgico. En I & D, por ejemplo, los tomadores de decisiones podran enfrentarse con el problema de elegir si llevan a cabo o no una estrategia paralela versus una secuencial (i. e., persiguiendo dos o mas diseos simultneos versus el desarrollo del diseo mas promisorio si este falla, eligiendo el siguiente diseo mas promisorio, etc.). En produccin, es posible que se necesite decidir sobre un mtodo o proceso de produccin para fabricacin; tambin si se debe alquilar, subcontratar, o fabricar o seleccionar un plan de control de calidad. En finanzas, puede ser necesario decidir si se invierte o no en una nueva planta, en equipo, en programas de investigacin en mercadeo, en instalaciones, aun en ordenes riesgosas. En mercadeo, tienen que determinar el esquema de precios, si debe hacerse investigacin de mercado o no y de que tipo y con que intensidad y el tipo de campaa publicitaria, etc. Cada uno de estos problemas de decisin es caractersticamente complejo. Es casi imposible para un tomador de decisiones tener en cuenta todos los factores que inciden en la decisin simultneamente. Por tanto, seria de gran utilidad encontrar alguna manera de descomponer estos problemas de decisin para permitirle al tomador de decisiones, pensar en las implicaciones de un conjunto de factores, uno por uno, de una manera racional (consistente). El anlisis de decisiones tiene que ver con la toma racional (consistente) de decisiones, principalmente bajo condiciones de incertidumbre. Esto es, le ayuda al tomador de decisiones a contestar la pregunta Cual es la mejor alternativa que puedo seleccionar con base en la informacin que tengo ahora? (Normalmente es incompleta e incierta). El anlisis de decisin le permite al tomador de decisiones analizar una situacin

compleja con muchos cursos de accin consistentes con los valores bsicos (gustos) y conocimientos (creencias) del tomador de decisiones. Para facilitar nuestra exposicin, adoptaremos tres polticas primarias CV: (1) Evitar el uso de matemticas cuando no haya necesidad real para ello. (2) Restringir la discusin principalmente a problemas y (3) Explicar los diversos mtodos del anlisis de decisin por medio de un ejemplo concreto simple.

Ejemplo: Aprovisionamiento de shorts de tenisUsted es el propietario de un almacn de artculos de tenis y debe decidir cuantos shorts de tenis para hombre debe pedir para la estacin de verano. Para un tipo particular de shorts, usted debe pedir lotes de 100. Si pide 100 shorts, su costo es de $10 por unidad. Si pide 200 su costo es de $9 por unidad y si pide 300 o mas su costo es de $8.50. Su precio de venta es de $12, pero si algunas se quedan sin vender al final del verano, estas deben venderse a mitad de precio. Por sencillez, usted cree que la demanda de shorts es 100, 150 200. Es claro, que usted no puede vender ms de lo que almacena. Sin embargo si se queda corto hay una perdida de buen nombre de $0.50 por cada shorts que una persona desee comprar pero que no pueda hacerlo por no tenerla en el almacn. Adems, usted debe colocar el pedido ahora, para la estacin de verano venidera; y no puede esperar a observar como varia la demanda de este short antes de pedir, ni se pueden colocar varios pedidos. 4.2 CARACTERSTICAS DE UN PROBLEMA DE DECISIN El problema descrito anteriormente, y en realidad cualquier problema de decisin, tiene ciertas caractersticas comunes. El problema de decisin en estudio puede representarse por un modelo en trminos de los siguientes elementos: 1. El tomador de decisiones . Es el responsable de tomar la decisin. Se le mira como una entidad y puede ser un solo individuo, un comit, una compaa, una nacin, etc. 2. Cursos alternos de accin. Una parte importante de la tarea del tomar de decisiones es especificar y describir sus alternativas. Puesto que las alternativas son especificadas, la decisin comprende la eleccin entre cursos de accin alternos. Cuando la oportunidad de adquirir informacin es disponible, el problema del tomador de decisiones es escoger la mejor fuente de informacin y la mejor estrategia total. Una estrategia es una regla de decisin que indica la accin contingente que debe tomarse o una observacin especifica recibida de una fuente de informacin elegida. En el problema anterior, tres cursos de accin estn abiertos: (a1) pedir 100, (a2) pedir 200 y (a3) pedir 300. 3. Eventos. Estas son situaciones o estados del ambiente, que pueden ocurrir y que no estn bajo el control del tomador de decisiones. Bajo condiciones de incertidumbre, el tomador de decisiones no conoce con certeza que evento ocurrir cuando decide. Vale la pena mencionar que el evento cierto puede ser

un hecho, desconocido para el tomador de decisiones. Los eventos se definen como mutuamente excluyentes y colectivamente exhaustivos. Esto implica que ocurrir uno y solamente uno de todos los eventos posibles especificados. Los eventos son sinnimamente denominados estados, estados de la naturaleza, estados del mundo o eventos importantes de pago. La incertidumbre se mide en trminos de probabilidades asignadas a los eventos. Una de las caractersticas distintivas del anlisis de decisiones es que estas probabilidades son subjetivas (reflejan el estado de conocimiento o las creencias del tomador de decisiones), u objetivas (i.e., determinadas tcnica o empricamente). El tomador de decisiones debe identificar y especificar los eventos y tambin evaluar sus probabilidades de que se presenten. En el ejemplo anterior, los eventos son (1) cuando la demanda es 100, (2) cuando la demanda es 150 y (3) cuando la demanda es 200. 4. Consecuencias. Las consecuencias, las cuales deben evaluarse por el tomador de decisiones, son una medida del beneficio neto o pago recibido por el. Las consecuencias que resultan de la decisin dependen no solamente de la decisin sino tambin del evento que ocurra. As hay una consecuencia asociada con cada par de accin-evento. Las consecuencias se denominan sinnimamente pagos, resultados, beneficios o perdidas. Ellas se resumen convenientemente en una matriz de pago o matriz de decisin que exhibe las consecuencias de todas las combinaciones accin-evento. Por ejemplo, en el problema de decisin del ejemplo, si el pide 100 short y la demanda resulta ser 100, la consecuencia es que el propietario obtendr una ganancia de $200. Debe mencionarse que las consecuencias deben reflejar los valores subjetivos del tomador de decisiones. Esto es, deben representar las preferencias del tomador de decisiones o los valores de las consecuencias objetivas correspondientes. En otras palabras, las consecuencias objetivas tienen necesariamente que ser transformadas en utilidades que reflejen el valor subjetivo de las consecuencias del tomador de decisiones. Por tanto, ser necesario evaluar la funcin de utilidad del tomador de decisiones. Para simplificar la decisin, supondremos, a no ser que se diga lo contrario, que los valores dados de las consecuencias ya han sido transformado en utilidades. Existe un conjunto de eventos con probabilidades de ocurrencia p() y un conjunto de acciones A. Asociado con cada accin y evento hay una consecuencia objetivo formada con los beneficios b y costos c, que es determinada por medio de una funcin consecuencia objetivo compuesta del beneficio y las funciones de costo y . Una consecuencia objetiva (b, c) se transforma en una consecuencia subjetiva o de utilidad por medio de la funcin v de utilidad del tomador de decisiones. Dados estos elementos y estructuras de un problema de decisin, la nocin fundamental del analista de decisin, derivada de ciertos axiomas del comportamiento racional, expresa que el tomador de decisiones debe:

1. Asignar probabilidades personales a los eventos y utilidades a las consecuencias asociadas por cada par accin - evento. 2. Calcular una utilidad esperada por cada accin.

3. Elegir la accin que maximice la utilidad esperada. El tomador de decisin tambin puede tener la opcin de adquirir ms informacin de las consecuencias asociadas con los cursos de accin bajo evaluacin por medio de la funcin de solicitud (fuente de informacin) que relaciona los eventos de los mensajes. Bajo esta situacin el tomador de decisin acta con base al mensaje o dato recibido de una estrategia o funcin de decisin. Esta informacin es costosa, retrasa la decisin y usualmente es poco menos que perfectamente confiable o informativa. El teorema de Bayes es utilizado para revisar las probabilidades o creencias de uno basado en la nueva informacin. El anlisis de decisiones proporciona un modelo conceptual bsico para determinar que informacin debe adquirirse y cuando debe obtenerse y la eleccin que debe hacerse despus de recibida. Este aspecto ser cubierto en el Capitulo 6. 4.2.1. La matriz de (Decisin) pago La matriz de decisin de nuestro problema del propietario de la tienda de artculos de tenis se ilustra en la tabla 4.1. En la matriz de pago, las acciones se listan a la izquierda a lo largo de las filas, los estados se listan en parte superiores de la matriz a lo largo de las columnas y las consecuencias posibles se listan en las celdas de la matriz, una consecuencia asociada con cada par accin evento. Las consecuencias se determinan de la siguiente funcin de consecuencia: Si el suministro es mayor que la demanda (i. e., si S > D), entonces la ganancia es igual a D(R - C) (C - 6) (S D). Si la demanda es mayor que el suministro (i. e., si D > S), entonces la ganancia es igual a S(R - C) 0,50 (D S). R es el ingreso unitario por unidad (precio de venta), C es el costo unitario. El parmetro $6 es el precio mitad o precio de venta al final del verano para los artculos no vendidos y $0,50 es la perdida de prestigio por quedarse corto.

Evento Accin

a1: pedir 100 a2: pedir 200 a3: pedir 300

3: 100 200

1:

DEMANDA

2: 200 150600 450

150 175300 150

0 -150

Tabla 4.1 Matriz de pago (decisin) para el problema del propietario de la tienda de tenis.

Si el evento que ocurre fuera conocido de antemano con certeza por el tomador de decisiones, por ejemplo 2 (la demanda fuera 150), entonces el propietario debera mirar para abajo en la columna 2 de la matriz de pago y elegir la accin que le produjera el mas alto pago [i.e., mx. (175, 300, 150 = 300)], que indica que debera

200 pantalonetas. Sin embargo, en el mundo real, el contexto de los problemas de decisin es tal, que debido a que los estados de la naturaleza estn fuera del control del tomador de decisiones, el no sabe con certeza que evento especifico ocurrir (o ser cierto). La eleccin de curso ptimo de accin frente a la incertidumbre es parte crucial de problema del tomador de decisiones. Aunque el termino incertidumbre se refiere a la ignorancia del tomador de decisiones sabe cual es el evento que ocurrir (o cual evento ser el verdadero) tambin el puede tener incertidumbre sobre varios aspectos de las consecuencias. Por ejemplo, si el propietario de la tienda de artculos de tenis no estuviera seguro de su perdida de prestigio, entonces algunas de las ganancias de la matriz de decisin serian inciertas. Estos anlisis lo pueden llevar a uno a expandir la formulacin del problema para incluir mayor detalle y panorama. El hacer esto o no depende de que tan complejo (y que tan realista) desee uno que sea el modelo. Ver, por ejemplo, Raiffa (1968) para una discusin posterior en este tema. Debe de notarse que algunos autores distinguen entre lo que ellos llaman toma de decisiones bajo riesgo (toma de decisiones cuando el estado del mundo no es conocido pero se conocen las probabilidades para los diversos estados posibles) y toma de decisiones bajo incertidumbre (toma de decisiones cuando el estado del mundo no se conoce y las probabilidades de los diversos estados no se conocen). Bajo la interpretacin subjetiva de probabilidad, es siempre posible evaluar las probabilidades para estos eventos o estados posibles, o estados del mundo. Por tanto, la dicotoma riesgo versus incertidumbre es extremadamente artificial (en realidad, no existe de acuerdo a la interpretacin subjetiva de probabilidad) y en este libro cualquier problema de toma de decisiones en que el estado del mundo no se conozca con certeza se le denomina toma de decisin bajo incertidumbre. El termino riesgo se reserva para una discusin relativa a la utilidad. CRITERIOS DE ELECCIN Habiendo examinado los elementos fundamentales y la estructura de los problemas de decisin bajo incertidumbre, trataremos ahora diversos criterios que pueden utilizarse para seleccionar un curso de accin. En primer lugar investigaremos criterios de toma de decisiones que han sido desarrollados y que se basan exclusivamente en la matriz de pago. Estos criterios han sido desarrollados, por lo menos en parte, para evitar la evaluacin de probabilidades. Tales criterios ignoran la naturaleza probabilstica de la toma de decisiones bajo incertidumbre. Aqu exploraremos los siguientes criterios de eleccin: (1) dominacin (inadmisibilidad), (2) maximin, (3) mximax, (4) Hurwicz , (5) mnimax arrepentido o perdida de oportunidad. En segundo lugar investigaremos los criterios cuando el que toma la decisin desea asignar una distribucin de probabilidad a los eventos. Los criterios que se discuten aqu son (1) Laplace y (2) maximizacin del valor esperado (MVE).

4.3.

4.3.1 Criterios no probabilsticos de eleccin Este tipo de situacin de toma de decisiones no tiene distribucin de probabilidad anterior; esto es, se caracteriza por la ignorancia completa de cualquier distribucin de probabilidad de los estados de la naturaleza. Mientras que uno podra argumentar que esta situacin es algo rara en una situacin real, diversos eruditos en la toma de decisiones bajo incertidumbre han propuesto diversos criterios para resolver estos problemas. Dominacin. El principio de dominacin no es tanto una manera de seleccionar una accin o estrategia como una manera de decidir que acciones o estrategias eliminar. La dominacin expresa que, si para cada evento la consecuencia de la accin a1 es al menos tan deseable como la consecuencia de otra accin a2 y es mas deseable por lo menos en un evento, entonces la accin a2 es denominada o inadmisible y por consiguiente no debe elegirse. Uso de este principio ampliamente aceptado se traducira en la eliminacin de la accin del propietario de la tienda de tenis al ordenar 300 pantalonetas (a3), puesto que no importa cual sea la demanda, esta accin resultara siempre en menor ganancia que la que resultara si el escoge 200. La accin a3 es por consiguiente dominada por la accin a2, dejando al propietario que decida entre a1 y a2. Maximin: Wald. El criterio maximin (o criterio del pesimismo) fue sugerido por Abraham Wald. Bajo este principio, el tomador de decisiones supone que una vez que el ha elegido un curso de accin, la naturaleza seria malevolente (con una probabilidad implcita de 1) y por tanto seleccionara el evento que minimizara el pago del tomador de decisiones. Wald sugiri que el tomador de decisiones debera elegir un curso de accin de tal manera que recibir un pago tan grande como fuera posible bajo estas circunstancias. En otras palabras escoger lo mejor de lo peor o maximizar el mnimo. Expresado de otra manera, elegir una accin cuya peor consecuencia sea tan buena como la peor consecuencia de cada accin. El resultado de aplicar este criterio al propietario de la tienda de artculos de tenis se muestra abajo (la accin a3: pedir 300 es dominada; por consiguiente, ya no se puede considerar como una accin viable): Accin a1: pedir 100 a2: pedir 200 Pago mnimo 150 0

Por tanto, la mejor accin, suponiendo que la naturaleza ser siempre malevolente, es escoger a1: pedir 100, puesto que esta accin tiene el pago mximo mnimo. Obviamente, el mximo es un criterio ultrancoservador, puesto que descansa sobre lo peor que puede suceder. Un hombre de negocios que siga el maximin preferira dejar

los negocios, puesto que en la mayor parte de las cosas que hace perdera dinero, mientras que si el no hace nada no tendra perdidas econmicas (y no tendra ganancias). Parece lo ms razonable, argumentar que un tomador de decisiones debera tener una cuenta la probabilidad de ocurrencia de todos los eventos diferentes posibles. Como ejemplo extremo, si el evento que resulta en el mnimo pago para un acto dado es raro (digamos, una oportunidad de ocurrir en un milln), en general no tendra sentido concentrarse en esta ocurrencia. A pesar de estos comentarios negativos sobre el maximin, hay situaciones por ejemplo, en teora de juegos, en donde parece ser un buen mtodo para seleccionar una estrategia. Mximax. Si el maximin es extremadamente pesimista, el mximax es sper optimista. Este criterio lo apetecen personas altamente aventureras. El mximax el acto que es el mejor de lo mejor. Esto es equivalente a elegir una accin cuya mejor consecuencia sea tan buena como la mejor consecuencia de cualquier otra accin. En el ejemplo del tenis, el mximax seria elegir a2: pedir 200. Accin a1: pedir 100 a2: pedir 200 Pago (mximo) 200 600

Las crticas a este criterio son similares a las del maximin. Nadie recomienda seriamente el maximax como un buen criterio de eleccin, puesto que ignora las perdidas y no considera las oportunidades de ocurrencia de los diferentes eventos posibles. Los siguientes criterios de eleccin requieren la utilizacin plena de la matriz correspondiente de valor y consecuencias. Hurwicz-Indice . Leonid Hurwicz un econometrista contemporneo, se preguntaba: Por qu siempre debemos suponer que la naturaleza sea malevolente?. Supongamos que el tomador de decisiones fuera un optimista y sintiera confianza sobre sus posibilidades de obtener un buen evento. Si fuera completamente optimista, siempre supondra que la naturaleza seria benvola y seleccionara el evento que le proporcionara el mayor pago posible por la accin o estrategia que l seleccionara. Por consiguiente, la mejor estrategia, suponiendo que la naturaleza es benvola, es a2: pedir 200 (maximax). Sin embargo, Hurwicz no vea que un tomador racional de decisiones fuera completamente optimista pero si sugera que si un tomador de decisiones se senta optimista, debera poder expresar su grado de optimismo. As, se introdujo la nocin del coeficiente de optimismo. El coeficiente de optimismo es un medio por el cual el tomador de decisiones considera los pagos ms grandes y pequeos y los pesa de acuerdo con sus propios sentimientos de optimismo y pesimismo. Por ejemplo, supongamos que el tomador de decisiones tena un coeficiente de optimismo de 1/3. Esto en efecto significa, que el tomador de decisiones

tiene implcitamente asignada una probabilidad de ocurrencia de 1/3 de su mximo pago y 2/3 de su pago mnimo. Por el criterio de Hurwicz, el debera determinar el valor esperado de cada accin, suponiendo que el mximo o el mnimo ocurrirn con las probabilidades anteriores; esto es,

Hi = Cmax + (1 - ) Cminy seleccionar el valor mayor de Hi . Un valor de cerca de 1, refleja un tomador de decisiones optimista puesto que, cuando = 0, Hurwicz es el mismo mximo. Un valor de cerca de reflejara una actitud neutral hacia el destino. Los resultados de aplicar el criterio de Hurwicz ( = 1/3) al problema ejemplo son los siguientes: Accin a1: pedir 100 a2: pedir 200 Cmax: Pago mximo 200 600 Cmin: Pago mnimo 150 0 Pago esperado 167 200

As, a2: pedir 200 debera elegirse. Las dificultades obvias de este criterio comprenden (1) la dificultad para asignar un valor especifico de , (2) el ignorar los valores de las consecuencias intermedias para cada accin cuando existen mas de dos eventos, y (3) la inhabilidad para elegir una accin particular cuando todas las acciones tienen las mismas consecuencias peores y mejores. Pesar Mnimax: Savage. Savage el notable estadstico, sealaba que despus de que se ha tomado una decisin y de que ha ocurrido un evento, el tomador de decisin puede experimentar pesar debido a que conoce que evento ha ocurrido y desea quiz haber seleccionado una accin diferente. Savage propuso que el tomador de decisiones deba intentar minimizar su pesar mximo. El criterio de Savage requiere del desarrollo de una matriz de pesar o de perdida de oportunidad y el uso de mnimax para seleccionar una accin. El pesar se define como la diferencia entre el pago actual y el pago que uno habra recibido si uno supiera el evento que iba ocurrir. Para utilizar el criterio de pesar mnimax, primero convertimos la matriz de pago en una matriz correspondiente de pesar. Esto se hace quitando en cada entrada de la matriz de pago la entrada ms grande en su columna. La entrada mas grande en una columna tendr pesar cero. La matriz resultante se denomina una matriz de pesar o una matriz de perdida de oportunidad. La tabla 4.2 muestra la matriz de pesar para el ejemplo de nuestro problema. Un pesar calculado como se describe antes, representa la diferencia en valor entre lo que uno obtiene por una accin dada y un evento dado y lo que uno obtendra si supiera de antemano cual era el evento dado, en realidad, el evento verdadero. En el ejemplo, si pedimos 100 unidades (a1) y la demanda es 150 unidades (2), entonces su pesar es

$125 mas pidiendo 200 unidades si hubiera sabido de antemano cual era el evento dado que la demanda seria en realidad 150 unidades. Sin embargo, usted hubiera ordenado 200 unidades (a2) y la demanda fuera 150 unidades, su pesar sera cero, puesto que usted no habra elegido una accin mejor si hubiera conocido por adelantado que la demanda seria de 150 unidades. La accin ptima bajo este criterio es a2, y se determina como sigue: Tabla 4.2 Matriz de valor y pesar (perdida de Oportunidad) para el problema del propietario de la tienda de tenis

MATRIZ DE PAGOEvento Accin a1: pedir 100 a2: pedir 200

1: 100$ 200 0

DEMANDA 2: 150 175 300

200150 600

3:

MATRIZ DE PESAREvento Accin a1: pedir 100 a2: pedir 200 DEMANDA

1:0 200

2:125 0 450 0

3:

Accin a1 a2

Pesar mximo (perdida de oportunidad) 450 200

En el caso que la tabla original estuviera en trminos de perdidas (costos), uno escogera la menor perdida para cada evento y la restara de cada entrada fila. Cada entrada en la tabla de pesar es ahora, la perdida de la oportunidad asociada con la combinacin acto-evento. Las celdas donde apareca antes la menor perdida, muestran ahora ceros. Aqu el criterio mnimax se aplica como antes. Las objeciones que se hicieron a los criterios maximin y mximax tambin se aplican al pesar mnimax. Pero hay tambin otras objeciones que pueden hacrsele. Una objecin surge cuando el pago (prdidas o ganancias) se expresan en trminos de utilidad. En otras palabras, no es generalmente posible decir que el pesar de llevar una utilidad de 20 utils a una utilidad de 10 utils causa una mitad de insatisfaccin comparable en pasar una utilidad de 100 utils a 80 utils. Esto es cierto tambin en las medidas de temperatura, en las que no tenemos bases para decir que un incremento en la temperatura de 70F A 80F producen la mitad de desagrado que uno que pasa de 80F, a 100F. As, es dudoso que las diferencias en utilidad como las hemos definido reflejen pesares en el mismo sentido que las diferencias, por ejemplo en ganancias monetarias. 4.3.2 Criterios de eleccin probabilsticos Los dos criterios de eleccin restantes que deben discutirse tienen una distribucin de probabilidad asociada con los eventos. Ambos criterios utilizan el valor esperado; esto es, en donde se asigna una accin o estrategia se calcula un valor esperado, a partir de las consecuencias y pagos junto con las probabilidades asignadas a los eventos. Cada mtodo de valor esperado dice seleccionar una accin, cuyo valor esperado es al menos tan grande (pequeo, si se trabaja con perdidas) como el valor esperado de cualquier otra accin.

Laplace: Principio de Razn Insuficiente. Si ignoramos completamente el evento que podra ocurrir, podramos proceder como si todos los estados fueran igualmente posibles, esto es, asignar a cada evento la misma probabilidad, calcular el pago (perdida) esperado para cada acto y elegir el acto con el mayor (menor) pago (perdida) esperado. As, trataramos el problema como si tuviramos una distribucin de probabilidad uniforme, sobre los eventos y si los pagos fueran expresados en trminos de utilidad, resolveramos el problema encontrando la accin que maximiza la utilidad esperada. El nombre de este mtodo procede de Pierre-Simn, marques de Laplace, un matemtico de comienzos del siglo diecinueve que presento el punto de vista de que, cuando uno se enfrenta a un conjunto de eventos y tiene suficiente razn para suponer que uno ocurrira en lugar de otro, los eventos deben considerarse igualmente probables. Para nuestro problema la probabilidad asignada a cada evento seria 1/3. El valor esperado para cada accin, es entonces,

EV (a1) = 1/3 (200) + 1/3 (175) + 1/3 (150) = $ 175 EV (a2) = 1/3 (0) + 1/3 (300) + 1/3 (600) = $ 300 Por consiguiente, el criterio de Laplace elegira a2, pues su valor esperado es el mas alto. Cuando pensamos en asignar probabilidades a los eventos, es generalmente raro que estemos ignorando completamente la situacin; por tanto, no le daremos a cada evento la misma probabilidad de ocurrencia. En estas situaciones, el criterio de Laplace seria inadecuado y uno naturalmente debe utilizar el mtodo ms general de valor esperado.

Maximizacin del Valor Esperado (MVE). Como se indico previamente, el criterio mximo valor esperado dice lo siguiente: (1) asigne una probabilidad a cada evento de tal manera que las probabilidades sumen 1; (2) calcule el valor esperado de cada accin multiplicando cada valor por su probabilidad correspondiente y sumando estos productos; (3) elija una accin cuyo valor esperado sea el mayor. En otras palabras, el valor esperado de un acto es el promedio ponderado de los pagos bajo el acto, en donde los pesos son las probabilidades de los eventos mutuamente excluyentes que pueden ocurrir.En un problema de decisin realista ser razonable suponer que un tomador de decisiones tendra alguna idea de posibilidad de ocurrencia de los diferentes eventos y este conocimiento le ayudara a elegir un curso de accin. Por ejemplo, en nuestro ejemplo ilustrativo, si el propietario de la tienda de tenis cree que las ventas (demanda) ser de 200 unidades, esto tendra la tendencia a hacerlo pedir 200 pantalonetas de tenis (a2). De acuerdo al mismo raciocinio, si tiene gran confianza de que las ventas sern (demanda) de 100 unidades, pedir 100 pantalonetas. Si hay muchos eventos posibles y muchos cursos posibles de accin, el problema se vuelve complejo y el tomador de decisiones, claramente necesita algn mtodo ordenado para procesar toda la informacin importante. Este procedimiento sistemtico lo proporciona el clculo del valor esperado de cada curso de accin y la seleccin del acto que conduce al ms alto de estos valores esperados. Tambin veremos como se puede ajustar este mtodo para el clculo de utilidades esperadas, en lugar de pagos esperados para los casos, en donde la maximizacin de los pagos esperados no es un criterio de eleccin adecuado. Para ilustrar los clculos utilizando el criterio del MVE supongamos que el propietario de la tienda de tenis (con base a datos pasados, experiencia e instinto) asigna la siguiente distribucin de probabilidad subjetiva a los eventos:

Evento 1 : demanda es 100 2 : demanda es 150 3 : demanda es 200

Probabilidad p ( ) 0,5 0,3 0,2 1,0

Note que si la demanda es 100, ella no puede ser 200 (i.e., los eventos son mutuamente excluyentes), y las probabilidades suman 1, como debera ser (i.e., los eventos son colectivamente exhaustivos). El valor esperado del propietario para cada acto se muestra en la Tabla 4.3. Utilizando el criterio MVE, el propietario de la tienda de tenis escoge a2 : pedir 200 pantalonetas, con un valor esperado de $210.Tabla 4.3. Utilidades esperadas propietario tienda de tenis ACTO a1: PEDIR 100 UNIDADES Evento Probabilidad Utilidad Utiliad ponderada 1 : demanda es 100 0,5 $200 $100,00 2 : demanda es 150 0,3 150 45,0 3 : demanda es 200 0,2 100 20,0 1,0 Utilidad esperada = $165,0 $165,0

ACTO a2: PEDIR 200 UNIDADES Evento Probabilidad 1 : demanda es 100 0,5 2 : demanda es 150 0,3 3 : demanda es 200 0,2 Utilidad $ 0 200 550 $210,0 Utiliad ponderada $ 0,0 90,0 120,0 $210,0 Utilidad esperada =

Debe hacerse nfasis en que las consecuencias y probabilidades de los eventos pueden interpretarse como objetivas o subjetivas. Las consecuencias (valores) objetivas representan cantidades fsicas tales como dlares, unidades de tiempo, etc. Las consecuencias (valores) subjetivas representan las preferencias relativas del tomador de decisiones, o los valores de las consecuencias correspondientes. Se denominan

subjetivas puesto que sus entradas estn directamente relacionadas con las preferencias del tomador de decisiones, en la situacin de un problema particular. Minimizacin de la prdida esperada de oportunidad (PEO) Un concepto til en el anlisis de decisiones bajo incertidumbre es el de la perdida de oportunidad que se ha descrito previamente cuando discutimos el criterio del pesar mnimax de Savage. El clculo de la prdida esperada de oportunidad, se hace de manera completamente anloga al clculo del valor esperado. Esto es, utilizamos las probabilidades de los eventos como ponderadores y determinamos la perdida de oportunidad promedia para cada acto. El objetivo es seleccionar el acto que tenga el mnimo PEO. El calculo de las PEO para las dos acciones del propietario de la tienda de tenis se da en la tabla 4.4 (refirase a la parte inferior de la tabla 4.2 para la perdida de la oportunidad). Si el selecciona el acto que minimiza el PEO, escoger a 2: pedir 200 unidades. Note que este es el mismo acto que el selecciono bajo el criterio del MVE. Puede probarse que la mejor accin de acuerdo al criterio del MVE es tambin la mejor utilizando la minimizacin del PEO. Tambin debe notarse que la perdida de oportunidad no son perdidas contables, sino que representan oportunidades que se han escapado. Tabla 4.4. Perdida esperada de oportunidad (PEO) en el problema del propietario de la tienda de tenis.ACTO a1: PEDIR 100 UNIDADES Evento Probabilidad 1 : demanda es 100 0,5 2 : demanda es 150 0,3 3 : demanda es 200 0,2 1,0 PEO (a1) = $127,5 Perdida de Oportunidad $0 125 450 Perdida ponderada de Oportunidad $ 0,0 37,5 90,0 $127,5

ACTO a2: PEDIR 200 UNIDADES Evento Probabilidad 1 : demanda es 100 0,5 2 : demanda es 150 0,3 3 : demanda es 200 0,2 1,0 PEO (a2)= $100,0 Perdida de Oportunidad $ 200 0 0 Perdida ponderada de Oportunidad $ 100,0 0,0 0,0 $100,0

4.3.3.

Resumen

Los resultados de emplear los siete criterios en nuestro problema de toma de decisiones bajo incertidumbre se resumen a continuacin: Criterio Dominacin Maximin Mximax Hurwicz alfa Laplace MVE (min. PEO) Acto ptimo (Mejor) No selecciono el mejor acto (eliminado a3 ) a1 a2 a2 a2 a2

Cinco de los seis criterios (no contando el de dominacin) eligen a2. Solamente el criterio de wald elige a1 (la accin menos riesgosa o ms conservadora). Sin embargo, puede que esta no sea la situacin comn. En otros ejemplos, cada uno de los criterios podran seleccionar una accin diferente. Por consiguiente, en general, bajo condiciones de incertidumbre, la seleccin del criterio de decisin puede ser de importancia crucial. La seleccin de un criterio o criterios debe dejarse al tomador de decisiones y es dictada por su propia actitud y la poltica de la compaa. Algunas de las desventajas y falta de validez de los diversos criterios ya han sido indicadas. El criterio de wald, en muchos casos, puede conducir a que una compaa no haga nada o realice ningn negocio. El criterio de hurwicz no considera todos los pagos, solamente el mximo y el mnimo. El criterio de savage es pesimista y evala las estrategias en trminos de perdida de oportunidad. El criterio de laplace parece invlido, puesto que normalmente hay suficientes razones para creer que quien toma la decisin no ignora completamente la situacin y de este modo la asignacin de probabilidades iguales no es razonable. En la parte que resta del texto para los problemas de decisin bajo incertidumbre, utilizaremos el criterio de eleccin de MVE. La minimizacin PEO, o la maximizacin de la utilizacin esperada, a no ser que se indique lo contrario. VALOR ESPERADO DE LA INFORMACIN PERFECTA

4.4

Hasta este punto, hemos considerado situaciones en las cuales el tomador de decisiones elige diversos cursos de accin con base en la informacin que posee (i.e., su informacin previa) sin intentar adquirir informacin posterior antes de que tome su decisin. Las probabilidades utilizadas para calcular el valor esperado de la accin,

como se muestra en la tabla 4.3. Por ejemplo, se denominan probabilidades previas para indicar que se presentan probabilidades establecidas antes de obtener la informacin adicional por medio de pruebas, experimentos o muestreo. La eleccin de una accin optima basados en el MVE se le denomina a menudo anlisis previo. Consideramos el hecho de decidir si vale la pena o no reunir informacin adicional (la cual si acaso, es raramente confiable) y si es del caso que informacin recoger y que acciones tomar basados en la accin recibida. Antes de contestar esta pregunta, es primero deseable preguntar "cual es valor de la informacin perfecta?". Supongamos que en nuestro problema del dueo de la tienda de tenis, la informacin perfecta sobre la demanda de una pantaloneta dada de tenis representa $ 100 y que la encuesta en consideracin cuesta $ 200. En este caso, no realizaramos la encuesta, pues seria irracional pagar $ 200 por una informacin que representa $ 100 para hacer estos juicios necesitamos determinar el valor esperado de la informacin perfecta (VEIP). Hay tres maneras de calcular el VEIP.

4.4.1

Mtodo

Primero calculamos el valor esperado bajo certeza (i. e., teniendo informacin perfecta) y se lo restamos al valor esperado bajo incertidumbre (la mejor accin elegida utilizando MVE). Primero decimos que bajo certeza, tomaramos la accin a2 en nuestro ejemplo de la tienda de tenis y obtendramos un MVE de 0.5 (0) + (0,2) (600) = $210 (Tabla 4.3). Este es el valor esperado bajo incertidumbre. Para obtener el valor esperado bajo certeza, nos preguntamos Cul es su valor esperado si podemos escoger su accin despus de conocer el evento verdadero (demanda), esto es, despus de obtener informacin perfecta?. Claramente, la disponibilidad de la informacin perfecta nos permite obtener una ganancia de $200 si 1 se obtiene, puestoque elegiramos la accin a1 sobre la a2 en esta situacin. Si se obtiene 2 alcanzaramos una ganancia de $300 puesto que la accin a2 se preferira sobre a1. Y similarmente, si supiramos que 3 es la accin que ocurre, obtendramos una ganancia de $600 puesto que escogeramos a2 sobre a1. Para entender y calcular el valor esperado bajo certeza, es necesario adoptar el punto de vista de frecuencia relativa a largo plazo. Esto es, debemos ponderar cada una de estas ganancias con las probabilidades previas de que cada uno de estos eventos ocurra. En otras palabras, desde el punto de vista de frecuencia relativa, estas probabilidades son interpretadas como la proporcin de veces que un predictor perfecto pronosticara que cada uno de los eventos ocurrira si a la situacin actual nos

enfrentramos repetidamente. Cada vez que el predictor realiza un pronstico el tomador de decisiones elige la accin de pago ptima. El clculo de la probabilidad esperada con informacin perfecta se muestra en la tabla 4.5 y es igual a $310. El VEIP es as $310 - $210 = $100. Esto es la ganancia esperada (promedia) que se obtendra si el propietario de la tienda de tenis tuviera informacin perfecta sobre la demanda futura.

Tabla 4.5 Clculo de la ganancia esperada bajo certeza.

Evento Accin a1: pedir 100 a2: pedir 200P( 1 ) = 0,5

DEMANDAP( 2 ) = 0,3 P( 3 ) = 0,2

1 : 100

2 : 150

3 : 200

200a 0

175 300a

150 600a

Ganancia esperada bajo certeza = 200(0,5) + 300(0,3) + 600(0,2) = $310 a Consecuencias ptimas (y acciones) para un evento dado.

Bibliografa: Moskowitz y Wright. Investigacin de Operaciones. Editorial, Prentice-hall

PROBLEMA 1. El problema de nivel sencillo de Star ProductionsUna productora de series de televisin, acaba de firmar un contrato para producir un nuevo espectculo de primera lnea, New York Life. El presidente de la empresa le ha pedido a usted que determine una inversin inicial apropiada para el programa piloto de dos horas y para los siguientes ocho episodios de una hora de la serie.

Formulacin del problema.El primer paso, al utilizar el anlisis de decisiones, consiste en identificar un nmero finito de alternativas de decisin. A pesar de que el objetivo ltimo es determinar la cantidad a invertir, la decisin estratgica que usted tiene que tomar es el nivel de la inversin. La junta directiva divide las inversiones para nuevos programas en tres niveles generales, que despus se convierten en las alternativas de decisin: 1. Nivel inferior (L): ninguno de los actores tiene un reconocimiento sustantivo. 2. Nivel moderado (M): el actor principal tiene reconocimiento, pero no asi ninguno de los actores de apoyo. 3. Nivel (H): ms de uno de los actores tiene reconocimiento. Las implicaciones financieras de estas decisiones dependen del xito futuro, desconocido, de la serie. El siguiente paso es caracterizar aquellos estados futuros mediante la identificacin de un nmero finito de posibles resultados. En este caso, usted podra identificar las siguientes posibilidades: 1. Fracaso (F): menos del 10% de los espectadores ven el programa. 2. xito (S): entre 10% y 20% de los espectadores ven el programa. 3. Gran xito (G): ms de 20% de los espectadores ven el programa. Su trabajo consiste en evaluar cada alternativa de inversin sobre la base de las ganancias. La ganancia no solo esta basada en la decisin de inversin inicial, sino tambin en el xito resultante del programa. Para utilizar la tcnica del anlisis de decisiones, es necesario recoger los datos apropiados para cada pareja decisinresultado. Para el problema de Star Productions, esto se lleva a cabo mediante la numeracin de cada pareja y estimando la ganancia asociada. El sentido comn le dice que cuanto mas grande sea el nivel de compromiso (cualquiera que sea el monto de la inversin), mayor ser la cantidad que puede perder el estudio. Si usted decide invertir en el nivel alto y el espectculo es un fracaso, el estudio perder mucho. Esto es as porque un bajo nivel de espectadores redundara en un nivel mas bajo de entradas por publicidad de los patrocinadores y, al mismo tiempo, los costos de produccin, el salario de los actores y otros gastos todava tienen que hacerse. En el otro extremo, si usted decide invertir a un nivel bajo y el espectculo resulta ser un gran xito, esto permitir al estudio cobrar mayores tarifas por publicidad. En este caso, el estudio

puede esperar que le vaya muy bien debido a que la inversin inicial es baja y las entradas por publicidad sern altas. Usted utiliza su experiencia, informacin industrial y al departamento de contabilidad del estudio para determinar la probabilidad de ganancia que se tendr de cada pareja decisin-resultado. Tales estimaciones de ganancia aparecen en la tabla siguiente.Tabla de ganancias ($ millones) para el problema de decisiones de Star Productions RESULTADOS DECISIONESBaja (L) Moderada (M) Alta (H) FRACASO (F) -2 -5 -8 XITO (S) 5 10 6 GRAN XITO (G) 8 12 15

TOMA DE DECISIONESLa tabla de ganancias indica que si usted decide hacer una alta inversin inicial, el estudio podra obtener una ganancia de $ 15 millones si el espectculo sea un gran xito. Pero el estudio puede perder $ 8 millones si el programa resulta un fracaso. Al contrario, si usted decide hacer una inversin inicial baja, el estudio puede obtener una ganancia de solamente $ 8 millones si el programa es un gran xito. Sin embargo, solamente perder $ 2 millones si el espectculo es un fracaso. Qu decisin recomendara usted? La eleccin de la mejor alternativa de inversin (L, M o H) depende del criterio de la administracin de Star Productions. Diferentes criterios pueden conducir a diferentes decisiones.