Teoria da Decisao2 - mgeiscee.files.wordpress.com · 1 TEORIA DA DECISÃO Processos de Decisão Designa-se por processo de decisão aquele que requer um único ou diversos conjuntos

1

TTEEOORRIIAA DDAA DDEECCIISSÃÃOO PPrroocceessssooss ddee DDeecciissããoo Designa-se por processo de decisão aquele que requer um único ou diversos conjuntos de decisões para a sua composição. Cada decisão tem um ganho ou perda a ela associado, que é determinado por circunstâncias externas ao processo, factos que distingue estes processos daqueles em que o ganho ou a perda são intrínsecos ao próprio processo. O conjunto de circunstâncias possíveis, conhecidos como estados naturais, e uma distribuição de probabilidade que rege a ocorrência de cada estado, são supostos conhecidos. Tanto o conjunto de decisões possíveis, como o de estados naturais serão considerados finitos (tal suposição pode ser afrouxada numa abordagem mais sofisticada). Designaremos as decisões possíveis por mDDD ,...,, 21 .

Designaremos os estados naturais por nSSS ,...,, 21 .

O retorno associado à decisão iD e ao estado jS designa-se por ijg

( ).,...2,1;,...2,1 njmi == Um processo que necessita da implementação de uma única decisão é definido completamente por uma tabela como �

� 1S � 2S � ...� nS �

1D � 11g � 12g � �� ng1 �

2D � 21g � 22g � �� ng2 �� Dm � 1mg � 2mg � ...� mng �

�

Uma tabela deste tipo designa-se por matriz de ganho já que as entradas ijg

são expressas em termo de ganhos por decisão tomada (como é evidente, ganhos negativos são perdas). �Exemplo Uma grande companhia do sector energético oferece 60 000 euro ao proprietário de determinado terreno, pelos direitos de exploração do gás natural e opção para desenvolvimento futuro. A opção, se concretizada, equivale a um adicional de 600 000 euro para o proprietário, mas ocorrerá apenas se o gás natural for descoberto durante a fase de exploração. O proprietário, julgando

2

que o interesse da companhia é uma boa indicação de que o gás existe, está�disposto a desenvolver o empreendimento ele mesmo. Para isso, é necessário contratar especialistas em exploração e desenvolvimento. O custo inicial é de 100 000 euro, que serão perdidos se nenhum gás for descoberto. Se o gás for descoberto, entretanto, o proprietário estima um lucro de 2 000000 de euro. As decisões do proprietário são: �

1D -aceitar a oferta da companhia de energia,

2D -explorar e desenvolver ele próprio. Os estados naturais são:

1S -não existe gás na terra,

2S -existe gás na terra.

�Os ganhos em milhões de euro do proprietário para cada combinação de acontecimentos estão sintetizados na tabela seguinte: �

� 1S � 2S �

1D � 60 � 660 �

2D � 100− � 2000 ��

�6011 =g �

6006012 +=g �10021 −=g �

200022 =g ��Falta especificar ou estimar as probabilidades relativas aos dois estados naturais:� ( )1SP �� ( )2SP ��

��

3

��

CCrriittéérriioo ddee DDeecciissããoo SSiimmpplliiffiiccaaddoo �O critério minimax (ou pessimista) é utilizado para seleccionar a decisão que minimiza o máximo possível das perdas do analista de decisões. Em termos de matriz de ganhos, é a decisão que maximiza o possível ganho mínimo. O critério optimista é usado para escolher a decisão que maximiza o possível ganho. O critério mediano é utilizado para seleccionar a decisão na qual a média dos ganhos máximo e mínimo seja o maior possível. Como nenhum destes três critérios é baseado no estado natural provável, são considerados inferiores àqueles em que isso é contemplado. Assim, para o exemplo apresentado: �

- A matriz de ganhos está dada atrás. O ganho mínimo para a decisão 1D é 60 . Para a decisão 2D é 100− . Como

{ } 60100,60 =−máx , ganho associado a 1D é a decisão recomendada sob o critério minimax,

�

- As médias dos ganhos máximo e mínimo para 1D e 2D são, respectivamente,

�

3602

60600 =+��

( )950

21002000 =−+

��

Como { } 950950,360 =máx , ganho associado a 2D , 2D é a decisão tomada sob o critério mediano,

- A maior entrada da matriz de ganhos é 2 000, associada a 2D .

Portanto 2D é a decisão recomendada sob o critério optimista.

4

�Outro Exemplo �Determinar as decisões recomendadas sob cada critério simplificado para o seguinte processo de decisão. Um comprador de vestidos de uma loja de departamentos deve fazer as notas de encomenda ao fabricante 9 meses antes de os vestidos serem necessários. Uma decisão é quanto ao número de vestidos de comprimento médio a adquirir para stock. O ganho principal para a loja de departamentos depende desta decisão e também da moda 9 meses mais tarde. As estimativas dos ganhos (em milhares de euro) do comprador são dadas na tabela seguinte: �

�1S :

Comprimento Médio em Alta

Costura

2S : Comprimento

Médio Aceitável

3S : Comprimento

Médio Não Aceitável

1D : Nenhuma Encomenda

50− � 0 � 80 �

2D : Pequena Encomenda

10− � 30 � 35 �

3D : Encomenda Moderada

60 � 45� 30− �

4D : Lote Encomendado 80 � 40 � 45− ��Os ganhos mínimos associados a cada divisão são: �

� � 1D �� 50− ��

� � 2D �� 10− ��

3D �� 30− ��

4D �� 45− ��

5

��

�

{ } 1045,30,10,50 −=−−−−Máx Pelo que a decisão recomendada pelo

critério minimax é 2D . Os ganhos máximos associados a cada decisão são: �

1D ��80 ��

� � 2D ��35 ��

3D ��60 ��

4D ��80 ��

{ } 8080,60,35,80 =Máx Pelo que quer 1D quer 4D são decisões recomendadas pelo critério optimista. Os ganhos médios associados a cada decisão são: �

� � ,103

80050:1 =++−

D �

�

� � ,183

353010:2 =++−

D �

�

� � ,253

304560:3 =−+

D �

�

� � .253

454080:4 =−+

D �

�

�� { } 2525,25,18,10 =Máx � �� 3D � �� 4D � ��

��

6

��Por vezes, para este critério, faz-se apenas a média entre os valores máximo e mínimo. Assim �

� � 152

8050:1 =+−

D �

�

� � 5,122

3510:2 =+−

D �

�

� � 152

3060:3 =−

D �

�

� � 5,172

4580:4 =−

D �

Sendo agora a decisão recomendada pelo critério mediano 4D . �

CCrriittéérriioo ““AA PPrriioorrii”” �O critério “a priori “ (ou de Bayes) é utilizado para escolher a decisão que maximiza o ganho esperado. Exemplo Determine a decisão recomendada considerando o critério “a priori” para o problema do gás natural se o proprietário estimar a probabilidade de encontrar gás igual a 6,0 .

Como ( ) 6,02 =SP obviamente ( ) 4,06,011 =−=SP . Usando os dados da

tabela de ganhos vista atrás, temos que o ganho esperado para a decisão 1D é ��

7

��

[ ] 4206,06604,0601 =×+×=GE�

E o ganho esperado para decisão 2D é

�[ ] ( ) ( ) 11606,020004,01002 =+×−=GE ��

Podemos representar o processo pela árvore de decisão ��

��

�� 1S �

��

� �� 2S ��

�� 1D ��

�

�� !��!!��

�� 2D ��"�

� � ��!!�� 1S ��

��

� #��

�� 2S ��

��

��$��Em que 1160, maior ganho esperado, é transportado de D para B .

8

Como o maior dos ganhos esperados está relacionado com 2D , 2D é a decisão recomendada. ��Outro Exemplo Determinar a decisão recomendada sob o critério a priori para o processo de decisão do problema da loja de departamentos, se o comprador estimar que

( ) 25,01 =SP , ( ) 40,02 =SP , ( ) 35,03 =SP . Usando a tabela dada atrás os ganhos esperados para cada decisão são �

� � � 1D �

�

� � [ ] ( )( ) ( ) ( ) ,5,1535,08040,0025,0501 =++−=GE �

�

� � � 2D �

[ ] ( )( ) ( )( ) ( ) ,75,2135,03540,03025,0102 =++−=GE �

�

� 3D �

�

[ ] ( )( ) ( )( ) ( )( ) ,5,2235,03040,04525,0603 =−++=GE �

�

� 4D �

�

[ ] ( )( ) ( ) ( )( ) .5,2035,04540,04025,0804 =−++=GE ��

Como o maior destes ganhos esperados 22,5, está relacionado com 3D , 3D é a decisão recomendada sob o critério a priori. Este processo é representado pela árvore de decisão da figura seguinte:

9

�� %��

�� 1S �

��%��

��!%�%�� 2S ��"�

��

��&�� 3S �

��'%��$�� !��

�� 1D ��(��!�)%�� 1S ��'��

��%�� 2S �

��*��%�� 2D �� 3S ��'%�

��'%�

��+��,�� 3D ��

�� 4D ��%�� 1S ��-��%��

��%��&��#�� 2S ��%�

�� 1S ��.��/�

��%��

3S �� 2S ��'%�� 3S �� '��

��'%��0�� %��1��2��

10

��ÁÁrrvvoorreess ddee DDeecciissããoo �Já utilizámos aqui árvores de decisão para ilustrar processos de decisão. Vamos apresentar, então, de modo estruturado algumas noções sobre este instrumento de decisão. Assim, uma árvore de decisão é uma árvore orientada que representa um processo de decisão. Os nós representam pontos no tempo onde

- Uma ou outra decisão deve ser tomada pelo analista de decisões, ou

- O analista de decisões fica frente a um ou outro estado natural, ou

- O processo termina.

Saindo de um nó de decisão existe um ramo para cada possível decisão. Saindo de um nó relativo a estados naturais existe um ramo para cada estado natural. Sob cada ramo indica-se a probabilidade do acontecimento correspondente, sempre que definida. As árvores de decisão são utilizadas na determinação de soluções óptimas em processos complicadas. A técnica consiste em começar com os nós finais e, sequencialmente, retornar na rede calculando os ganhos operados nos nós intermediários. Cada ganho é escrito sob o seu nó correspondente. Uma decisão recomendada é aquela que leva a um ganho esperado máximo. As decisões que se tornam não recomendadas devem ter os seus ramos riscados. �

CCrriittéérriioo ““AA PPoosstteerriioorrii”” �Se uma experiência (experimentação) imperfeita for efectuada para se obter informação sobre o verdadeiro estado da natureza, então os dados dessa experiência poderão ser combinados com as probabilidades iniciais dos vários estados para gerar uma distribuição de probabilidade posterior. Designando o resultado da experiência por θ e supondo que a sua fiabilidade é dada por probabilidades condicionadas �

( )1SP θ �� ( )2SP θ ��3 �� ( )nSP θ ��

��

11

��

�As probabilidades posteriores (ou “a posteriori”) dos estados �

( )θ1SP �� ( )θ2SP ��3 �� ( )θnSP �

�São determinadas pelo Teorema de Bayes. O critério “a posteriori” é usado para seleccionar a decisão que maximiza o ganho esperado determinado com base na distribuição de probabilidade posterior. ��

TTeeoorreemmaa ddee BBaayyeess �

Considere-se um espaço amostral S constituído por todos os resultados possíveis de uma experiência conceptual (isto é: previsão do estado natural em determinado momento). Se Α e Β são dois acontecimentos de S, então a probabilidade condicionada de Α dado Β e a de Β dado Α são tais que �

( ) ( ) ( ) ( ) ( )ΑΑΒ=ΒΒΑ=ΒΑΡ PPPP� ��

�

em que ΒΑ � é a intersecção de Α e�Β�� ΒΑ� ��

� � � � � Α � � Β ��

12

�� Podemos assim obter �

( ) ( ) ( )( )Α

ΒΒΑ=ΑΒ

P

PPP �� ( ) 0>ΑP �

Ou �

( ) ( ) ( )( )Β

ΑΑΒ=ΑΒ

P

PPP �� ( ) 0>ΒP ��

�Que são, de um modo geral, o Teorema de Bayes. �45��6��

{ }sΗΗΗ ,...,, 21 �

Uma partição de S, isto é: �

� � � ≠Ηi ∅�� si ,...,2,1= �

�

� � � =ΗΗ ji � ∅�� ji ≠ �

�

� � � =ΗΗΗ s�� ...21 ��

0�� ( ) ( ) ( ) ( ) ( ) 1S...... 212 =Ρ=ΗΡ++ΗΡ+ΗΡ=ΗΗΗΡ ss��

0��7 �� 3=s ��

�

�

�

�

�

�

�

�

�

13

�

�

�

�

�

�

2Η �

�� 1Η ��

��

�� 3Η ��

� � � � ��

�

�

�� 6��8�6��6��

�

��

� � � � 1Η � � � +��2Η �

�

��

��3Η �

�

( ) ( ) ( ) ( )sPPP ΗΑ++ΗΑ+ΗΑ=ΑΡ �� ....21 �

�9:�� ;�;��<��

��

��

14

��

( ) ( ) ( ) ( ) ( ) ( ) ( ) =ΗΗΑ++ΗΗΑ+ΗΗΑ=ΑΕ ss PPPPPPP ..., 2211 �

�

( ) ( )j

s

jj PP ΗΗΑ=�

=1

��

�Podemos assim ter uma combinação do Teorema de Bayes com o Teorema da probabilidade total, que é conhecida também como Teorema de Bayes na forma �

( ) ( ) ( )( ) ( )

siPP

PPP

s

iii

iii ,...,2,1,

1

=ΗΗΑ

ΗΗΑ=ΑΗ�

=

��

�De uma forma evidente, embora pouco rigorosa, pode dizer-se que o teorema de Bayes permite trocar os papéis dos acontecimentos condicionado e condicionador. ��7 ��O proprietário do terreno onde se supõe poder existir gás natural, fez sondagens nesse terreno cujo custo importou em 30 000 euro. As sondagens indicaram que o gás não existe, mas o teste não é totalmente conclusivo. A companhia que realiza as sondagens garante que 30% das vezes o teste indica a inexistência de gás quando ele de facto existe. Quando o gás não existe, o teste é correcto 90% das vezes. Usando estes dados, após a estimativa inicial do proprietário de que a probabilidade de encontrar gás era de 0,6, determine, então, a decisão recomendada usando o critério a posteriori. �Inicialmente, �

( ) 4,01 =Ρ S e ( ) 6,02 =Ρ S . 45�� 1θ �� 7��=��6>��8��;��

��9?��?�<��;�;��

15

��

( ) 90,011 ==Ρ Sθ ��

�

�� ( ) 30,021 ==Ρ Sθ ��

�+�� :�� @��

( ) ( ) ( )( )

( ) ( )( ) ( ) ( ) ( ) =

ΡΡ+ΡΡΡΡ

=Ρ

ΡΡ=Ρ

222111

111

1

11111 SSSS

SSSSS

θθθ

θθ

θ �

��

32

6,03,04,09,04,09,0

54,036,0 ==

×+××= ��

�

( ) ( ) ( )( ) ( ) ( ) ( ) =

×+××=

ΡΡ+ΡΡΡΡ

=Ρ6,03,04,09,0

6,03,0

222111

22112 SSSS

SSS

θθθ

θ �

�

31

54,018,0 == �

Ou, de modo mais simples, �

( ) ( )31

32

11 1112 =−=Ρ−=Ρ θθ SS ��

�A matriz de ganhos “a posteriori” é agora �

� 1S � 2S �

1D � 30 � 630 �

2D � 130− � 1970 �

�*>��A>��;��'��9��B��6 <��

16

��

[ ] 23031

63032

3011 =+=Ε θG �

�

[ ] 57031

197032

13012 =+−=Ε θG �

�E, portanto, ��'��

��/�

�� 1S �� 32 �

��'��

��,�� 2S ��'��

�� 1D �� 31 ��1�

��%)�� %)��

��(�� 1θ ��*�

��!�� 2D �� !'��

��%)��.�� 1S �

��-�� 32 ��

�� 31 �� 2S �!C)��

��0��

17

��

Como o maior ganho esperado está associado a 2D , 2D é a decisão recomendada tendo em conta o critério “a posteriori”. A figura apresentada acima é a árvore da decisão do processo. A probabilidade de que as sondagens indiquem a inexistência de gás, ( )1θP , é 1(um) já que o resultado da experiência é conhecido. �

Outro Exemplo Resolver o problema anterior no caso de as sondagens terem indicado a presença de gás. Designe-se o acontecimento de que as sondagens indicaram a existência de gás por 2θ . Então, de acordo com os dados do problema anterior �

( ) ( ) 1,09,011 1112 =−=−=Ρ SPS θθ ��

( ) ( ) 7,03,011 2122 =−=−=Ρ SPS θθ ��

�Recorde-se que as probabilidades iniciais são ( ) 4,01 =SP e ( ) 6,02 =SP . Portanto, a distribuição posterior de probabilidade é:

( ) ( ) ( )( ) ( ) ( ) ( ) =

+=

222112

11221 SPSPSPSP

SPSPSP

θθθ

θ �

��

( )( )( )( ) ( )( ) 087,0

46,004,0

6,07,04,01,04,01,0 ==

+= ��

��

( ) ( ) ( )( ) ( ) ( ) ( ) =

+=

222112

22222 SPSPSPSP

SPSPSP

θθθ

θ �

��

( )( )( )( ) ( )( ) 913,0

46,042,0

6,07,04,01,06,07,0 ==

+= �

��

18

��

�.��

( ) ( ) 913,0087,011 2122 =−=−= θθ SPSP ��

�Também neste caso cada entrada da matriz de ganhos original deve ser reduzida de 30 000 euro para reflectir o custo do teste. Então os ganhos esperados (em milhares de euro) para as decisões 1D e 2D em relação à distribuição de probabilidade deduzida são �

[ ] ( )( ) ( )( ) 8,577913,0630087,03021 =+=Ε θG ��

�

[ ] ( )( ) ( )( ) 3,1787913,01970087,013022 =+−=Ε θG ��

�

Como o maior ganho esperado é o associado a 2D , 2D é a decisão recomendada na situação do critério “a posteriori”. Na figura seguinte apresenta-se a árvore da decisão para este processo. A probabilidade de que as sondagens indiquem a presença de gás, ( )2θP , é unitária, já que o resultado da experiência é conhecido. ��'��

��:�� 1S �

��%))�&��&)��

�� 1D ��D�� 2S ��'��!)&)�'��!)&)�'��C!'��

��(�� 2θ ��E��2��!�� 2D ��

��!)&)�'�

��4�� 1S �� !'��

��&)�� 2S �

��C!'��!C)��

��F��

19

��Ainda outro exemplo �Qual a decisão recomendada se as sondagens discutidas nos exemplos (2 exemplos) dados atrás não tivessem sido realizadas, mas somente consideradas? �� 6�� >6�� 0�� >�� ?�� G�� 6�� 8�� A��6��45��

� � � ID ��G��6��

�

� � � IID ��G��6��

�

� � � 1θ �� H��6�� B��6>�I��

�

� 2θ �� H�� 6�� B��

6>�I��

�A principal diferença está em que nem ( )1θP nem ( )2θP são iguais a 1, visto

que o resultado das sondagens é desconhecido. Mas, como { }21, SS constitui uma partição do espaço de probabilidades, tendo em conta os dados dos dois exemplos anteriores �

( ) ( ) ( ) ( ) ( ) ( )( ) ( )( ) 54,06,03,04,090,02211111 =+=+= SPSPSPSPP θθθ ��

�e

�

( ) ( ) ( ) ( ) ( ) ( )( ) ( )( ) .46,06,07,04,010,02221122 =+=+= SPSPSPSPP θθθ Assim o ganho esperado no nó I é �

( )( ) ( )( ) 113046,03,178754,0570 =+ �

Vindo a árvore para este processo: ��

20

�� 1S ��

��!!�� 1D �� 2S ��

��

�� 2D ��!!�� 1S � "�� !��

� ID � #��!!�� 2S ��

�� $�+��%)��'��'�� 1D �� 1S ��/�

�� IID ��*� ,�� 32 �

�� 2S �

�� 1θ �� 2D �� 31 ��'��

��%��%)�� !'��1�

��(��-�� 1S ��.�

��!!'�� 32 �

�

�� 2θ �� 31 �� 2S ��!C)��

�� 0��'��:�� %))�&�� 1S �

��!)&)�'��&)�

� �� 1D � D��

��2��C!'�� 2S ��'��

��E��!)&)�'�� !'�� 1S �

� ��4��&)��C!'�� 2S �

��!C)��

��F��

21

��

Como o nó B tem um ganho esperado maior que o nó I, ID é recomendada

em vez de IID . Assim, as decisões recomendadas, entretanto, são para não realizar as sondagens e não aceitar a oferta da companhia energética. Pelo contrário o proprietário deve começar a explorar a terra ele mesmo imediatamente. Note-se que a decisão de ID é indiferente à realização de sondagens e aos seus resultados caso tenham sido realizadas. Assim, as sondagens não têm nenhum efeito na decisão final e representam apenas uma despesa. Note-se, aliás, que a diferença entre os valores esperados nos nós B e I ( )3011301160 =− é precisamente o valor do custo do teste. �Mais um Exemplo �Uma cidade pretende efectuar, ela própria, a troca da frota municipal de automóveis a gasolina por carros eléctricos. O fabricante de carros eléctricos afirma que a cidade, com o tempo, terá um lucro de 1 000000 euro se realizar a conversão. Mas a cidade tem as suas dúvidas. Se o fabricante não estiver correcto a conversão poderá custar à cidade 450 000 euro. Uma terceira possibilidade é que nenhuma dessas situações venha a ocorrer e a cidade não perca nem ganhe com a conversão. De acordo com um levantamento de dados realizado, as respectivas probabilidades desses três acontecimentos são 25,0 , 45,0 e 30,0 . A cidade considera então a possibilidade de realizar um programa piloto que, se implementado, indicaria o custo potencial ou economia na conversão para carros eléctricos. O programa envolve o aluguer de três carros eléctricos por três meses e utilizados sob condições normais. O custo para a cidade deste programa piloto seria de 50 000 euro. O consultor da cidade acredita que os resultados do programa piloto seriam significativos, mas não conclusivos; assim apresentou na tabela seguinte uma compilação de probabilidades baseada na experiência de outras cidades, para ilustrar a sua afirmação. Que decisões deveria a cidade tomar se ela quisesse maximizar a economia esperada?

22

�

Programa Piloto Economia Inalterado Perda Economia

6,0

3,0

1,0

Estabilidade

4,0

4,0

2,0

C O N V E R S Ã O

Perda

1,0

5,0

4,0

�Este é um processo de dois estágios. Primeiro a cidade deve decidir se vai realizar o programa piloto e então decidir se converte a sua frota para carros eléctricos. Seja

- ID : decisão de não realizar o programa piloto, - IID : decisão de realizar o programa piloto,

- 1θ : acontecimento “o programa piloto indicam a economia”,

- 2θ : acontecimento “o programa piloto não indica economia nem perda”,

- 3θ : acontecimento “o programa piloto indica perda”, - 1D : decisão de converter para carros eléctricos, - 2D : decisão de não converter para carros eléctricos,

- 1S : estabelece que os carros eléctricos são mais baratos para operar que os modelos a gasolina,

- 2S : estabelece que os carros eléctricos custam o mesmo para

operar que os modelos a gasolina,

23

- 3S : estabelece que os carros eléctricos são mais caros para

operar que os modelos a gasolina. A matriz de ganhos (em milhares de euro) é �

� 1S � 2S � 3S �

1D � 1000 � 0 � 450− �

2D � 0 � 0 � 0 �

A distribuição inicial de probabilidades é �

( ) ( ) 30,0;25,0 21 == SPSP �� ( ) 45,03 =SP ��

�Se o programa piloto não for realizado a distribuição inicial de probabilidades não é reconvertida para distribuição “a posteriori” e os ganhos esperados para

1D e 2D são, respectivamente �

[ ] ( )( ) ( )( ) ( )( ) 5,4745,045030,0025,01001 =−++=Ε G �

[ ] ( )( ) ( ) ( ) 045,0030,0025,002 =++=Ε G ��

�

Como o ganho esperado máximo está associado a 1D , 1D é a decisão recomendada sob o critério “a priori”. Se o programa piloto for realizado, todas as entradas da matriz de ganhos devem ser reduzidos em 50 , custo do teste: �

� 1S � 2S � 3S �

1D � 950 � 50− � 500− �

2D � 50− � 50− � 50− �

�E, face à tabela apresentada pelo consultor,

( ) 6,011 =SP θ ( ) 4,021 =SP θ ( ) 1,031 =SP θ

( ) 3,012 =SP θ ( ) 4,022 =SP θ ( ) 5,0321 =SP θ

( ) 1,013 =SP θ ( ) 2,023 =SP θ ( ) 4,033 =SP θ

24

Então, recorrendo ao teorema de Bayes: �

( ) ( ) ( )( ) ( ) ( ) ( ) ( ) ( ) =

++=

331221111

11111 SPSPSPSPSPSP

SPSPSP

θθθθ

θ �

��

( )( )( )( ) ( )( ) ( )( ) 4762,0

45,01,030,04,025,06,025,06,0 =

++= �

��

( ) ( ) ( )( ) ( )

( )( )( )( ) ( )( ) ( )( ) =

++==

�=

45,01,030,04,025,06,030,040,0

3

11

22112

iii SPSP

SPSPSP

θ

θθ �

�

3810,0= �

�

( ) ( ) ( )( ) ( )

( )( )( )( ) ( )( ) ( )( ) =

++==

�=

45,01,030,04,025,06,045,01,0

3

11

33113

iii SPSP

SPSPSP

θ

θθ �

�

,1428,0= �� ( )11428,03810,04762,0 =++ �

�

( ) ( )( )( )( ) ( )( ) ( )( ) ,1786,0

45,05,03,04,025,03,025,03,0

21 =++

=θSP �

��

( ) ( )( )( )( ) ( )( ) ( )( ) ,2857,0

45,05,03,04,025,03,03,04,0

22 =++

=θSP �

��

( ) ( )( )( )( ) ( )( ) ( )( ) ,5357,0

45,05,03,04,025,03,045,05,0

23 =++

=θSP �

��

( ),15357,02857,01786,0 =++ �

��

25

( ) ( )( )( )( ) ( )( ) ( )( ) ,0943,0

45,04,03,02,025,01,025,01,0

31 =++

=θSP �

��

( ) ( )( )( )( ) ( )( ) ( )( ) ,2265,0

45,04,03,02,025,01,03,02,0

32 =++

=θSP �

��

( ) ( )( )( )( ) ( )( ) ( )( ) ,6792,0

45,04,03,02,025,01,045,04,0

33 =++

=θSP �

��

( ).16792,02265,00943,0 =++ �

�

Se o resultado do programa piloto é 1θ , as probabilidades posteriores são

dadas por ( )1θiSP , 3,2,1=i e os ganhos esperados para as decisões 1D e

2D , respectivamente por

[ ] ( )( ) ( )( ) ( )( ) 9,3611428,05003810,0504762,095011 =−+−+=Ε θG e

[ ] ( )( ) ( )( ) ( )( ) .501428,0503810,0504762,05012 −=−+−+−=Ε θG A decisão recomendada sob o critério “ a posteriori” é 1D .




[ ] ( )( ) ( )( ) ( )( ) 5,1125357,05002857,0501786,095021 −=−+−+=Ε θG e

[ ] 5021 −=Ε θG .

A decisão recomendada sob o critério “a posteriori” é 2D .

26




[ ] ( )( ) ( )( ) ( )( ) 3,2616792,05002265,0500943,095031 −=−+−+=Ε θG e

[ ] 5032 −=Ε θG . A decisão recomendada sob o critério “a posteriori” é 2D . A árvore de decisão para este processo, que mostramos a seguir ��!��

��)�%�� 1S �

��%��

�� 2S �

�� 1D �� 3S ��'��

��%�� %��)�%��

�� 2D �� 1S ��%�

�� 2S ��

�� ID ��'��

�� 3S ��

27

)C�)%��%��C%��

��+�� 1S �

��)�� %��

��'�!�C�� 2S �

��'&)�� %��

��'�!�C�� 1D ��!��C�� 3S �

�� %��

�� 2D �� %�� 1S �

�� IID ��)��

�� 2S �� %��'&!��

�� 1θ ��!��&�� 3S �

��'!%�� %��C%��

�� !!��%� 1S ��!)&�� %��

�� 2S ��

�� 3S ��&%)��

)C�)%�� %�� 1D ��%'%)�� %��

�� 2θ �� %��

�� 2D � %��

�� 1S ��!)&�� %��

�� 2S ��&%)�

��%'%)�� 3S �� %��

��C%��

�� 1S ��%��C�'�� !�'�� %��

�� 2S ��%�

�� 1D ��)C�� 3S �� %��

�

"��

�� 2D �� %��

�� %��C�'�

28

�� 1S �

�� 2S �

��%�� %��

��)C�� 3S �

�� %�� Tem a particularidade de os resultados obtidos aparecerem nos nós sem letra e nos ramos que a eles chegam ou deles partem. Os ganhos esperados nos nós B, E, F e G são os ganhos relativos aos nós subsequentes, se as decisões recomendadas tiverem sido tomadas. Pelo Teorema da probabilidade total:

( ) ( ) ( ) ( ) ( ) ( ) ( ) =++= 3312211111 SPSPSPSPSPSPP θθθθ �

�

( )( ) ( )( ) ( )( ) ,315,045,01,03,04,025,06,0 =++= �

��


�

( )( ) ( )( ) ( )( ) ,420,045,05,03,04,025,03,0 =++= �

��


��

( )( ) ( )( ) ( )( ) 265,045,04,03,02,025,01,0 =++= ��

Então o ganho esperado no nó C é �

( )( ) ( )( ) ( )( ) 75,79265,050420,050315,09,361 =−+−+ ��

�Como este valor é maior que o ganho esperado no nó B, o ramo de decisão para o nó C, designado por IID , é o recomendado. A cidade deve realizar o programa piloto e então converter para veículos movidos a electricidade apenas se ele indicar economia.

29

�EE��A utilidade de um componente de pagamento é o seu valor numérico para um analista de decisões. Quando nenhum critério de decisão é aplicável, a menos que os componentes de pagamento sejam quantificados na mesma unidade, o primeiro passo na análise de qualquer processo de decisão é determinar a utilidade de todos os componentes do pagamento não numéricos. Uma utilidade comum é a correspondência monetária, onde cada componente de pagamento é substituído na matriz de ganhos pelo seu valor em euro. A correspondência monetária, entretanto, não é sempre apropriada. Um componente de 2 000000 de euro é o dobro de um de 1 000000, mas o primeiro pode não corresponder ao dobro do último para um realizador de decisões. O primeiro milhão pode ser mais valioso que o segundo. Nos casos em que os euros não reflectem a correspondência verdadeira de um componente de pagamentos em relação a outro, ou em que os euros não são a unidade de quantificação adequada, devem usar-se outras unidades. �

LLoottaarriiaa �Uma lotaria L );,( PBA é um acontecimento aleatório que tem dois resultados, Α e Β , ocorridos com probabilidades p e p−1 respectivamente. ��EE��11 ��O procedimento, indicado a seguir, de quatro etapas é utilizado para determinar as utilidades de Von Neumann para uma tabela com um número finito de componentes. � Etapa 1

Enumerar os componentes de pagamento por ordem decrescente de conveniência:

,,...,, 21 peee sendo ie mais conveniente que je se ji < ,

30

� �

Etapa 2 Arbitrariamente atribuir valores numéricos finitos ( )1eu e ( )peu aos

componentes 1e e pe , respectivamente, de modo que ( )1eu > ( )peu ,

Etapa 3 Para cada componente je , convenientemente localizado entre 1e e pe ,

determinar uma probabilidade equivalente jp , supondo que para o

analista de decisões é indiferente obter je com certeza ou participar na

lotaria L ( )jp pee ;,1 ,

Etapa 4 Fazer ( ) ( ) ( ) ( )pjjj eupeupeu −+= 11 sendo ( )jeu a utilidade do

componente de pagamento je .

A Etapa 3 é, como é evidente, extremamente subjectiva. O valor de jp para

cada componente ( )1,...,3,2 −= pje j é uma determinação individual que pode variar drasticamente de uma pessoa para a outra ou até para uma mesma pessoa em duas épocas diferentes. As utilidades resultantes, entretanto, quantificam as correspondências relativas dos componentes de pagamento para um determinado analista de decisões num certo momento. Entretanto, para uma racionalidade individual, será sempre esperado que a ordem dos sp' , e portanto dos su' sejam as mesmas dos se' . Uma utilidade é normalizada se ( ) 11 =eu e ( ) 0=peu , tornando as utilidades

idênticas às probabilidades equivalentes.

31

Exemplo Imagine uma situação na qual os ganhos listados na tabela do exemplo do gás natural, que aqui reproduzimos:

1S 2S

1D 60 660

2D 100− 2000 Não correspondem aos componentes de pagamento relativos ao proprietário. Mostre que a função de utilidade de Von Neumann pode ser usada para corrigir essa situação. Os componentes de pagamento por ordem decrescente de preferência são:

20001 =e 6602 =e 603 =e 1004 −=e . Se 100 (100 000 euro) representa as economias de toda a vida do proprietário, então perdê-las seria catastrófico. Considerando que tal perda não pode ser mais importante para o proprietário que ganhar 2000 (2000 000), ainda assim esta preferência não é reflectida nos valores em euro dos componentes de pagamento. Além disso 660 pode ser dinheiro suficiente para satisfazer todos os desejos do proprietário. O valor 2000 é obviamente melhor; mas pode não significar três vezes mais valioso, em números redondos, como sugerido apenas pelos números. O proprietário pode, por exemplo, estabelecer a utilidade de 1e em 1000 e a

de 4e em 1000− para reflectir o temor da perda das economias de toda a sua

vida. Depois de muito reflectir, ele pode concluir ser indiferente receber 2e com certeza ou participar na lotaria L ( )999,0;, 41 ee . Então a utilidade de 2e deveria ser

( ) ( ) ( ) ( ) ( )( ) 9981000001,01000999,0999,01999,0 412 =−+×=−+= eueueu .

32

O proprietário pode também concluir que é indiferente receber 3e com certeza

ou participar na lotaria L ( )95,0;, 41 ee . Então a utilidade de 3e deve ser

( ) ( ) ( ) ( ) ( ) 900100005,0100095,095,0195,0 413 =−×+×=−+= eueueu .

A matriz dos ganhos para o processo de decisão, em termos de utilidades é assim

1S 2S

1D 950 998

2D 1000− 1000 ��Outro Exemplo Determine a decisão recomendada pelo critério a priori para o caso de o proprietário do exemplo anterior, se a matriz dos ganhos é a tabela de utilidades dada acima, estimando ele que a probabilidade de haver gás é de

6,0 . Como ( ) 4,01 =Ρ S e ( ) 6,02 =Ρ S os ganhos esperados para 1D e 2D são, respectivamente,

[ ] 8,9876,09984,09501 =×+×=Ε G e

[ ] ( )( ) ( )( ) 2006,010004,010002 =+−=Ε G

Sendo a decisão recomendada 1D .

Documents

Teoria da Decisao2 - mgeiscee.files.wordpress.com · 1 TEORIA DA DECISÃO Processos de Decisão Designa-se por processo de decisão aquele que requer um único ou diversos conjuntos