Upload
dothu
View
222
Download
1
Embed Size (px)
Citation preview
1
TTEEOORRIIAA DDAA DDEECCIISSÃÃOO PPrroocceessssooss ddee DDeecciissããoo Designa-se por processo de decisão aquele que requer um único ou diversos conjuntos de decisões para a sua composição. Cada decisão tem um ganho ou perda a ela associado, que é determinado por circunstâncias externas ao processo, factos que distingue estes processos daqueles em que o ganho ou a perda são intrínsecos ao próprio processo. O conjunto de circunstâncias possíveis, conhecidos como estados naturais, e uma distribuição de probabilidade que rege a ocorrência de cada estado, são supostos conhecidos. Tanto o conjunto de decisões possíveis, como o de estados naturais serão considerados finitos (tal suposição pode ser afrouxada numa abordagem mais sofisticada). Designaremos as decisões possíveis por mDDD ,...,, 21 .
Designaremos os estados naturais por nSSS ,...,, 21 .
O retorno associado à decisão iD e ao estado jS designa-se por ijg
( ).,...2,1;,...2,1 njmi == Um processo que necessita da implementação de uma única decisão é definido completamente por uma tabela como �
� 1S � 2S � ...� nS �
1D � 11g � 12g � ���� ng1 �
2D � 21g � 22g � ���� ng2 ����� ���� ����� ���� ����Dm � 1mg � 2mg � ...� mng �
�
Uma tabela deste tipo designa-se por matriz de ganho já que as entradas ijg
são expressas em termo de ganhos por decisão tomada (como é evidente, ganhos negativos são perdas). �Exemplo Uma grande companhia do sector energético oferece 60 000 euro ao proprietário de determinado terreno, pelos direitos de exploração do gás natural e opção para desenvolvimento futuro. A opção, se concretizada, equivale a um adicional de 600 000 euro para o proprietário, mas ocorrerá apenas se o gás natural for descoberto durante a fase de exploração. O proprietário, julgando
2
que o interesse da companhia é uma boa indicação de que o gás existe, está�disposto a desenvolver o empreendimento ele mesmo. Para isso, é necessário contratar especialistas em exploração e desenvolvimento. O custo inicial é de 100 000 euro, que serão perdidos se nenhum gás for descoberto. Se o gás for descoberto, entretanto, o proprietário estima um lucro de 2 000000 de euro. As decisões do proprietário são: �
1D -aceitar a oferta da companhia de energia,
2D -explorar e desenvolver ele próprio. Os estados naturais são:
1S -não existe gás na terra,
2S -existe gás na terra.
�Os ganhos em milhões de euro do proprietário para cada combinação de acontecimentos estão sintetizados na tabela seguinte: �
� 1S � 2S �
1D � 60 � 660 �
2D � 100− � 2000 �����������
�6011 =g �
6006012 +=g �10021 −=g �
200022 =g ��Falta especificar ou estimar as probabilidades relativas aos dois estados naturais:� ( )1SP �� ( )2SP ��
�����
3
����
CCrriittéérriioo ddee DDeecciissããoo SSiimmpplliiffiiccaaddoo �O critério minimax (ou pessimista) é utilizado para seleccionar a decisão que minimiza o máximo possível das perdas do analista de decisões. Em termos de matriz de ganhos, é a decisão que maximiza o possível ganho mínimo. O critério optimista é usado para escolher a decisão que maximiza o possível ganho. O critério mediano é utilizado para seleccionar a decisão na qual a média dos ganhos máximo e mínimo seja o maior possível. Como nenhum destes três critérios é baseado no estado natural provável, são considerados inferiores àqueles em que isso é contemplado. Assim, para o exemplo apresentado: �
- A matriz de ganhos está dada atrás. O ganho mínimo para a decisão 1D é 60 . Para a decisão 2D é 100− . Como
{ } 60100,60 =−máx , ganho associado a 1D é a decisão recomendada sob o critério minimax,
�
- As médias dos ganhos máximo e mínimo para 1D e 2D são, respectivamente,
�
3602
60600 =+��
( )950
21002000 =−+
��
Como { } 950950,360 =máx , ganho associado a 2D , 2D é a decisão tomada sob o critério mediano,
- A maior entrada da matriz de ganhos é 2 000, associada a 2D .
Portanto 2D é a decisão recomendada sob o critério optimista.
4
�Outro Exemplo �Determinar as decisões recomendadas sob cada critério simplificado para o seguinte processo de decisão. Um comprador de vestidos de uma loja de departamentos deve fazer as notas de encomenda ao fabricante 9 meses antes de os vestidos serem necessários. Uma decisão é quanto ao número de vestidos de comprimento médio a adquirir para stock. O ganho principal para a loja de departamentos depende desta decisão e também da moda 9 meses mais tarde. As estimativas dos ganhos (em milhares de euro) do comprador são dadas na tabela seguinte: �
�1S :
Comprimento Médio em Alta
Costura
2S : Comprimento
Médio Aceitável
3S : Comprimento
Médio Não Aceitável
1D : Nenhuma Encomenda
50− � 0 � 80 �
2D : Pequena Encomenda
10− � 30 � 35 �
3D : Encomenda Moderada
60 � 45� 30− �
4D : Lote Encomendado 80 � 40 � 45− ���Os ganhos mínimos associados a cada divisão são: �
� � 1D ��� 50− ��
� � 2D ��� 10− ��
3D �� 30− ��
4D �� 45− �����
5
����
�
{ } 1045,30,10,50 −=−−−−Máx Pelo que a decisão recomendada pelo
critério minimax é 2D . Os ganhos máximos associados a cada decisão são: �
1D ���80 ��
� � 2D ��35 ��
3D ��60 ��
4D ��80 ��
{ } 8080,60,35,80 =Máx Pelo que quer 1D quer 4D são decisões recomendadas pelo critério optimista. Os ganhos médios associados a cada decisão são: �
� � ,103
80050:1 =++−
D �
�
� � ,183
353010:2 =++−
D �
�
� � ,253
304560:3 =−+
D �
�
� � .253
454080:4 =−+
D �
�
�� �� { } 2525,25,18,10 =Máx � ��� 3D � ��� 4D � ���� �������
��� �������������������� ��������������
6
�������Por vezes, para este critério, faz-se apenas a média entre os valores máximo e mínimo. Assim �
� � 152
8050:1 =+−
D �
�
� � 5,122
3510:2 =+−
D �
�
� � 152
3060:3 =−
D �
�
� � 5,172
4580:4 =−
D �
Sendo agora a decisão recomendada pelo critério mediano 4D . �
CCrriittéérriioo ““AA PPrriioorrii”” �O critério “a priori “ (ou de Bayes) é utilizado para escolher a decisão que maximiza o ganho esperado. Exemplo Determine a decisão recomendada considerando o critério “a priori” para o problema do gás natural se o proprietário estimar a probabilidade de encontrar gás igual a 6,0 .
Como ( ) 6,02 =SP obviamente ( ) 4,06,011 =−=SP . Usando os dados da
tabela de ganhos vista atrás, temos que o ganho esperado para a decisão 1D é ���������
7
��������
[ ] 4206,06604,0601 =×+×=GE�
E o ganho esperado para decisão 2D é
�[ ] ( ) ( ) 11606,020004,01002 =+×−=GE ��
Podemos representar o processo pela árvore de decisão �� � � � � ������������������������������������������������������������������
�����������������������������������������������������������������
������������������������������������ 1S �
�������������������������������������������������������������� �������������������������������
� �������������� 2S ��������
��� 1D ������������������������������������������������������
�
������������������������������������������������������������ !���!!����������������������������������������������������������������������������
����� 2D �����������������������������������������������"�
� � ������!!����� 1S ����������
��
� #���������������������������������������������������������
������������������������������������������ 2S ������������
�����������������������������������������
��������������������������������������������������������$������������������������������������������������Em que 1160, maior ganho esperado, é transportado de D para B .
8
Como o maior dos ganhos esperados está relacionado com 2D , 2D é a decisão recomendada. ��Outro Exemplo Determinar a decisão recomendada sob o critério a priori para o processo de decisão do problema da loja de departamentos, se o comprador estimar que
( ) 25,01 =SP , ( ) 40,02 =SP , ( ) 35,03 =SP . Usando a tabela dada atrás os ganhos esperados para cada decisão são �
� � � 1D �
�
� � [ ] ( )( ) ( ) ( ) ,5,1535,08040,0025,0501 =++−=GE �
�
� � � 2D �
[ ] ( )( ) ( )( ) ( ) ,75,2135,03540,03025,0102 =++−=GE �
�
� 3D �
�
[ ] ( )( ) ( )( ) ( )( ) ,5,2235,03040,04525,0603 =−++=GE �
�
� 4D �
�
[ ] ( )( ) ( ) ( )( ) .5,2035,04540,04025,0804 =−++=GE ��
Como o maior destes ganhos esperados 22,5, está relacionado com 3D , 3D é a decisão recomendada sob o critério a priori. Este processo é representado pela árvore de decisão da figura seguinte:
9
�������������������������������������������������������������������������������������� %��
���������������������������������������������������������������������������������������������������������������������������������������������������������� 1S �
�����������������������������������������������������������������������������%���������������������������������������������������������������������������������������������
����������������������������������������������!%�%������������������ 2S �������������"�
�����������������������������������������������������������������������������
����������������������������������������������������������������������������������&����������������������������������������������������������������������������� 3S �
�������������������������������������������������������������������������'%�����������$������������������������������������������������������������������������������ !���
������������������ 1D ���������������������������������������������������������(����������������������������������������������!�)%�������� 1S ���������������������'��
�������������������������������������������������������������%�������� 2S �
�����������������������������������������������������������������������������*������%���������� 2D ������������������������������������������������ 3S ��������'%�
��������������������������������������������������������������������'%�
���+������������������������������������������������������������������,���������������������������� 3D ��������������������������������������������������
����� 4D ������������������������������������%������������������� 1S ��������-��������������������������������������������������������������������������%��
�������%����������&����������������������#������������� 2S ��������������%�
�������� 1S ��������.����������������������������������������������������/�
�����������%�����������
3S ����������� 2S �����������������������������������'%��� 3S ���� '��
���'%���������������������0�������������� �%����������������������������������������������������������1�������2�������������������������������������������
10
������������������������ÁÁrrvvoorreess ddee DDeecciissããoo �Já utilizámos aqui árvores de decisão para ilustrar processos de decisão. Vamos apresentar, então, de modo estruturado algumas noções sobre este instrumento de decisão. Assim, uma árvore de decisão é uma árvore orientada que representa um processo de decisão. Os nós representam pontos no tempo onde
- Uma ou outra decisão deve ser tomada pelo analista de decisões, ou
- O analista de decisões fica frente a um ou outro estado natural, ou
- O processo termina.
Saindo de um nó de decisão existe um ramo para cada possível decisão. Saindo de um nó relativo a estados naturais existe um ramo para cada estado natural. Sob cada ramo indica-se a probabilidade do acontecimento correspondente, sempre que definida. As árvores de decisão são utilizadas na determinação de soluções óptimas em processos complicadas. A técnica consiste em começar com os nós finais e, sequencialmente, retornar na rede calculando os ganhos operados nos nós intermediários. Cada ganho é escrito sob o seu nó correspondente. Uma decisão recomendada é aquela que leva a um ganho esperado máximo. As decisões que se tornam não recomendadas devem ter os seus ramos riscados. �
CCrriittéérriioo ““AA PPoosstteerriioorrii”” �Se uma experiência (experimentação) imperfeita for efectuada para se obter informação sobre o verdadeiro estado da natureza, então os dados dessa experiência poderão ser combinados com as probabilidades iniciais dos vários estados para gerar uma distribuição de probabilidade posterior. Designando o resultado da experiência por θ e supondo que a sua fiabilidade é dada por probabilidades condicionadas �
( )1SP θ �� ( )2SP θ ��3 �� ( )nSP θ ��
�����
11
���
�As probabilidades posteriores (ou “a posteriori”) dos estados �
( )θ1SP �� ( )θ2SP ��3 �� ( )θnSP �
�São determinadas pelo Teorema de Bayes. O critério “a posteriori” é usado para seleccionar a decisão que maximiza o ganho esperado determinado com base na distribuição de probabilidade posterior. ��
TTeeoorreemmaa ddee BBaayyeess �
Considere-se um espaço amostral S constituído por todos os resultados possíveis de uma experiência conceptual (isto é: previsão do estado natural em determinado momento). Se Α e Β são dois acontecimentos de S, então a probabilidade condicionada de Α dado Β e a de Β dado Α são tais que �
( ) ( ) ( ) ( ) ( )ΑΑΒ=ΒΒΑ=ΒΑΡ PPPP� ��
�
em que ΒΑ � é a intersecção de Α e�Β��� � � � � � ΒΑ� �������������
� � � � � Α � � Β ����������
12
����� Podemos assim obter �
( ) ( ) ( )( )Α
ΒΒΑ=ΑΒ
P
PPP ���� ( ) 0>ΑP �
Ou �
( ) ( ) ( )( )Β
ΑΑΒ=ΑΒ
P
PPP ����� ( ) 0>ΒP ��
�Que são, de um modo geral, o Teorema de Bayes. �45���6�����
{ }sΗΗΗ ,...,, 21 �
Uma partição de S, isto é: �
� � � ≠Ηi ∅��� si ,...,2,1= �
�
� � � =ΗΗ ji � ∅��� ji ≠ �
�
� � � =ΗΗΗ s��� ...21 �������
0��������� ( ) ( ) ( ) ( ) ( ) 1S...... 212 =Ρ=ΗΡ++ΗΡ+ΗΡ=ΗΗΗΡ ss��� ��
0���7 ������� � 3=s �������� ��
�
�
�
�
�
�
�
�
�
13
�
�
�
�
�
�
2Η �
������������������������������������������ 1Η �������������
��������������������������������������������
������������������������������������� 3Η ������������������������������������������������������������������������������������������������������������������������������������������������������������� � �
� � � � ������������������
�
�
����� ���6����8�6����6���
�
�������������������������������������������������������������������������������� � � � �
� � � � 1Η � � � +�������������������������������������������������2Η �
�
���������������������������������������������������������������������������������
�����������������������������������������������������������3Η �
�
( ) ( ) ( ) ( )sPPP ΗΑ++ΗΑ+ΗΑ=ΑΡ ��� ....21 �
�9:�� ��������;�;������������<��
������
���
14
�������
( ) ( ) ( ) ( ) ( ) ( ) ( ) =ΗΗΑ++ΗΗΑ+ΗΗΑ=ΑΕ ss PPPPPPP ..., 2211 �
�
( ) ( )j
s
jj PP ΗΗΑ=�
=1
��
�Podemos assim ter uma combinação do Teorema de Bayes com o Teorema da probabilidade total, que é conhecida também como Teorema de Bayes na forma �
( ) ( ) ( )( ) ( )
siPP
PPP
s
iii
iii ,...,2,1,
1
=ΗΗΑ
ΗΗΑ=ΑΗ�
=
��
�De uma forma evidente, embora pouco rigorosa, pode dizer-se que o teorema de Bayes permite trocar os papéis dos acontecimentos condicionado e condicionador. ��7 �����O proprietário do terreno onde se supõe poder existir gás natural, fez sondagens nesse terreno cujo custo importou em 30 000 euro. As sondagens indicaram que o gás não existe, mas o teste não é totalmente conclusivo. A companhia que realiza as sondagens garante que 30% das vezes o teste indica a inexistência de gás quando ele de facto existe. Quando o gás não existe, o teste é correcto 90% das vezes. Usando estes dados, após a estimativa inicial do proprietário de que a probabilidade de encontrar gás era de 0,6, determine, então, a decisão recomendada usando o critério a posteriori. �Inicialmente, �
( ) 4,01 =Ρ S e ( ) 6,02 =Ρ S . 45�� 1θ ���������� �����������������7���=�������6>�����������8��;�������
�������9?�����������?�<����������������;�;���������������������������
15
������
( ) 90,011 ==Ρ Sθ ��
�
��� ( ) 30,021 ==Ρ Sθ ��
�+��� ������:�� ������@���
( ) ( ) ( )( )
( ) ( )( ) ( ) ( ) ( ) =
ΡΡ+ΡΡΡΡ
=Ρ
ΡΡ=Ρ
222111
111
1
11111 SSSS
SSSSS
θθθ
θθ
θ �
��
32
6,03,04,09,04,09,0
54,036,0 ==
×+××= ����
�
( ) ( ) ( )( ) ( ) ( ) ( ) =
×+××=
ΡΡ+ΡΡΡΡ
=Ρ6,03,04,09,0
6,03,0
222111
22112 SSSS
SSS
θθθ
θ �
�
31
54,018,0 == �
Ou, de modo mais simples, �
( ) ( )31
32
11 1112 =−=Ρ−=Ρ θθ SS ��
�A matriz de ganhos “a posteriori” é agora �
� 1S � 2S �
1D � 30 � 630 �
2D � 130− � 1970 �
�*>���A>����;������'���������9��B����������6 <���������������������
16
�������������
[ ] 23031
63032
3011 =+=Ε θG �
�
[ ] 57031
197032
13012 =+−=Ε θG �
�E, portanto, �������������������������������������������������������������������������������������������'�����������������������������������������������������������������
��������������������������������������������������������������/�
������������������������������������������������ 1S ���� 32 �
������������������������������������������'��
������������������������������������������,�������� 2S ��������������������������������������������������������������������������������������������������'�����
������������������������� 1D �������������� 31 ������1�
��%)�� � %)���
���(�������� 1θ ������*�
����������!�������������� 2D ����������������������� !'��
�����������������������������������������%)�������������������.������������������������������������������������ 1S �
������������������������������������������-������ 32 ����
��������������������������������������������� 31 ��� 2S �!C)��
��������������������������������������������������������������0�������������������������������������������������������������������������
17
��������������������������������������������������������������������������������������������������������������������������������������������������������
Como o maior ganho esperado está associado a 2D , 2D é a decisão recomendada tendo em conta o critério “a posteriori”. A figura apresentada acima é a árvore da decisão do processo. A probabilidade de que as sondagens indiquem a inexistência de gás, ( )1θP , é 1(um) já que o resultado da experiência é conhecido. �
Outro Exemplo Resolver o problema anterior no caso de as sondagens terem indicado a presença de gás. Designe-se o acontecimento de que as sondagens indicaram a existência de gás por 2θ . Então, de acordo com os dados do problema anterior �
( ) ( ) 1,09,011 1112 =−=−=Ρ SPS θθ ����
( ) ( ) 7,03,011 2122 =−=−=Ρ SPS θθ ��
�Recorde-se que as probabilidades iniciais são ( ) 4,01 =SP e ( ) 6,02 =SP . Portanto, a distribuição posterior de probabilidade é:
( ) ( ) ( )( ) ( ) ( ) ( ) =
+=
222112
11221 SPSPSPSP
SPSPSP
θθθ
θ �
��
( )( )( )( ) ( )( ) 087,0
46,004,0
6,07,04,01,04,01,0 ==
+= ���
��
( ) ( ) ( )( ) ( ) ( ) ( ) =
+=
222112
22222 SPSPSPSP
SPSPSP
θθθ
θ �
��
( )( )( )( ) ( )( ) 913,0
46,042,0
6,07,04,01,06,07,0 ==
+= �
���
18
����
�.�� ������ ��� �����
( ) ( ) 913,0087,011 2122 =−=−= θθ SPSP ��
�Também neste caso cada entrada da matriz de ganhos original deve ser reduzida de 30 000 euro para reflectir o custo do teste. Então os ganhos esperados (em milhares de euro) para as decisões 1D e 2D em relação à distribuição de probabilidade deduzida são �
[ ] ( )( ) ( )( ) 8,577913,0630087,03021 =+=Ε θG ��
�
[ ] ( )( ) ( )( ) 3,1787913,01970087,013022 =+−=Ε θG ��
�
Como o maior ganho esperado é o associado a 2D , 2D é a decisão recomendada na situação do critério “a posteriori”. Na figura seguinte apresenta-se a árvore da decisão para este processo. A probabilidade de que as sondagens indiquem a presença de gás, ( )2θP , é unitária, já que o resultado da experiência é conhecido. �����������������������������������������������������������������������������������������������������������������������������������'��
�������������������������������������������������������������������:������������������������������������������������������ 1S �
������������������������������������������%))�&����������&)��
�������������������������������� 1D ��������D���������� 2S ������'��!)&)�'�������������!)&)�'����������������������C!'������������������������������������
���(����� 2θ �����������������������������������������������E��������������������������2��������������!����������������� 2D ������
����������������������������������������!)&)�'�
������������������������������������������4������� 1S ����������� !'��������������������������������������������������������������������������
������������������������������������������������������������&)������������������������������������������������������������������� 2S �
���������������������������������������������������C!'���������!C)��
��������������������������������������������������������������F���
19
�����Ainda outro exemplo �Qual a decisão recomendada se as sondagens discutidas nos exemplos (2 exemplos) dados atrás não tivessem sido realizadas, mas somente consideradas? ����� ��� �6���� ������ � �������� �� ������� �� ����� ��>6����� 0�� ���� ���������>���� � ��� ������� ��?��� ����G������ �����6��� ������������� �����������8��������� ���A�����6��������45���
� � � ID ���������������G��������6����
�
� � � IID �������������������G��������6����
�
� � � 1θ ��������� ����H��������6��������� �������B����6>�I��
�
� 2θ �� ������� ���� H��� �����6��� ���� ������ � ����B�� ������
6>�I��
�A principal diferença está em que nem ( )1θP nem ( )2θP são iguais a 1, visto
que o resultado das sondagens é desconhecido. Mas, como { }21, SS constitui uma partição do espaço de probabilidades, tendo em conta os dados dos dois exemplos anteriores �
( ) ( ) ( ) ( ) ( ) ( )( ) ( )( ) 54,06,03,04,090,02211111 =+=+= SPSPSPSPP θθθ ��
�e
�
( ) ( ) ( ) ( ) ( ) ( )( ) ( )( ) .46,06,07,04,010,02221122 =+=+= SPSPSPSPP θθθ Assim o ganho esperado no nó I é �
( )( ) ( )( ) 113046,03,178754,0570 =+ �
Vindo a árvore para este processo: ����
20
��������������������������������������������������������������������������������������������������������������� 1S ��������������������������������������������������
�������������������������������������������������������������������������������������������������������!!���� 1D ����������������������������������� 2S ����������
���������������������������������������������������������������������������
��������������������������������������������������������������������������������������������������������������������� 2D ����������������!!����������� 1S � "�� !���
� ID � #�������������!!�������������������������������������������������������������������������� 2S �����������
������������������������������������������������������������������������ $�+�������������������������%)�����������������������������'������������������'����������������������������������������� 1D ������������������������������� 1S ��������/�
����� IID ����������������������*� ,��� 32 �
������������������������������������������������������������������������������ 2S �
��������������� 1θ ������������������������� 2D �������������������������� 31 ���������'��
����������������������%����������������������%)������������������������ !'����1�
�������������(������������������������������-������������ 1S �������.�
���������!!'����������������������������������������������� 32 �
�
��������������������������� 2θ ��������������������������������� 31 �� 2S ����!C)��
��������������������������� 0����������������'������������������������������������������������������������������������������������������������������:�� �������������������������������������������������������������������������%))�&������ 1S �
������������������������������������������!)&)�'��������������������������������������&)�
� ��� 1D � D�����
������������������������������������������2�������������������������������C!'����� 2S ���'���
����������������������������������������������������������������������������������������������������E�����������������������������������������������������������!)&)�'������������������������������ !'����������������������������������������������������������������������������� 1S �
� ��������������������������������������������4��������������������������������������������������������������������������������������������������������������&)������������������������������������������������������������������C!'������� 2S �
�����������������������������������������������������������������������������������!C)���
����������������������������������������������������������������������������������F��
21
������
Como o nó B tem um ganho esperado maior que o nó I, ID é recomendada
em vez de IID . Assim, as decisões recomendadas, entretanto, são para não realizar as sondagens e não aceitar a oferta da companhia energética. Pelo contrário o proprietário deve começar a explorar a terra ele mesmo imediatamente. Note-se que a decisão de ID é indiferente à realização de sondagens e aos seus resultados caso tenham sido realizadas. Assim, as sondagens não têm nenhum efeito na decisão final e representam apenas uma despesa. Note-se, aliás, que a diferença entre os valores esperados nos nós B e I ( )3011301160 =− é precisamente o valor do custo do teste. �Mais um Exemplo �Uma cidade pretende efectuar, ela própria, a troca da frota municipal de automóveis a gasolina por carros eléctricos. O fabricante de carros eléctricos afirma que a cidade, com o tempo, terá um lucro de 1 000000 euro se realizar a conversão. Mas a cidade tem as suas dúvidas. Se o fabricante não estiver correcto a conversão poderá custar à cidade 450 000 euro. Uma terceira possibilidade é que nenhuma dessas situações venha a ocorrer e a cidade não perca nem ganhe com a conversão. De acordo com um levantamento de dados realizado, as respectivas probabilidades desses três acontecimentos são 25,0 , 45,0 e 30,0 . A cidade considera então a possibilidade de realizar um programa piloto que, se implementado, indicaria o custo potencial ou economia na conversão para carros eléctricos. O programa envolve o aluguer de três carros eléctricos por três meses e utilizados sob condições normais. O custo para a cidade deste programa piloto seria de 50 000 euro. O consultor da cidade acredita que os resultados do programa piloto seriam significativos, mas não conclusivos; assim apresentou na tabela seguinte uma compilação de probabilidades baseada na experiência de outras cidades, para ilustrar a sua afirmação. Que decisões deveria a cidade tomar se ela quisesse maximizar a economia esperada?
22
�
Programa Piloto Economia Inalterado Perda Economia
6,0
3,0
1,0
Estabilidade
4,0
4,0
2,0
C O N V E R S Ã O
Perda
1,0
5,0
4,0
�Este é um processo de dois estágios. Primeiro a cidade deve decidir se vai realizar o programa piloto e então decidir se converte a sua frota para carros eléctricos. Seja
- ID : decisão de não realizar o programa piloto, - IID : decisão de realizar o programa piloto,
- 1θ : acontecimento “o programa piloto indicam a economia”,
- 2θ : acontecimento “o programa piloto não indica economia nem perda”,
- 3θ : acontecimento “o programa piloto indica perda”, - 1D : decisão de converter para carros eléctricos, - 2D : decisão de não converter para carros eléctricos,
- 1S : estabelece que os carros eléctricos são mais baratos para operar que os modelos a gasolina,
- 2S : estabelece que os carros eléctricos custam o mesmo para
operar que os modelos a gasolina,
23
- 3S : estabelece que os carros eléctricos são mais caros para
operar que os modelos a gasolina. A matriz de ganhos (em milhares de euro) é �
� 1S � 2S � 3S �
1D � 1000 � 0 � 450− �
2D � 0 � 0 � 0 �
A distribuição inicial de probabilidades é �
( ) ( ) 30,0;25,0 21 == SPSP ���� ( ) 45,03 =SP ��
�Se o programa piloto não for realizado a distribuição inicial de probabilidades não é reconvertida para distribuição “a posteriori” e os ganhos esperados para
1D e 2D são, respectivamente �
[ ] ( )( ) ( )( ) ( )( ) 5,4745,045030,0025,01001 =−++=Ε G �
[ ] ( )( ) ( ) ( ) 045,0030,0025,002 =++=ŠG ��
�
Como o ganho esperado máximo está associado a 1D , 1D é a decisão recomendada sob o critério “a priori”. Se o programa piloto for realizado, todas as entradas da matriz de ganhos devem ser reduzidos em 50 , custo do teste: �
� 1S � 2S � 3S �
1D � 950 � 50− � 500− �
2D � 50− � 50− � 50− �
�E, face à tabela apresentada pelo consultor,
( ) 6,011 =SP θ ( ) 4,021 =SP θ ( ) 1,031 =SP θ
( ) 3,012 =SP θ ( ) 4,022 =SP θ ( ) 5,0321 =SP θ
( ) 1,013 =SP θ ( ) 2,023 =SP θ ( ) 4,033 =SP θ
24
Então, recorrendo ao teorema de Bayes: �
( ) ( ) ( )( ) ( ) ( ) ( ) ( ) ( ) =
++=
331221111
11111 SPSPSPSPSPSP
SPSPSP
θθθθ
θ �
��
( )( )( )( ) ( )( ) ( )( ) 4762,0
45,01,030,04,025,06,025,06,0 =
++= �
��
( ) ( ) ( )( ) ( )
( )( )( )( ) ( )( ) ( )( ) =
++==
�=
45,01,030,04,025,06,030,040,0
3
11
22112
iii SPSP
SPSPSP
θ
θθ �
�
3810,0= �
�
( ) ( ) ( )( ) ( )
( )( )( )( ) ( )( ) ( )( ) =
++==
�=
45,01,030,04,025,06,045,01,0
3
11
33113
iii SPSP
SPSPSP
θ
θθ �
�
,1428,0= �� ( )11428,03810,04762,0 =++ �
�
( ) ( )( )( )( ) ( )( ) ( )( ) ,1786,0
45,05,03,04,025,03,025,03,0
21 =++
=θSP �
���
( ) ( )( )( )( ) ( )( ) ( )( ) ,2857,0
45,05,03,04,025,03,03,04,0
22 =++
=θSP �
��
( ) ( )( )( )( ) ( )( ) ( )( ) ,5357,0
45,05,03,04,025,03,045,05,0
23 =++
=θSP �
��
( ),15357,02857,01786,0 =++ �
��
25
( ) ( )( )( )( ) ( )( ) ( )( ) ,0943,0
45,04,03,02,025,01,025,01,0
31 =++
=θSP �
��
( ) ( )( )( )( ) ( )( ) ( )( ) ,2265,0
45,04,03,02,025,01,03,02,0
32 =++
=θSP �
��
( ) ( )( )( )( ) ( )( ) ( )( ) ,6792,0
45,04,03,02,025,01,045,04,0
33 =++
=θSP �
��
( ).16792,02265,00943,0 =++ �
�
Se o resultado do programa piloto é 1θ , as probabilidades posteriores são
dadas por ( )1θiSP , 3,2,1=i e os ganhos esperados para as decisões 1D e
2D , respectivamente por
[ ] ( )( ) ( )( ) ( )( ) 9,3611428,05003810,0504762,095011 =−+−+=Ε θG e
[ ] ( )( ) ( )( ) ( )( ) .501428,0503810,0504762,05012 −=−+−+−=Ε θG A decisão recomendada sob o critério “ a posteriori” é 1D .
Se o resultado do programa piloto é 2θ , as probabilidades posteriores são
dadas por ( )2θiSP , 3,2,1=i e os ganhos esperados para as decisões 1D e
2D , respectivamente por
[ ] ( )( ) ( )( ) ( )( ) 5,1125357,05002857,0501786,095021 −=−+−+=Ε θG e
[ ] 5021 −=Ε θG .
A decisão recomendada sob o critério “a posteriori” é 2D .
26
Se o resultado do programa piloto é 3θ , as probabilidades posteriores são
dadas por ( )3θiSP , 3,2,1=i e os ganhos esperados para as decisões 1D e
2D , respectivamente por
[ ] ( )( ) ( )( ) ( )( ) 3,2616792,05002265,0500943,095031 −=−+−+=Ε θG e
[ ] 5032 −=Ε θG . A decisão recomendada sob o critério “a posteriori” é 2D . A árvore de decisão para este processo, que mostramos a seguir �������������������������������������������������������������������������!�����
�����������������������������������)�%��� 1S �
���������������������������������������������������%������������
�������������������������������������������������������� 2S �
�������������������� 1D �������������� 3S ������������'��
������������������������������������������������%��������� �%���������������)�%���������������������������������������������������������������������������
������������������������� 2D ����������������� 1S �������������������������������������������������������������%�
�������������������������������������������������������� 2S ������������
�� ID �����������������������������������������������'��
�������������������������������������������������������� 3S ���������������������
27
)C�)%���������������������������������������������%�����������������������C%��������������������������������������������������
��+���������������������������������������������������������������������������������������������������������� 1S �
���������������������������������������������������������������������������)��� %����
���������������������������������������������������������'�!�C���� 2S �
�������������������������������������������������������������������������������������'&)��������� %���
����������������������������������'�!�C�� 1D ����������������!��C�� 3S �
��������������������������������������������������������������������������������������������������� %��
�������������������������������������������� 2D ���� %����������������������� 1S �
��� IID �������������������������������������������������������������������)���
����������������������������������������������������������������������������������� 2S ������������� %���������������������������������������������������������������������������������'&!���������������������������������������������������������������������������
������������������������� 1θ �����������������������������������������������������������!��&������� 3S �
���������������������������'!%���������������������������������������������������������������������� %����������������������������������������������������������������������C%���
����������������������������������������� !!��%� 1S �������!)&������������� %��
������������������������������������������������������������������ 2S ���
������������������������������������������������������� 3S �������������&%)����������������
)C�)%����������������� %��� 1D ����������������%'%)������� %���
�������� 2θ ���������������������������������������������������� %�������
���������������������������������������� 2D � %��
�������������������������������������������������� 1S ����������!)&����� %��
������������������������������������������������������������������ 2S ������������������������������������������������������������&%)�
�������������������������������������������������������%'%)������ 3S ���� %��
����������������������������������������������������������������C%����
�������������������������������������������� 1S �����%������������������������������������������������������C�'������������������������������������� ��!�'�������������������� %��
������������������������������������������������� 2S �������������������������������������������������%�
��������� 1D ������������������������)C������� 3S ������ %���
�
"��
���������������������� 2D ������������������������������������������������������ %��
����������������������������������������������� %������������C�'�
28
���������������������������������������������������������������������� 1S �
���������������������������������������������������������� 2S �
�����������������������������������������������������������������������%�� %���
��������������������������������������������������������������)C����� 3S �
������������������������������������������������������������������������� %���� Tem a particularidade de os resultados obtidos aparecerem nos nós sem letra e nos ramos que a eles chegam ou deles partem. Os ganhos esperados nos nós B, E, F e G são os ganhos relativos aos nós subsequentes, se as decisões recomendadas tiverem sido tomadas. Pelo Teorema da probabilidade total:
( ) ( ) ( ) ( ) ( ) ( ) ( ) =++= 3312211111 SPSPSPSPSPSPP θθθθ �
�
( )( ) ( )( ) ( )( ) ,315,045,01,03,04,025,06,0 =++= �
��
( ) ( ) ( ) ( ) ( ) ( ) ( ) =++= 3322221122 SPSPSPSPSPSPP θθθθ �
�
( )( ) ( )( ) ( )( ) ,420,045,05,03,04,025,03,0 =++= �
��
( ) ( ) ( ) ( ) ( ) ( ) ( ) =++= 3332231133 SPSPSPSPSPSPP θθθθ �
��
( )( ) ( )( ) ( )( ) 265,045,04,03,02,025,01,0 =++= ��
Então o ganho esperado no nó C é �
( )( ) ( )( ) ( )( ) 75,79265,050420,050315,09,361 =−+−+ ��
�Como este valor é maior que o ganho esperado no nó B, o ramo de decisão para o nó C, designado por IID , é o recomendado. A cidade deve realizar o programa piloto e então converter para veículos movidos a electricidade apenas se ele indicar economia.
29
�EE�����������������A utilidade de um componente de pagamento é o seu valor numérico para um analista de decisões. Quando nenhum critério de decisão é aplicável, a menos que os componentes de pagamento sejam quantificados na mesma unidade, o primeiro passo na análise de qualquer processo de decisão é determinar a utilidade de todos os componentes do pagamento não numéricos. Uma utilidade comum é a correspondência monetária, onde cada componente de pagamento é substituído na matriz de ganhos pelo seu valor em euro. A correspondência monetária, entretanto, não é sempre apropriada. Um componente de 2 000000 de euro é o dobro de um de 1 000000, mas o primeiro pode não corresponder ao dobro do último para um realizador de decisões. O primeiro milhão pode ser mais valioso que o segundo. Nos casos em que os euros não reflectem a correspondência verdadeira de um componente de pagamentos em relação a outro, ou em que os euros não são a unidade de quantificação adequada, devem usar-se outras unidades. �
LLoottaarriiaa �Uma lotaria L );,( PBA é um acontecimento aleatório que tem dois resultados, Α e Β , ocorridos com probabilidades p e p−1 respectivamente. ��EE������������������������������11 ����������O procedimento, indicado a seguir, de quatro etapas é utilizado para determinar as utilidades de Von Neumann para uma tabela com um número finito de componentes. � Etapa 1
Enumerar os componentes de pagamento por ordem decrescente de conveniência:
,,...,, 21 peee sendo ie mais conveniente que je se ji < ,
30
� �
Etapa 2 Arbitrariamente atribuir valores numéricos finitos ( )1eu e ( )peu aos
componentes 1e e pe , respectivamente, de modo que ( )1eu > ( )peu ,
Etapa 3 Para cada componente je , convenientemente localizado entre 1e e pe ,
determinar uma probabilidade equivalente jp , supondo que para o
analista de decisões é indiferente obter je com certeza ou participar na
lotaria L ( )jp pee ;,1 ,
Etapa 4 Fazer ( ) ( ) ( ) ( )pjjj eupeupeu −+= 11 sendo ( )jeu a utilidade do
componente de pagamento je .
A Etapa 3 é, como é evidente, extremamente subjectiva. O valor de jp para
cada componente ( )1,...,3,2 −= pje j é uma determinação individual que pode variar drasticamente de uma pessoa para a outra ou até para uma mesma pessoa em duas épocas diferentes. As utilidades resultantes, entretanto, quantificam as correspondências relativas dos componentes de pagamento para um determinado analista de decisões num certo momento. Entretanto, para uma racionalidade individual, será sempre esperado que a ordem dos sp' , e portanto dos su' sejam as mesmas dos se' . Uma utilidade é normalizada se ( ) 11 =eu e ( ) 0=peu , tornando as utilidades
idênticas às probabilidades equivalentes.
31
Exemplo Imagine uma situação na qual os ganhos listados na tabela do exemplo do gás natural, que aqui reproduzimos:
1S 2S
1D 60 660
2D 100− 2000 Não correspondem aos componentes de pagamento relativos ao proprietário. Mostre que a função de utilidade de Von Neumann pode ser usada para corrigir essa situação. Os componentes de pagamento por ordem decrescente de preferência são:
20001 =e 6602 =e 603 =e 1004 −=e . Se 100 (100 000 euro) representa as economias de toda a vida do proprietário, então perdê-las seria catastrófico. Considerando que tal perda não pode ser mais importante para o proprietário que ganhar 2000 (2000 000), ainda assim esta preferência não é reflectida nos valores em euro dos componentes de pagamento. Além disso 660 pode ser dinheiro suficiente para satisfazer todos os desejos do proprietário. O valor 2000 é obviamente melhor; mas pode não significar três vezes mais valioso, em números redondos, como sugerido apenas pelos números. O proprietário pode, por exemplo, estabelecer a utilidade de 1e em 1000 e a
de 4e em 1000− para reflectir o temor da perda das economias de toda a sua
vida. Depois de muito reflectir, ele pode concluir ser indiferente receber 2e com certeza ou participar na lotaria L ( )999,0;, 41 ee . Então a utilidade de 2e deveria ser
( ) ( ) ( ) ( ) ( )( ) 9981000001,01000999,0999,01999,0 412 =−+×=−+= eueueu .
32
O proprietário pode também concluir que é indiferente receber 3e com certeza
ou participar na lotaria L ( )95,0;, 41 ee . Então a utilidade de 3e deve ser
( ) ( ) ( ) ( ) ( ) 900100005,0100095,095,0195,0 413 =−×+×=−+= eueueu .
A matriz dos ganhos para o processo de decisão, em termos de utilidades é assim
1S 2S
1D 950 998
2D 1000− 1000 ����Outro Exemplo Determine a decisão recomendada pelo critério a priori para o caso de o proprietário do exemplo anterior, se a matriz dos ganhos é a tabela de utilidades dada acima, estimando ele que a probabilidade de haver gás é de
6,0 . Como ( ) 4,01 =Ρ S e ( ) 6,02 =Ρ S os ganhos esperados para 1D e 2D são, respectivamente,
[ ] 8,9876,09984,09501 =×+×=Ε G e
[ ] ( )( ) ( )( ) 2006,010004,010002 =+−=Ε G
Sendo a decisão recomendada 1D .