Upload
sofialima
View
14
Download
1
Embed Size (px)
DESCRIPTION
estatistica, probabilidade, slides
Citation preview
DistribuiçãoGaussiana
Modelo Probabilístico para
Variáveis Contínuas
Distribuição Normal
-3 -2 -1 0 1 2 3
0.0
0.1
0.2
0.3
0.4
Distribuição N(0,1)
x
f(x)
Distribuição Normal
As distribuições de probabilidade de variáveis aleatórias contínuas são especificadas através da função densidade de probabilidade (f.d.p)
Histograma de peso ao nascer de 100 crianças
Peso ao nascer(Kg)
Fre
quên
cia
Abs
olut
a
1 2 3 4 5
05
1015
2025
Histograma de densidade
Densidade = frequência relativa / amplitude do intervalo
Histograma de peso ao nascer de 100 crianças
Peso ao nascer(Kg)
Den
sida
de d
e F
requ
ênci
a
1 2 3 4 5
0.0
0.1
0.2
0.3
0.4
0.5
X – peso ao nascer
P(2 ≤ X < 3) = 0,08 + 0,14 = 0,20
P(X < 2) = 0,01 + 0,02 + 0,03 = 0,06
Classe Frequência Absoluta
Frequência Relativa
Amplitude Densidade
0,5|----1,0 1 0,01 0,5 0,021,0|----1,5 2 0,02 0,5 0,041,5|----2,0 3 0,03 0,5 0,062,0|----2,5 8 0,08 0,5 0,162,5|----3.0 14 0,14 0,5 0,283,0|----3,5 23 0,23 0,5 0,463,5|----4,0 22 0,22 0,5 0,444,0|----4,5 18 0,18 0,5 0,364,5|----5,0 5 0,05 0,5 0,105,0|----5,5 4 0,04 0,5 0,08
Total 100 1
Histograma de peso ao nascer de 100 crianças
Peso ao nascer(Kg)
De
nsid
ade
de
Fre
quê
ncia
1 2 3 4 5
0.0
0.1
0.2
0.3
0.4
0.5
f(x)
X – Peso ao nascer
f(x) – função densidade de probabilidade
� Calcular probabilidade como área abaixo da curva
0 2 4 6 8
0.0
0.1
0.2
0.3
0.4
0.5
x
f(x)
P(2 < X < 4) = área abaixo da curva entre 2 e 4
P(X = x) = 0 P(X < x) = P(X ≤ x)
Propriedades da função densidade de probabilidade
� f(x) ≥ 0
� Área abaixo da curva é igual a 1
A Distribuição Gaussiana (ou Normal)
Algumas variáveis contínuas exibem um comportamentomuito particular quando visualizamos a distribuição de frequências de seus valores.
• Concentração de valores em torno de um valor central;
• Simetria em torno do valor central;
• Frequência pequena de valores muito extremos.
Fre
quên
cia
Valores
O Modelo Probabilístico Gaussiano
O matemático alemão Karl Gausspopularizou um modelo proposto para a distribuição de probabilidades de variáveis do tipo descrito anteriormente.
A curva descrita por este modelo éconhecida como Curva de Gauss (ou também como Curva Normal)
Distribuição Normal
0;
xe1
)x(f
2
2
)x(
2
2
22
>∞<<∞−
∞<<∞−=
−−
σµ
σ
µ
πσ
µ – média σ – desvio padrão
X ~ N(µ, σ) - A variável aleatória X tem distribuição Normal com média µ e desvio padrão σ
A curva gaussiana (ou curva Normal) é definida pela média µµµµ e pelo desvio-padrão σ.σ.σ.σ.
O Modelo Probabilístico Gaussiano
A média µ de uma variável aleatória X que siga o modelo Gaussiano pode assumir qualquer valor na reta real
O Modelo Probabilístico Gaussiano
µ−∞ < < ∞
O desvio-padrão σ de qualquer variável aleatória X sópode assumir valores maiores do que zero
0σ >
µ e σ são os parâmetros do Modelo Gaussiano
Dizemos que X ~ Normal (µ,σ)
Médias diferentes, desvios-padrão iguais
Médias iguais, desvios-padrão diferentes
Médias diferentes, desvios-padrão diferentes
Probabilidade de X estar entre x1 e x2: P( x1 < X < x2 )
Cálculo de Probabilidade na Curva Normal
Considere uma variável aleatória X com distribuição
Normal (µ,σ). Ou seja, X ~ Normal(µ,σ)
P( x1 < X < x2 )P( x1 < X < x2 )
Área sob a curva
Normal entre x1 e x2.
Cálculo de Probabilidade na Curva Normal
P( x1 < X < x2 )
curvas Normais diferentes � áreas diferentes
Propriedades da Distribuição Normal
Simetria
a a
P(X < 3000-a ) = P(X > 3000+a )
3000 + a3000 - a
Propriedades da Distribuição Normal
Área fixa entre intervalos simétricos
Exemplo:
Suponha que X é o peso de bebês ao nascer e que, em certa população, X tem distribuição de probabilidade que pode ser aproximada pela Normal com µ = 3000g e σ = 1000g.
Qual é a porcentagem de bebês que nascem com peso abaixo de 1500g ?
A Distribuição Normal Padrão
Z ~ Normal (µ=0 ; σ=1)
Como existem infinitas combinações dos valores para µ
e σ, seria inviável tabelar as probabilidades de todas as distribuições Normais possíveis.
As probabilidades na curva Normal são calculadas com o auxílio de uma tabela.
Sendo assim, uma única variável Normal possui suasprobabilidades tabeladas: a variável Z com média igual a 0 e desvio-padrão igual a 1.
A variável aleatória Normal com
média µ=0 e desvio-padrão σ=1 échamada de
Variável Normal Padrão
Z ~ N(0,1)
P( Z < z )
a variável aleatória Z
tem distribuição de probabilidade
Normal com média=0 ed.p.=1
A Tabela Normal Padrão (Tabela Z)Parte Negativa
P( Z < -0.83 )
-0.83
Coluna: Segundacasa decimal de z
Linha: Parte inteira e primeira casa decimal de z
-2.9
-0.8
0.00187 0.00181 0.00175 0.00169
0.21186 0.20897 0.20611 0.20327
P( Z < 1.5 )
Coluna: Segundacasa decimal de z
Linha: Parte inteira e primeira casa decimal de z
A Tabela Normal Padrão (Tabela Z)Parte Positiva
Exemplo: Seja Z uma v.a. normal padronizada. Calcule:
P( Z < -1.97) = ? P( Z > 1.84) = ?
P( Z < -1.97 ) = 0.0244,
obtida direto da tabela.
P( Z >1.84) = P( Z < -1.84) = 0.0329, obtida direto da tabela
e por simetria.
P( -1.97 < Z < 0.86 ) = P( Z < 0.86 ) - P( Z < -1.97 )= 0.8051 - 0.0244= 0.7807
= -
Cálculo de percentis na curva Normal
Percentil de ordem 2.5
Que valor de Z na tabela Normal Padrão deixa uma área de 0.0250 abaixo dele ?
0.0250
a=-1.96
Ou seja, quem é a tal que P[Z < a ]=0.0250 ?
a é o percentil 2.5 da curva Normal Padrão
Cálculo de percentis na curva Normal
Percentil de ordem 97.5
Que valor de Z na tabela Normal Padrão deixa uma área de 0.9750 abaixo dele ?
Ou seja, quem é b tal que P[Z < b ]=0.9750 ?
b é o percentil 97.5 da curva Normal Padrão
0.9750
b=1.96
0.0250b é o simétrico de a em relaçãoà média da curva Normal
Cálculo de percentis na curva Normal
P[Z < b ]=0.9500
b é o percentil 95 da curvaNormal Padrão b=1.645
Percentil de ordem 95
Na tabela Z:
z = 1.65 � área abaixo = 0.9505
z = 1.64 � área abaixo = 0.9495
Calcular a média dos dois valores: b=1.645
Cálculo de percentis na curva Normal
P[-b < Z < b ]=0.9800
P[Z< -b ] =0.0100
-b = ?
Percentil de ordem 1
P[Z < b ]=0.0100
b é o percentil 1 da curva Normal Padrão
Na tabela Z:
z = -2.33 � área abaixo = 0.0099
z = -2.32 � área abaixo = 0.0102
b=2.33-b=2.33
0.0100 0.0100
0.9800
Usar o valor de z queforneça a área mais próxima
do desejada (-2.33)
Como usar a tabela Normal Padrão paracalcular probabilidades em uma curvaNormal qualquer?
Z ~ Normal (µ=0 ; σ=1)
X ~ Normal (µ=10 ; σ=2)
Distribuição de
Distribuição de
Podemos transformar uma variável aleatória
X ~ Normal ( µ , σ ) em uma variável aleatória
Z ~ Normal ( 0, 1) usando a expressão:
XZ
µ
σ
−=
Padronização de uma variável aleatória Normal
X ~ Normal (µ ,σ ) Z ~ Normal (0,1)
1
1
xz
µ
σ
−=
2
2
xz
µ
σ
−=
Calculando probabilidades de X utilizando a tabela Z
[ 9]P X < =9X
Pµ µ
σ σ
− − < =
10 9 10
2 2
XP
− − <
[ 0.5] 0.3085P Z= < − =
[ 13]P X > =10 13 10
[ ]2 2
XP
− −> = [ 1.5]P Z >
[ 1.5] 0.1295P Z= < − =
Exemplo 1: Se X tem distribuição Normal com µ = 40 e σ = 6, encontre o valor de x tal que P[X < x] =0.45.
então P( Z < (x-40)/6 ) = 0.45.
Mas P( Z < -0.13 ) = 0.45 (da tabela);
Se P[X < x] =0.45.
Logo (x-40)/6 = -0.13
���� x = 40 + (-0.13)6 = 40 - 0.78= 39.22.
Ou seja, 39.22 é o percentil 45 da distribuição de X.
então P( Z < (x-40)/6 ) = 0.14.
Mas P( Z > 1.08) = P( Z < -1.08) = 0.14 (da tabela);
Se P[X < x] = 0.14.
Logo (x-40)/6 = 1.08
���� x = 40 + (1.08)6 = 46.48
Ou seja, 46.48 é o percentil 86 da distribuição de X.
Exemplo 2: Se X tem distribuição Normal com µ = 40 e σ = 6, encontre o valor de x tal que P[X > x] =0.14.
Cálculo do Percentil de ordem 100αda distribuição Normal
100 (1 )P zα αµ σ−= + ⋅
α
z(1-α)
1-α
onde α é a ordem do percentil (0 < α < 1) e
z(1-α) é o valor na tabela Z que deixa uma área de (1-α) acima dele.
45 (1 0.4500)
(0.5500)
0.45
40 6
40 6
40 0.13 6
P z
z
α
−
=
= + ×
= + ×
= − ×
86 (1 0.8600)
(0.1400)
0.86
40 6
40 6
40 1.08 6
P z
z
α
−
=
= + ×
= + ×
= + ×
Conferindo os dois exemplos anteriores, onde µ = 40 e σ = 6 :
Cálculo do Percentil de ordem 100α da distribuição Normal
Exemplo Inicial:
Suponha que X é o peso de bebês ao nascer e que, em certa população, X tem distribuição que pode ser aproximada pela Normal com µ= 3000g e σ = 1000g.
Qual é a porcentagem de bebês que nascem com peso abaixo de 1500g ?
[ ]
3000 1500 3000[ 1500]
1000 1000
1.5 0.0068
XP X P
P Z
− − < = <
= < − =
0.68% dos bebês têm peso inferior
a 1500g.
Qual é a porcentagem de bebês que nascem com peso acima de 4000g ?
[ ] [ ]
4000 3000[ 4000]
1000
1.0 1.0 0.1587
P X P Z
P Z P Z
− > = >
= > = < − =
[2500 3500] [ 3500] [ 2500]P X P X P X< < = < − <
Qual é a porcentagem de bebês que nascem com peso entre 2500 e 3500g ?
3500 3000 2500 3000
1000 1000P Z P Z
− − = < − <
[ ] [ ] 0.5 0.5P Z P Z= < − < −
0.6915 0.3085 0.3830= − =
38.30% dos bebês
Qual valor de peso dos bebês separa os 10% mais leves?
1720 gramas
10 (1 0.1000)
(0.9000)
0.10
3000 1000
3000 1000
3000 ( 1.28) 1000
3000 1280 1720
P z
z
α
−
=
= + ×
= + ×
= + − ×
= − =
0.10
P103000
Qual valor de peso dos bebês separa os 10% mais pesados?
4280 gramas
10 (1 0.9000)
(0.1000)
0.90
3000 1000
3000 1000
3000 1.28 1000
3000 1280 4280
P z
z
α
−
=
= + ×
= + ×
= + ×
= + =
0.10
P903000