Upload
internet
View
115
Download
4
Embed Size (px)
Citation preview
Probabilidade e Estatística Exemplo da Moeda Balanceada
Paulo [email protected]
Exemplo
Será que uma moeda que dá 450 caras em 1000 lançamentos balanceada ?
Como elaborar a questão em termos estatísticos ?
Como modelar o problema ?
Modelagem Estatística
Fenômenodo Mundo
Real
ModeloProbabilístico
SituaçãoEspecífica(instância)
ModeloEstatístico
Hipóteses
AmostraDados
(x1,x2,...x1000)
(X1,X2,...X1000)
Modelagem-1
Hipótese de independência estatística entre os lançamentos.– Sem desgaste
Ensaios de Bernoulli Processo Binomial
– argumentos p e n E daí ? Como resolver o problema ?
Modelagem-2
Estimação do parâmetro p da distribuição ? Supor que a moeda seja balanceada: p = 0,5 Supor um grau de confiança de 95% e calcular o
intervalo de confiança Verificar se 450 caras está dentro desse intervalo Mas, como calcular o intervalo de confiança de uma
binomial para n=1000 ? Aproximar a binomial pela normal (Teorema Central
do Limite)
Distribuição Normal: X~N(,2)Definição Função densidade de probabilidade
Função de distribuição acumulada:– Não integrável
– Utiliza-se a tabela da Normal Reduzida: N(0,1)
2
2
1
2
1)(
x
exf x
Distribuição Normal: X~N(,2)ParâmetrosValor esperado
)(XE
Variância
2)( XV
Importância daDistribuição Normal Modela uma série de fenômenos estocásticos Aproxima a distribuição Binomial Aproxima a soma de variáveis aleatórias
independentes (Teorema Central do Limite)– Somas de variáveis aleatórias
independentes (em grande número) obedecem a uma Normal
Gráfico da Distribuição Normal Simétrico em relação ao valor esperado Pontos de inflexão nos pontos a 1 desvio-
padrão da média.
f(x)
x
Transformação daDistribuição Normal Para resolvermos de fenômenos modelados
por uma distribuição normal de parâmetros genéricos, precisamos reduzi-la a uma N(0,1), por meio da transformação linear abaixo
X
Z
Tabela da Distribuição NormalReduzida: N(0,1) A tabela apresenta os valores: z e (z)
onde (z) = P(Z<z) A tabela se encontra no apêndice de todo livro
de probabilidade e estatística Os valores podem estar nos domínios:
– 0 x < usar a propriedade de simetria
– - < x <
Teorema Central do Limite-1 Sejam X1, X2,.. Xn, variáveis aleatórias
independentes. Consideremos, ainda, que:
E(Xi ) = i e V(Xi ) = i2
Definamos a variável aleatória Sn, como a soma de todas as Xi.
O teorema diz que, quando n tende a infinito, a distribuição de Sn tende a uma Normal.
E mais...
Teorema Central do Limite-2 A variável Zn tende a uma distribuição
Normal Reduzida:
)1,0(
1
2
1 NS
Znn
ii
n
iin
n
Teorema Central do Limite Aplicações Esse poderoso teorema faz com que a Normal
seja a distrinuição mais importante da Estatística.
Exemplos:- A decomposição de um grande projeto em subprojetos para uma melhor estimação de custos e tempo de execução- A implementação de uma resistência elétrica por uma série de resistores em vez de apenas 1, todos de mesma precisão
Teorema Central do LimiteAplicações Consideremos um o caso onde X1, X2,.. Xn,
além de variáveis aleatórias independentes, sejam identicamente distribuídas (como na estimação de parâmetros) e que tenham
E(Xi ) = e V(Xi ) = 2
Assim o teorema se reduz a:
)1,0(Nn
nSZ
nn
n
Teorema Central do Limite Sejam X1, X2,.. Xn, variáveis aleatórias
independentes e identicamente distribuídas. Temos:
)(...21 XE
n
XnXXn
Ou, a média aritmética das observações tendem ao valor esperado da variável aleatória X.
Aproximação da Binomialpela Normal A convergência é probabilística. Ela se fundamenta na existência da chamada
regularidade estatística. Essa lei é a base para a estimação de
parâmetros pelo método dos momentos (a ser vista).
Aproximação da Binomialpela Normal-1 Imaginemos o problema de dizer qual é a
probabilidade de uma moeda equilibrada, em 1000 lançamentos produzir entre 400 e 600 caras.
O processo segue uma distribuição Binomial mas o cálculo envolvido é laborioso demais.
O teorema central do limite é a chave para a solução.
Aproximação da Binomialpela Normal-2 Definição da Binomial com parâmetros n e p:
nkppk
nkXP knk
0,1
Utilizando a aproximação de Stirling:
2
)1()1(2
1
pnp
npk
2
1-exp
pnpkXP
Aproximação da Binomialpela Normal-3 Fazendo a transformação linear já conhecida:
chegamos à equivalência, quando n
)1()1( pnp
npk
pnp
npkZPkXP n
)1( pnp
npXZn
Intervalo de Confiança (I.C.)
Em estatística, inferências (a partir de dados) não são definitivas inquestionáveis: devem ser sempre apresentadas com os intervalos de confiança associados
Nós apenas medimos os fenômenos do mundo real em observações discretas e generalizamos as conclusões para todo o domínio
Há sempre um erro ao processo de generalização
Exemplos deAfirmações / Perguntas
O parâmetro se encontra no intervalo (a,b) com nível de confiança de 90%.
Os processos A e B são iguais com o nível de confiança de 95%.
Será o processo A melhor que o B com o nível de significância de 1% ?
Será que a condição K interfere no processo A com um nível de confiança de 95% ?
Intervalo de Confiança (I.C.)
P(a b) = 1 - onde: : valor esperado do parâmetro
(desconhecido)– (a,b): intervalo de confiança
(variável aleatória) : nível de significância–100(1 - ) “ de confiança– (1 - ) coeficiente de “
Métodos para Determinar oIntervalo de Confiança
Quantis de k médias Teorema Central do Limite (a partir de 1 média)
– Aproximação pela distribuição normal(n30)
– Aproximação pela distribuição t de Student(n<30)
Método dos Quantis de k Médias-1 Tomam-se k amostras {{1x1, 2x1,..., nx1},..., {1xk, 2xk,...,
nxk}} de n exemplos Calculam as k médias
n
jiji x
nx
1
1
},,,{ 21 kyyy
},,,{ 21 kxxx Colocam-se as k médias em ordem crescente
Método dos Quantis de k Médias-2
Tomam-se as [1+/2(k-1)] e [1+(1- /2)(k-1)]-ésimas médias como limites inferior e superior do I.C. de nível de significância , respectivamente
Exemplo: Quantis de 100 Médias a 90% de Nível de Confiança-1
Tomam-se 100 amostras {x1 , x2,.., xn} de n exemplos Calculam-se as 100 médias
n
jiji x
nx
1
1
},,,{ 10021 yyy
},,,,,,,{ 1009695651 yyyyyy a b
Colocam-se as 100 médias em ordem crescente
Toma as [1+0,05(100-1)] e [1+(1-0,05)(100-1)]-ésimas médias como limites inferior e superior
Métodos doTeorema Central do Limite-1
Toma-se 1 amostra {x1 , x2,.., xn} de n exemplos Calcula-se a média da amostra [segue uma V.A. de
distribuição N(,2/n)]
n
iix
nx
1
1
n
ii xx
ns
1
22 )(1
1
n
iiX
nX
1
1)(ˆ
2
1
22
1
1)(ˆ
n
ii XX
nS
Calcula-se a variância da amostra
Métodos doTeorema Central do Limite-2
Faz-se a transformação para a normal reduzida N(0,1)
ns
xXZ n
n
Consulta-se na tabela o quantil z[1-/2] da normal reduzida
Encontra o intervalo de confiança (a,b)
n
szxn
szxba )21()21( ,),(
Métodos doTeorema Central do Limite-3
Toma-se 1 amostra {x1 , x2,.., xn} de n exemplos Calcula-se a média da amostra [segue uma V.A. de
distribuição normal]
n
iix
nx
1
1
n
ii xx
ns
1
22 )(1
1
n
iiX
nX
1
1)(ˆ
2
1
22
1
1)(ˆ
n
ii XX
nS
Calcula-se a variância da amostra [uma V.A. de distribuição 2()]
Métodos doTeorema Central do Limite-4
Faz-se a transformação para a t de Student com graus de liberdade
Consulta-se na tabela o quantil t[1-/2;] da t de Student
Encontra o intervalo de confiança (a,b)
)(
)1,0(~)(
2
Nt
n
stxn
stxba nn )1;21()1;21( ,),(
Comparação entre os Métodos
Quantis de k médias– bom para interpretar Intervalo de Confiança
mas trabalhoso e caro Teorema Central do Limite (a partir de 1 média)
– Baixo custo mais utilizado
– Aproximação pela distribuição normal(n 30)
– Aproximação pela distribuição t de Student(n < 30 e desconhecido)
Intervalo de Confiança de um Lado Apenas
Se dois métodos são utilizados para produzir algum resultado, como poderemos afirmar que o método A seja melhor que o B?
Nesses casos, tomamos o intervalo de confiança do limite inferior a ou de - ao limite superior.