Upload
nguyenbao
View
213
Download
0
Embed Size (px)
Citation preview
Distribuições de Probabilidade
DISCRETAS
(Números inteiros)
CONTÍNUAS
(Números reais)
Normalt-Student
F-SnedecorGamaQui-Quadrado
Binomial
PoissonGeométrica
Hiper-GeométricaPascal
O que é probabilidade ?
Contagem de sucessos Freqüência Absoluta
Freqüência Relativa
Grande número de experimentos (+)
nnLimP a
nA ∞→=
Distribuições Discretas
BINOMIAL
POISSON
( ) knk ppkn
kxP −−××⎟⎟⎠
⎞⎜⎜⎝
⎛== 1)(
Quando usar? DICOTOMIA
!)(
kekxP
kλ×==
λ−
Quando usar? Aproximação da Poisson
Distribuições Contínuas
380
420
460
500
540
580
0.3 0.5 0.7 0.9 1.1 1.3 0
2
4
6
8
10
12
14
16
18
20
22
Distribuição Normal
0
2
4
6
8
10
12
14
16
18
20
22
Teorema do Limite Central NORMALIZAÇÃO
Estimação LinearModelo Matemático para identificação de padrão de tendênciaspróximas à retas.
X
Y
reta de regressão linear
b=tangente(angulo)
a
angulo
Determinando os Parâmetros
Coeficiente Linear
2
11
2
111ˆ
⎟⎟⎠
⎞⎜⎜⎝
⎛−
⎟⎟⎠
⎞⎜⎜⎝
⎛⎟⎟⎠
⎞⎜⎜⎝
⎛−
=
∑∑
∑∑∑
==
===
n
ii
n
ii
n
ii
n
ii
n
iii
xxn
yxyxnb
Coeficiente Angular
xbya ˆˆ −=xy
Média de x
Média de y
Tipos de ModeloLin-Lin
xbay ˆˆ +=
Log-Log
)ln(ˆˆ)ln( xbay +=
Lin-Log
)ln(ˆˆ xbay +=
Log-Lin
xbay ˆˆ)ln( +=
Aumento de 1 unidade em x Aumento b unidadesem y
Aumento de 1% em x Aumento de b%em y
Aumento de 1% em x Aumento b unidadesem y
Aumento de 1 unidade em xAumento de b%em y
O Coeficiente de Correlação
( )
2
11
22
11
2
1 11
⎟⎟⎠
⎞⎜⎜⎝
⎛−⎟
⎟⎠
⎞⎜⎜⎝
⎛−
⎟⎟⎠
⎞⎜⎜⎝
⎛⎟⎟⎠
⎞⎜⎜⎝
⎛−
=
∑∑∑∑
∑ ∑∑
====
= ==
n
ii
n
ii
n
ii
n
ii
n
i
n
ii
n
iiii
yynxxn
yxyxnr
Tratamento (Pb) para formação óssea em Mandíbulas
DIAS Densitometria
3 2,29
7 2,294
14 2,332
21 2,311
28 2,346
Tratamento (Pb) para formação óssea em Mandíbulas
Regression95% confid.
MODELO LIN-LINPB = 2.2853 + .00201 * DIA
Correlation: r = .84589
DIA
PB
2.285
2.295
2.305
2.315
2.325
2.335
2.345
2.355
0 6 12 18 24 30
Dureza de Resinas Compostas (Z100)
Profundidade Dureza
0,5 136,1
1,5 133,5
2,5 129,7
3,5 128,4
4,5 127,7
Dureza de Resinas Compostas (Z100)MODELO LOG-LOG
ln(y) = 4.896-0.031*ln(x)r = -0.98
LN (PROFUNDIDADE)
LN (
Dur
eza
Vic
kers
)
4.84
4.85
4.86
4.87
4.88
4.89
4.9
4.91
4.92
-1 -0.6 -0.2 0.2 0.6 1 1.4 1.8
Associação entre Atributos(Tabela de Contingências)
1 2 31 11,5 9,1 5,32 7,1 5,6 3,23 5,3 4,2 2,4
Respostas Estimadas
Valor Estimado = total da linha (célula) x total da coluna (célula)Total geral
Medir grau de associação entre perguntas e atributos
Aplicação em Questionários
Medir grau de correlação entre as respostas
Respostas Reais1 2 3 total
1 10 9 7 262 8 5 3 163 6 5 1 12
total 24 19 11 54
Distribuição de Qui-Quadrado
( )∑=
−=χ
n
1i
2
calculado2
)i(estimado_valor)i(estimado_valor)i(observado_valor
Coeficiente de Contingência (associação)
NC 2
2
+χχ
=N = total de obs.
( )( )1kC1Cr2 −−
=
Coeficiente de Correlação
K = no. colunas
INTERVALO DE CONFIANÇA PARA MÉDIA
Estimação Pontual
n
xx
n
1ii∑
==
Principal Falha Não Permite Conhecer aMagnitude do Erro
Solução Intervalo de confiança para desvio-padrãoconhecido
Intervalo de confiança para desvio-padrãodesconhecido
IC para desvio-padrão conhecido
2/Zα2/Zα− média
áreaα/2
áreaα /2 Área
(1-α)
⎥⎦⎤
⎢⎣⎡ ×+×−= αα n
desvioZmédia;n
desvioZdiaémIC POP2/
POP2/
IC para desvio-padrão desconhecido
POPULAÇÃO
amostra
2/Zα2/Zα− média
⎥⎦⎤
⎢⎣⎡ ×+×−= αα n
desvioZmédia;n
desvioZdiaémIC AMOST2/
AMOST2/
Valores da tabela normal
ExemploSuponha X a duração de vida útil de um sistema adesivo Scotch-Bond. Admite-se que sejam experimentados em certos tipos de dentes, com média de 50,2 dias. Supondo desvio-padrão conhecido e igual a 4 dias e que foram testados 100 dentes, deseja-se saber o IC para média de duração com 95% de confiança.
Área=2,5%Área=2,5% 47,5%47,5%
50,2 1,96-1,96
⎥⎦⎤
⎢⎣⎡ ×+×−=
10496,12,50;
10496,12,50IC =[ 49,41 ; 50,98 ]
IC para proporção
n)p1(pdesvio alproporcion
−=
[ ]alproporcionalproporcion desvioZpdesvioZpIC ×+×−= αα 2/2/ ;
Tamanho da Amostra•Para IC populacional
⎥⎦⎤
⎢⎣⎡ ×+×−= αα n
desvioZmédia;n
desvioZdiaémIC POP2/
POP2/
2POP2/
SemiAmpdesvioZn ⎟⎟
⎠
⎞⎜⎜⎝
⎛ ×= α
Semi-Amplitude
“Erro para mais ou para menos”
•Para IC amostral 2AMOST2/
SemiAmpdesvioZn ⎟⎟
⎠
⎞⎜⎜⎝
⎛ ×= α
•Para IC proporcional2
2/
SemiAmp)p1(pZ
n ⎟⎟⎠
⎞⎜⎜⎝
⎛ −×= α
Teste de HipótesesHIPÓTESES REJEITA-SE Ho QUANDO
•H0: μ = μ0•H1: μ < μ0 Zcal < -Ztab
-Ztab
•H0: μ = μ0•H1: μ > μ0 Zcal > Ztab
Ztab
•H0: μ = μ0•H1: μ ≠ μ0
| Zcal | > Ztab
-Ztab Ztab
Quem é Zcal?
AMOSTRAL
POPULACIONAL
n/sxZ 0
CALμ−
=
n/xZ 0
CAL σμ−
=
Desvio-padrãoamostral
Desvio-padrãopopulacional
Exemplo
Uma amostra forneceu os seguintes valores:8 10 5 9
Ao nível de 5% de significância, há evidência de que a média da população seja inferior a 11?
Como σ é desconhecido e a amostra é pequena, o cálculo deverá ser realizado utilizando a distribuição t- Student.
n/sxtcal
μ−=
Mas,
16,2s8x
==
77,24/16,2
118tcal −=−
=
⎩⎨⎧
<μ=μ
11:H11:H
1
0
Como tcal < ttab {-2,77 < -2,35 } REJEITA-SE H0
Então, ao nível de 5% ttab= t(0.95;3)= -2,35
ANÁLISE DE VARIÂNCIA
Importância
Planejamento de Experimentos
Interpretação de Experimentos
Teste de várias amostras de uma única vez para verificar sepertencem à mesma população
Baseia-se na decomposição da variância total existente entreas observações
Variânciatotal
Causas Desconhecidas
Causas Conhecidas
Erro(resíduo)
Variabilidade do Material Falta de Uniformidadedo Ambiente
Decomposição da Variância
Exigência Básica
Os ERROS ou RESÍDUOS devem ser distribuídos ao acaso e independentemente
Os ERROS ou RESÍDUOS devem terdistribuição Normal com média nula evariância finita
Distribuição dos Resíduos
-1
-0,5
0
0,5
1
0 5 10 15 20 25
amostragens
varia
ções
A AnáliseAdmitir: Populações independentes: P1, P2,...Pk
Médias das populações: m1, m2, ..., mkMesma variância: σ2
Problema: As populações têm ou não médias iguais?
TestarH0: m1=m2=.....=mk
H1: pelo menos uma média é diferente
Variabilidade em Amostragens
-0,050
0,05
0,10,150,2
0,250,3
0,350,4
0,45
-4,5 -2,5 -0,5 1,5 3,5
valor da variável
prob
abili
dade
O Box-Plot da Variância
±Desvio Padrão
±Erro Padrão
Média
valores amostrados
-5
-3
-1
1
3
5
7
POP1 POP2 POP3 POP4
Histograma das Amostragens das Populações
Núm
ero
de A
mos
trage
ns
POP1
02468
1012
-7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8POP2
-7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8
POP3
02468
1012
-7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8POP4
-7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8
Decomposição da Variância TotalTRATAMENTO
ITRATAMENTO
IITRATAMENTO
IIITRATAMENTO
IV
AMOSTRA-1 X11 X12 X13 X14
AMOSTRA-2 X21 X22 X23 X24
AMOSTRA-3 X31 X32 X33 X34
AMOSTRA-4 X41 X42 X43 X44
AMOSTRA-5 X51 X52 X53 X54
médias x1 x2 x3 x4
Número de Obs: n1 n2 n3 n4
TOTAL DE OBS: n= n1 + n2 + n3 + n4
Médias
MÉDIA GERALk
xxxx k21 +++=
K
MÉDIA PONDERADA(para tamanho de amostras diferentes)
nxnxnxnx kk2211 ×++×+×
=K
CAUSAS DA VARIABILIDADE
Entre Tratamentos (amostras)
( )2k
1iii1 xxnQ ∑
=
−=
Sendo “k” o número de tratamentos:
TRATAMENTOI
TRATAMENTOII
TRATAMENTOIII
TRATAMENTOIV
AMOSTRA-1 X11 X12 X13 X14
AMOSTRA-2 X21 X22 X23 X24
AMOSTRA-3 X31 X32 X33 X34
AMOSTRA-4 X41 X42 X43 X44
AMOSTRA-5 X51 X52 X53 X54
x1 x2 x3 x4
xMédia geral
( )21 xx −+
( )22 xx −
( )23 xx −
( )24 xx −
+
+
CAUSAS DA VARIABILIDADE
Dentro dos Tratamentos (amostras) [resíduo] ( )∑∑= =
−=kn
1i
k
1j
2ij,i2 xxQ
TRATAMENTOI
TRATAMENTOII
TRATAMENTOIII
TRATAMENTOIV
AMOSTRA-1 X11 X12 X13 X14
AMOSTRA-2 X21 X22 X23 X24
AMOSTRA-3 X31 X32 X33 X34
AMOSTRA-4 X41 X42 X43 X44
AMOSTRA-5 X51 X52 X53 X54
CAUSAS DA VARIABILIDADE
Quadrado Médio ( estimador da variância dentro das amostras)
knQQM 2
2 −=
Distribuição F-Snedecor
Ftabelado = F(nível significância, k-1, n-k)
2
1calculado QM
QMF =
REGRA DE DECISÃO
•Se Fcalculado < Ftabelado ENTÃO H0 : verdade•Se Fcalculado > Ftabelado ENTÃO H0 : falso•Se Fcalculado < 1 ENTÃO erro de amostragem
Testes Não Paramétricos
• Teste dos Sinais: utilizado para análise de dados emparelhados ( duas observações para a mesma medida).
• Teste de Wilcoxon: igual ao teste dos sinais. Mas é mais poderoso pois leva em conta a magnitude da diferença de cada par.
• Teste de Mann-Whitney: Serve para testar se duas amostras vieram de populações com médias iguais.
• Teste de Kruskal-Wallis: Serve para decidir se k amostras(k>2) vieram de populações com médias iguais.
Teste dos Sinais•Faz-se as diferenças entre as duas medidas.•Utiliza-se sinal: “+” alteração maior na segunda medida
“-” alteração menor na segunda medida“0” alteração igual na segunda medida
•As medidas serão iguais quando a quantidade de “+” e “-” forem de mesmaproporção. A quantidade de sinal vale p = 0.5 (50%)
•Fixar o erro α. Escolher a distribuição normal N(0,1) caso n>30 ou binomialse n<30.•Calcular
onde y: número de sinais “+”n: tamanho da amostra descontados os empates.p = 0.5
•Regra de Decisão: Aceitar H0 = as medidas são iguais se
)p1(pnpnyzcal −××
×−=
2/cal2/ zzz αα ≤≤−
ExemploDois examinadores forneceram escores para um experimento de 20 dentes com penetração de corantesapós alta rotação de broca + ScotchBond na margem oclusal. Ao nível de 5% os examinadores fornecemo mesmo valor de escores?
Examinador1
Examinador2
0 40 02 31 11 20 44 14 40 10 20 04 43 34 40 03 44 32 31 12 2
SINAL+0+0++-0++00000+-+00
y= 8n= 10
=××
×−=
−×××−
=5,05,010
5,0108)p1(pn
pnyzcal 1,8973
96,1z 2/ =α
2/cal2/ zzz αα ≤≤−Como
Conclui-se que os dois escoresfornecidos estão calibrados
Teste de Wilcoxon•Faz-se as diferenças para cada par di.•Atribui-se postos (colocar em ordem crescente) a todos os di desconsiderando os sinais. Os zeros não contam.•Determinar T = a menor soma de postos de mesmo sinal.•Descontar de “n” o número de zeros, isto é, di = 0.•Fixar o erro α•Calcular
onde
T: menor das somas dos postos de mesmo sinal.•Regra de Decisão: Aceitar H0 = os grupos são iguais se
24/)1n2()1n(n4
)1n(nTzcal +××+×
+×−
=
2/cal2/ zzz αα ≤≤−
ExemploDois examinadores forneceram escores para um experimento de 20 dentes com penetração de corantesapós alta rotação de broca + ScotchBond na margem oclusal. Ao nível de 5% os examinadores fornecemo mesmo valor de escores?
Examinador1
Examinador2
0 40 02 31 11 20 44 14 40 10 20 04 43 34 40 03 44 32 31 12 2
di
-40-10-1-430-1-200000-11-100
Depois do zero o primeiro númerodas diferenças é 1. Assim, os 6primeiros números em ordem crescentes são 1. Logo o posto médiopara o número 1:
Existem 2 números 4, logo o posto médio será:
00000000
5,36
216
654321)1(posto ==+++++
=
000
5,92109)4(posto =
+=
Examinador1
Examinador2
0 40 02 31 11 20 44 14 40 10 20 04 43 34 40 03 44 32 31 12 2
Soma dos Postos 11,5 43,5
di Postos (+) Postos(-)-4 9,50-1 3,50-1 3,5-4 9,53 80-1 3,5-2 700000-1 3,51 3,5-1 3,500
Menor postoT=11,5
Assim,
n = 20 - 10(zeros) = 10
63,181,9
5,275,1124/)120)(110(10
4)110(105,11
24/)1n2()1n(n4
)1n(nTzcal −=
−=
++
+−
=+××+×
+×−
=
Para 5% de significância 96,1z 2/ =α
Logo, aceita-se H0 pois 96,1z96,1 cal ≤≤−
Os dois escores estão calibrados.
Teste de Mann-Whitney•Considerar
n1 = número de casos do menor grupo.n2 = número de casos do maior grupo.
•Colocar os dados em ordem crescente. ( O zero agora entra neste teste )•Calcular
R1 = soma dos postos do grupo n1.R2 = soma dos postos do grupo n2.
•Escolher a menor soma entre R1 e R2 .•Calcular a estatística:
ou
•Fixar o erro α•Calcular
onde
•Regra de Decisão: Aceitar H0 = os grupos são iguais se
12/)1nn(nn2
nn
z2121
212ou1
cal ++××
×−μ
=
2/cal2/ zzz αα ≤≤−
( )1
11211 R
21nnnn −
++×=μ
( )2
22212 R
21nnnn −
++×=μ
ExemploMicro-infiltração na margem oclusal para nível de 5%. O tratamento à Laser tem a mesma eficiênciado que o padrão?
AltaRotação +Ácido
Laser +Ácido
0 10 00 11 11 11 10 11 10 01 20 00 1
AltaRotação
Laser
5,5 175,5 5,55,5 1717 1717 1717 175,5 1717 175,5 5,517 245,5 5,55,5 17
0000
5,510
1021)0(posto =+++
=K
0000
1713
231211)1(posto =+++
=K
024)2(posto =
Soma dos Postos R1= 123,5 R2= 43,5
Menor Posto
( )1
11211 R
21nnnn −
++×=μ
12/)1nn(nn2
nn
z2121
212ou1
cal ++××
×−μ
=
5,1232
13121212 −×
+×=
( ) 12/1121212122
12125,98
++××
×−
=
5,981 =μ
1,53
Logo, aceita-se H0 pois 96,1z96,1 cal ≤≤−
O tratamento a laser tem a mesma eficiência do padrão.
Teste de Kruskal-Wallis•Colocar os dados em ordem crescente de postos. Caso haja empate atribuir o posto médio.•Calcular a soma dos postos
R1 = soma dos postos do grupo 1.R2 = soma dos postos do grupo 2.: :Rn = soma dos postos do grupo n.
•Fixar o erro α. Escolher uma variável qui-quadrado com k-1 graus de liberdade.•Calcular a estatística:
•Regra de Decisão: Aceitar H0 = os grupos são iguais se
Rejeitar H0 , há pelo menos um grupo diferente se
)1n(3nR
)1n(n12H
k
1i i
2i +×−⎭⎬⎫
⎩⎨⎧
×+×
= ∑=
21kH −χ<
21kH −χ>
ExemploTestar ao nível de 5% a hipótese de igualdade das médias para os 3 grupos de alunos que foramsubmetidos a esquemas diferenciados de aulas. As notas foram registradas para uma mesma prova.
AulaExpositiva
Aula comrecursoaudio-visual
Ensinoprogramado
65 60 6162 71 6968 66 6770 63 7260 64 74
59
000
5,22
32)2(posto =+
=
AulaExpositiva
Aula comrecursoaudio-visual
Ensinoprogramado
8 2,5 45 14 12
11 9 1013 6 152,5 7 16
1
Postos
99,522),05,0(
21k, =χ=χ −α
Qui-quadrado tabelado
R1= 39,5 R2= 39,5 R3= 57
Cálculo de H
)116(35
R6
R5
R)116(16
12H23
22
21 +−⎥
⎦
⎤⎢⎣
⎡++
+= =2,9
99,59,2H <=
Logo, aceita-se H0 pois
Os esquemas podem ser consideradosestatísticamente iguais a 5%