51
ESTATÍSTICA – Aula 7 Prof. Dr. Marco Antonio Leonel Caetano

ESTATÍSTICA – Aula 7 · t-Student F-Snedecor Gama Qui-Quadrado ... 0 2 4 6 8 10 12 14 16 18 20 22 ... IC média Z AMOST /2 AMOST /2 Valores da tabela normal. Exemplo

Embed Size (px)

Citation preview

ESTATÍSTICA – Aula 7

Prof. Dr. Marco Antonio Leonel Caetano

Distribuições de Probabilidade

DISCRETAS

(Números inteiros)

CONTÍNUAS

(Números reais)

Normalt-Student

F-SnedecorGamaQui-Quadrado

Binomial

PoissonGeométrica

Hiper-GeométricaPascal

O que é probabilidade ?

Contagem de sucessos Freqüência Absoluta

Freqüência Relativa

Grande número de experimentos (+)

nnLimP a

nA ∞→=

Distribuições Discretas

BINOMIAL

POISSON

( ) knk ppkn

kxP −−××⎟⎟⎠

⎞⎜⎜⎝

⎛== 1)(

Quando usar? DICOTOMIA

!)(

kekxP

kλ×==

λ−

Quando usar? Aproximação da Poisson

Distribuições Contínuas

380

420

460

500

540

580

0.3 0.5 0.7 0.9 1.1 1.3 0

2

4

6

8

10

12

14

16

18

20

22

Distribuição Normal

0

2

4

6

8

10

12

14

16

18

20

22

Teorema do Limite Central NORMALIZAÇÃO

O que é normalização?

probabilidade=área

2

)(2)(

)(2)(

2

2

dp

exfdp

médiax

π=

−−

dpmédiaxz −

=

Estimando Tendências

Estimação LinearModelo Matemático para identificação de padrão de tendênciaspróximas à retas.

X

Y

reta de regressão linear

b=tangente(angulo)

a

angulo

Determinando os Parâmetros

Coeficiente Linear

2

11

2

111ˆ

⎟⎟⎠

⎞⎜⎜⎝

⎛−

⎟⎟⎠

⎞⎜⎜⎝

⎛⎟⎟⎠

⎞⎜⎜⎝

⎛−

=

∑∑

∑∑∑

==

===

n

ii

n

ii

n

ii

n

ii

n

iii

xxn

yxyxnb

Coeficiente Angular

xbya ˆˆ −=xy

Média de x

Média de y

Tipos de ModeloLin-Lin

xbay ˆˆ +=

Log-Log

)ln(ˆˆ)ln( xbay +=

Lin-Log

)ln(ˆˆ xbay +=

Log-Lin

xbay ˆˆ)ln( +=

Aumento de 1 unidade em x Aumento b unidadesem y

Aumento de 1% em x Aumento de b%em y

Aumento de 1% em x Aumento b unidadesem y

Aumento de 1 unidade em xAumento de b%em y

A Correlação

O Coeficiente de Correlação

( )

2

11

22

11

2

1 11

⎟⎟⎠

⎞⎜⎜⎝

⎛−⎟

⎟⎠

⎞⎜⎜⎝

⎛−

⎟⎟⎠

⎞⎜⎜⎝

⎛⎟⎟⎠

⎞⎜⎜⎝

⎛−

=

∑∑∑∑

∑ ∑∑

====

= ==

n

ii

n

ii

n

ii

n

ii

n

i

n

ii

n

iiii

yynxxn

yxyxnr

Tratamento (Pb) para formação óssea em Mandíbulas

DIAS Densitometria

3 2,29

7 2,294

14 2,332

21 2,311

28 2,346

Tratamento (Pb) para formação óssea em Mandíbulas

Regression95% confid.

MODELO LIN-LINPB = 2.2853 + .00201 * DIA

Correlation: r = .84589

DIA

PB

2.285

2.295

2.305

2.315

2.325

2.335

2.345

2.355

0 6 12 18 24 30

Dureza de Resinas Compostas (Z100)

Profundidade Dureza

0,5 136,1

1,5 133,5

2,5 129,7

3,5 128,4

4,5 127,7

Dureza de Resinas Compostas (Z100)MODELO LOG-LOG

ln(y) = 4.896-0.031*ln(x)r = -0.98

LN (PROFUNDIDADE)

LN (

Dur

eza

Vic

kers

)

4.84

4.85

4.86

4.87

4.88

4.89

4.9

4.91

4.92

-1 -0.6 -0.2 0.2 0.6 1 1.4 1.8

Associação entre Atributos(Tabela de Contingências)

1 2 31 11,5 9,1 5,32 7,1 5,6 3,23 5,3 4,2 2,4

Respostas Estimadas

Valor Estimado = total da linha (célula) x total da coluna (célula)Total geral

Medir grau de associação entre perguntas e atributos

Aplicação em Questionários

Medir grau de correlação entre as respostas

Respostas Reais1 2 3 total

1 10 9 7 262 8 5 3 163 6 5 1 12

total 24 19 11 54

Distribuição de Qui-Quadrado

( )∑=

−=χ

n

1i

2

calculado2

)i(estimado_valor)i(estimado_valor)i(observado_valor

Coeficiente de Contingência (associação)

NC 2

2

+χχ

=N = total de obs.

( )( )1kC1Cr2 −−

=

Coeficiente de Correlação

K = no. colunas

INTERVALO DE CONFIANÇA PARA MÉDIA

Estimação Pontual

n

xx

n

1ii∑

==

Principal Falha Não Permite Conhecer aMagnitude do Erro

Solução Intervalo de confiança para desvio-padrãoconhecido

Intervalo de confiança para desvio-padrãodesconhecido

IC para desvio-padrão conhecido

2/Zα2/Zα− média

áreaα/2

áreaα /2 Área

(1-α)

⎥⎦⎤

⎢⎣⎡ ×+×−= αα n

desvioZmédia;n

desvioZdiaémIC POP2/

POP2/

IC para desvio-padrão desconhecido

POPULAÇÃO

amostra

2/Zα2/Zα− média

⎥⎦⎤

⎢⎣⎡ ×+×−= αα n

desvioZmédia;n

desvioZdiaémIC AMOST2/

AMOST2/

Valores da tabela normal

ExemploSuponha X a duração de vida útil de um sistema adesivo Scotch-Bond. Admite-se que sejam experimentados em certos tipos de dentes, com média de 50,2 dias. Supondo desvio-padrão conhecido e igual a 4 dias e que foram testados 100 dentes, deseja-se saber o IC para média de duração com 95% de confiança.

Área=2,5%Área=2,5% 47,5%47,5%

50,2 1,96-1,96

⎥⎦⎤

⎢⎣⎡ ×+×−=

10496,12,50;

10496,12,50IC =[ 49,41 ; 50,98 ]

IC para proporção

n)p1(pdesvio alproporcion

−=

[ ]alproporcionalproporcion desvioZpdesvioZpIC ×+×−= αα 2/2/ ;

Tamanho da Amostra•Para IC populacional

⎥⎦⎤

⎢⎣⎡ ×+×−= αα n

desvioZmédia;n

desvioZdiaémIC POP2/

POP2/

2POP2/

SemiAmpdesvioZn ⎟⎟

⎞⎜⎜⎝

⎛ ×= α

Semi-Amplitude

“Erro para mais ou para menos”

•Para IC amostral 2AMOST2/

SemiAmpdesvioZn ⎟⎟

⎞⎜⎜⎝

⎛ ×= α

•Para IC proporcional2

2/

SemiAmp)p1(pZ

n ⎟⎟⎠

⎞⎜⎜⎝

⎛ −×= α

Teste de HipótesesHIPÓTESES REJEITA-SE Ho QUANDO

•H0: μ = μ0•H1: μ < μ0 Zcal < -Ztab

-Ztab

•H0: μ = μ0•H1: μ > μ0 Zcal > Ztab

Ztab

•H0: μ = μ0•H1: μ ≠ μ0

| Zcal | > Ztab

-Ztab Ztab

Quem é Zcal?

AMOSTRAL

POPULACIONAL

n/sxZ 0

CALμ−

=

n/xZ 0

CAL σμ−

=

Desvio-padrãoamostral

Desvio-padrãopopulacional

Exemplo

Uma amostra forneceu os seguintes valores:8 10 5 9

Ao nível de 5% de significância, há evidência de que a média da população seja inferior a 11?

Como σ é desconhecido e a amostra é pequena, o cálculo deverá ser realizado utilizando a distribuição t- Student.

n/sxtcal

μ−=

Mas,

16,2s8x

==

77,24/16,2

118tcal −=−

=

⎩⎨⎧

<μ=μ

11:H11:H

1

0

Como tcal < ttab {-2,77 < -2,35 } REJEITA-SE H0

Então, ao nível de 5% ttab= t(0.95;3)= -2,35

ANÁLISE DE VARIÂNCIA

Importância

Planejamento de Experimentos

Interpretação de Experimentos

Teste de várias amostras de uma única vez para verificar sepertencem à mesma população

Baseia-se na decomposição da variância total existente entreas observações

Variânciatotal

Causas Desconhecidas

Causas Conhecidas

Erro(resíduo)

Variabilidade do Material Falta de Uniformidadedo Ambiente

Decomposição da Variância

Exigência Básica

Os ERROS ou RESÍDUOS devem ser distribuídos ao acaso e independentemente

Os ERROS ou RESÍDUOS devem terdistribuição Normal com média nula evariância finita

Distribuição dos Resíduos

-1

-0,5

0

0,5

1

0 5 10 15 20 25

amostragens

varia

ções

A AnáliseAdmitir: Populações independentes: P1, P2,...Pk

Médias das populações: m1, m2, ..., mkMesma variância: σ2

Problema: As populações têm ou não médias iguais?

TestarH0: m1=m2=.....=mk

H1: pelo menos uma média é diferente

Variabilidade em Amostragens

-0,050

0,05

0,10,150,2

0,250,3

0,350,4

0,45

-4,5 -2,5 -0,5 1,5 3,5

valor da variável

prob

abili

dade

O Box-Plot da Variância

±Desvio Padrão

±Erro Padrão

Média

valores amostrados

-5

-3

-1

1

3

5

7

POP1 POP2 POP3 POP4

Histograma das Amostragens das Populações

Núm

ero

de A

mos

trage

ns

POP1

02468

1012

-7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8POP2

-7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8

POP3

02468

1012

-7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8POP4

-7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8

Decomposição da Variância TotalTRATAMENTO

ITRATAMENTO

IITRATAMENTO

IIITRATAMENTO

IV

AMOSTRA-1 X11 X12 X13 X14

AMOSTRA-2 X21 X22 X23 X24

AMOSTRA-3 X31 X32 X33 X34

AMOSTRA-4 X41 X42 X43 X44

AMOSTRA-5 X51 X52 X53 X54

médias x1 x2 x3 x4

Número de Obs: n1 n2 n3 n4

TOTAL DE OBS: n= n1 + n2 + n3 + n4

Médias

MÉDIA GERALk

xxxx k21 +++=

K

MÉDIA PONDERADA(para tamanho de amostras diferentes)

nxnxnxnx kk2211 ×++×+×

=K

CAUSAS DA VARIABILIDADE

Entre Tratamentos (amostras)

( )2k

1iii1 xxnQ ∑

=

−=

Sendo “k” o número de tratamentos:

TRATAMENTOI

TRATAMENTOII

TRATAMENTOIII

TRATAMENTOIV

AMOSTRA-1 X11 X12 X13 X14

AMOSTRA-2 X21 X22 X23 X24

AMOSTRA-3 X31 X32 X33 X34

AMOSTRA-4 X41 X42 X43 X44

AMOSTRA-5 X51 X52 X53 X54

x1 x2 x3 x4

xMédia geral

( )21 xx −+

( )22 xx −

( )23 xx −

( )24 xx −

+

+

CAUSAS DA VARIABILIDADE

Quadrado Médio ( estimador da variância entre as amostras)

1kQQM 1

1 −=

CAUSAS DA VARIABILIDADE

Dentro dos Tratamentos (amostras) [resíduo] ( )∑∑= =

−=kn

1i

k

1j

2ij,i2 xxQ

TRATAMENTOI

TRATAMENTOII

TRATAMENTOIII

TRATAMENTOIV

AMOSTRA-1 X11 X12 X13 X14

AMOSTRA-2 X21 X22 X23 X24

AMOSTRA-3 X31 X32 X33 X34

AMOSTRA-4 X41 X42 X43 X44

AMOSTRA-5 X51 X52 X53 X54

CAUSAS DA VARIABILIDADE

Quadrado Médio ( estimador da variância dentro das amostras)

knQQM 2

2 −=

Distribuição F-Snedecor

Ftabelado = F(nível significância, k-1, n-k)

2

1calculado QM

QMF =

REGRA DE DECISÃO

•Se Fcalculado < Ftabelado ENTÃO H0 : verdade•Se Fcalculado > Ftabelado ENTÃO H0 : falso•Se Fcalculado < 1 ENTÃO erro de amostragem

Testes Não Paramétricos

• Teste dos Sinais: utilizado para análise de dados emparelhados ( duas observações para a mesma medida).

• Teste de Wilcoxon: igual ao teste dos sinais. Mas é mais poderoso pois leva em conta a magnitude da diferença de cada par.

• Teste de Mann-Whitney: Serve para testar se duas amostras vieram de populações com médias iguais.

• Teste de Kruskal-Wallis: Serve para decidir se k amostras(k>2) vieram de populações com médias iguais.

Teste dos Sinais•Faz-se as diferenças entre as duas medidas.•Utiliza-se sinal: “+” alteração maior na segunda medida

“-” alteração menor na segunda medida“0” alteração igual na segunda medida

•As medidas serão iguais quando a quantidade de “+” e “-” forem de mesmaproporção. A quantidade de sinal vale p = 0.5 (50%)

•Fixar o erro α. Escolher a distribuição normal N(0,1) caso n>30 ou binomialse n<30.•Calcular

onde y: número de sinais “+”n: tamanho da amostra descontados os empates.p = 0.5

•Regra de Decisão: Aceitar H0 = as medidas são iguais se

)p1(pnpnyzcal −××

×−=

2/cal2/ zzz αα ≤≤−

ExemploDois examinadores forneceram escores para um experimento de 20 dentes com penetração de corantesapós alta rotação de broca + ScotchBond na margem oclusal. Ao nível de 5% os examinadores fornecemo mesmo valor de escores?

Examinador1

Examinador2

0 40 02 31 11 20 44 14 40 10 20 04 43 34 40 03 44 32 31 12 2

SINAL+0+0++-0++00000+-+00

y= 8n= 10

=××

×−=

−×××−

=5,05,010

5,0108)p1(pn

pnyzcal 1,8973

96,1z 2/ =α

2/cal2/ zzz αα ≤≤−Como

Conclui-se que os dois escoresfornecidos estão calibrados

Teste de Wilcoxon•Faz-se as diferenças para cada par di.•Atribui-se postos (colocar em ordem crescente) a todos os di desconsiderando os sinais. Os zeros não contam.•Determinar T = a menor soma de postos de mesmo sinal.•Descontar de “n” o número de zeros, isto é, di = 0.•Fixar o erro α•Calcular

onde

T: menor das somas dos postos de mesmo sinal.•Regra de Decisão: Aceitar H0 = os grupos são iguais se

24/)1n2()1n(n4

)1n(nTzcal +××+×

+×−

=

2/cal2/ zzz αα ≤≤−

ExemploDois examinadores forneceram escores para um experimento de 20 dentes com penetração de corantesapós alta rotação de broca + ScotchBond na margem oclusal. Ao nível de 5% os examinadores fornecemo mesmo valor de escores?

Examinador1

Examinador2

0 40 02 31 11 20 44 14 40 10 20 04 43 34 40 03 44 32 31 12 2

di

-40-10-1-430-1-200000-11-100

Depois do zero o primeiro númerodas diferenças é 1. Assim, os 6primeiros números em ordem crescentes são 1. Logo o posto médiopara o número 1:

Existem 2 números 4, logo o posto médio será:

00000000

5,36

216

654321)1(posto ==+++++

=

000

5,92109)4(posto =

+=

Examinador1

Examinador2

0 40 02 31 11 20 44 14 40 10 20 04 43 34 40 03 44 32 31 12 2

Soma dos Postos 11,5 43,5

di Postos (+) Postos(-)-4 9,50-1 3,50-1 3,5-4 9,53 80-1 3,5-2 700000-1 3,51 3,5-1 3,500

Menor postoT=11,5

Assim,

n = 20 - 10(zeros) = 10

63,181,9

5,275,1124/)120)(110(10

4)110(105,11

24/)1n2()1n(n4

)1n(nTzcal −=

−=

++

+−

=+××+×

+×−

=

Para 5% de significância 96,1z 2/ =α

Logo, aceita-se H0 pois 96,1z96,1 cal ≤≤−

Os dois escores estão calibrados.

Teste de Mann-Whitney•Considerar

n1 = número de casos do menor grupo.n2 = número de casos do maior grupo.

•Colocar os dados em ordem crescente. ( O zero agora entra neste teste )•Calcular

R1 = soma dos postos do grupo n1.R2 = soma dos postos do grupo n2.

•Escolher a menor soma entre R1 e R2 .•Calcular a estatística:

ou

•Fixar o erro α•Calcular

onde

•Regra de Decisão: Aceitar H0 = os grupos são iguais se

12/)1nn(nn2

nn

z2121

212ou1

cal ++××

×−μ

=

2/cal2/ zzz αα ≤≤−

( )1

11211 R

21nnnn −

++×=μ

( )2

22212 R

21nnnn −

++×=μ

ExemploMicro-infiltração na margem oclusal para nível de 5%. O tratamento à Laser tem a mesma eficiênciado que o padrão?

AltaRotação +Ácido

Laser +Ácido

0 10 00 11 11 11 10 11 10 01 20 00 1

AltaRotação

Laser

5,5 175,5 5,55,5 1717 1717 1717 175,5 1717 175,5 5,517 245,5 5,55,5 17

0000

5,510

1021)0(posto =+++

=K

0000

1713

231211)1(posto =+++

=K

024)2(posto =

Soma dos Postos R1= 123,5 R2= 43,5

Menor Posto

( )1

11211 R

21nnnn −

++×=μ

12/)1nn(nn2

nn

z2121

212ou1

cal ++××

×−μ

=

5,1232

13121212 −×

+×=

( ) 12/1121212122

12125,98

++××

×−

=

5,981 =μ

1,53

Logo, aceita-se H0 pois 96,1z96,1 cal ≤≤−

O tratamento a laser tem a mesma eficiência do padrão.

Teste de Kruskal-Wallis•Colocar os dados em ordem crescente de postos. Caso haja empate atribuir o posto médio.•Calcular a soma dos postos

R1 = soma dos postos do grupo 1.R2 = soma dos postos do grupo 2.: :Rn = soma dos postos do grupo n.

•Fixar o erro α. Escolher uma variável qui-quadrado com k-1 graus de liberdade.•Calcular a estatística:

•Regra de Decisão: Aceitar H0 = os grupos são iguais se

Rejeitar H0 , há pelo menos um grupo diferente se

)1n(3nR

)1n(n12H

k

1i i

2i +×−⎭⎬⎫

⎩⎨⎧

×+×

= ∑=

21kH −χ<

21kH −χ>

ExemploTestar ao nível de 5% a hipótese de igualdade das médias para os 3 grupos de alunos que foramsubmetidos a esquemas diferenciados de aulas. As notas foram registradas para uma mesma prova.

AulaExpositiva

Aula comrecursoaudio-visual

Ensinoprogramado

65 60 6162 71 6968 66 6770 63 7260 64 74

59

000

5,22

32)2(posto =+

=

AulaExpositiva

Aula comrecursoaudio-visual

Ensinoprogramado

8 2,5 45 14 12

11 9 1013 6 152,5 7 16

1

Postos

99,522),05,0(

21k, =χ=χ −α

Qui-quadrado tabelado

R1= 39,5 R2= 39,5 R3= 57

Cálculo de H

)116(35

R6

R5

R)116(16

12H23

22

21 +−⎥

⎤⎢⎣

⎡++

+= =2,9

99,59,2H <=

Logo, aceita-se H0 pois

Os esquemas podem ser consideradosestatísticamente iguais a 5%