Upload
jessicasjs
View
213
Download
0
Embed Size (px)
Citation preview
8/20/2019 ANOVA 1 Fator Prof. Ivan
1/12
Análise de Variância (ANOVA) 1 fator
Queremos determinar se a diferença observada entre duas médias amostrais♣ é
devida, apenas, às variações aleatórias de uma amostra a outra, ou se os dados vêm de
populações onde as médias são verdadeiramente diferentes. Esse é um outro modo de dizer
que nós queremos descobrir se a diferença entre as médias é estatisticamente diferente. Enfim,
mesmo que nós possamos concluir que as médias são diferentes, nós também temos de decidir
se elas diferem o suficiente para poderem ser consideradas de importncia pr!tica "cl#nica$.
%amos considerar três situações "&, ' e ($ onde os )rupos (ontrole e *ratado
apresentam a mesma média amostral, porém, diferem em termos de variabilidade "em
dispersão, ou se+a, em desviopadrão$.
C T C T C T
0
1
2
3
4
5
6
7
8
9
10
caso A caso B caso C
m
m
( - )rupo controle
* - )rupo tratado
Caso A: duas médias diferentes "não podemos dizer outra coisa, senão que diferem
numericamente$.
Caso B: as mesmas duas médias "de &$ com valores bem dispersos "a diferença não é
estatisticamente si)nificante$. evido à dispersão, a diferença não é muito convincente.
Caso C: as mesmas médias "as duas de & e '$ com valores concentrados "pró/imos ao valor médio$. 0esse caso, 1! diferença estatisticamente si)nificante.
O teste t (de Student) para a diferença entre duas médias é um caso especial de análise de
variância (ANOVA 1 fator). A fórmula para t pode ser epressa para !. Vale a relaç"o# ! $ t %.
8/20/2019 ANOVA 1 Fator Prof. Ivan
2/12
2 problema é como decidir quando as médias são diferentes, em relação à
dispersão dos valores em cada )rupo, a fim de concluir se 1! diferença estatisticamente
si)nificante entre as médias.
& an!lise de varincia a+udanos a responder esta questão.
2 que temos a fazer é descobrir um modo de avaliar "medir$ numericamente o
quão diferentes são as médias e quanto as observações se afastam "encontramse dispersas$ ao
redor das respectivas médias.
(om essas duas medidas "avaliações$ à nossa disposição, somos capazes de dizer
se as médias diferem si)nificantemente ou não.
A idéia da Análise de Variância
Esta é a idéia principal para a comparação de médias3 o que importa não é o quanto
as médias amostrais estão distantes , mas o quão distantes estão relativamente & varia'ilidade
de o'servaçes individuais.
& &02%& compara a variação resultante de fontes espec#ficas com a variação
entre indiv#duos que deveriam ser semel1antes. Em particular, a &02%& testa se v!rias
populações têm a mesma média, comparando o afastamento entre as médias amostrais com a
variação e/istente dentro das amostras.
& &02%& pressupõe que podemos decompor cada valor observado em três termos
aditivos4 ou se+a, nós somos capazes de escrever cada observação como uma soma de três
termos. & decomposição pode ser escrita como3
%alor obtido "/$ - média )eral "5$ 6 desvio da média do )rupo em relação à média )eral "
5$ 6 desvio "7i+ $ entre o valor observado em relação à média do )rupo " / $ ou
ata - fit 6 residue "error$
2 modelo formal de &02%& "8 fator $ é3 /i+ - 5 6 9i+ 6 7i+
/i+ : são os valores observados em cada )rupoi : referese ao )rupo
+ : referese à observação dentro do )rupo
5 : é uma constante "é a média )eral$7 : são os termos residuais "diferença entre o valor observado e o fit, modelo a+ustado$
;
8/20/2019 ANOVA 1 Fator Prof. Ivan
3/12
2bservação. - variação "entre médias amostrais$ / variação "entre indiv#duos dentro das amostras$
&s medidas de variação no numerador e denominador de > são c1amadas de médias
quadr!ticas. ?ma média quadr!tica é uma forma mais )eral de uma varincia amostral. ?ma
varincia amostral usual s; é uma média dos desvios quadr!ticos das observações a partir de
suas médias, lo)o se qualifica de @média quadr!ticaA.
& estat#stica > testa a 1ipótese nula de que todas as populações têm a mesma média3
Bo3 C8 - C; - CD- .. - C *
Ba3 nem todos os C são i)uais
tem distribuição > com 8 e 0 )raus de
liberdade.
D
8/20/2019 ANOVA 1 Fator Prof. Ivan
4/12
Exe!lo resol"ido:
0a *abela 8, mostrada a se)uir, temos cinco )rupos com cinco observações em cada
)rupo. Queremos saber @as diferenças nas médias amostrais são variações aleatórias que
ocorrem apenas devido ao acaso " +ust ', c-ance$ ou se e/istem diferenças sistem!ticas entre
as médiasA.
*abela 8. ados obtidos em cinco )rupos num e/perimento inteiramente casualizado com
cinco réplicas.
A B C # E
F G H I D
F J H I H
F J I F H
J J F F HK K F J I
édias aostrais ( $$ % & '
édia eral * '
O+ser"a,-o:
Lrimeira re)ra de an!lise de dados3 @maMe a pictureA
8/20/2019 ANOVA 1 Fator Prof. Ivan
5/12
Valores
G r u p o s
109876543210
A
B
C
D
E
Dotplot of Valores vs Grupos
9876543
Dotplot for A-E
A
B
C
D
E
MeaMea !- 1 "tDe
Descriptive Statistics: A, B, C, D, E
Grupos N Média DP CoefVar (%)
A 5 7.000 1.414 20.20
B 5 .000 0.707 .4
C 5 5.000 1.000 20.00
D 5 !.000 1.225 20.41
" 5 4.000 0.707 17.!
O+s.: 8.H8H é o dobro de N.GNG
I
8/20/2019 ANOVA 1 Fator Prof. Ivan
6/12
esol0,-o:2 entre r0!os: n( 3 4)5
6r0!o AOn#cio Efeito
tratamento
rupo
"/$
Pes#duo "+o)o$ >inal 7;
F 68 G 8 F 8F 68 G 8 F 8
F 68 G 8 F 8
F 68 G 68 J 8
F 68 G 6; K H
& (1)5
6r0!o BOn#cio Efeito
tratamento
rupo
"/$
Pes#duo "+o)o$ >inal 7;
F 6; J 8 G 8
F 6; J N J N
F 6; J N J N
F 6; J N J NF 6; J 68 K 8
&(5)5
6r0!o COn#cio Efeito
tratamento
rupo
"/$
Pes#duo "+o)o$ >inal 7;
F 8 I 8 H 8
F 8 I 8 H 8
F 8 I N I N
F 8 I 68 F 8
F 8 I 68 F 8
&(31)5
6r0!o #On#cio Efeito
tratamentorupo
"/$Pes#duo "+o)o$ >inal 7;
F N F 8 I 8
F N F 8 I 8
F N F N F N
F N F N F N
F N F 6; J H
&(7)5
6r0!o EOn#cio Efeito
tratamento
rupo
"/$
Pes#duo "+o)o$ >inal 7;
F ; H 8 D 8
F ; H N H N
F ; H N H N
F ; H N H N
F ; H 68 I 8
&(3')5 * &(35)5
Cálc0lo da oa de 20adrados
F
8/20/2019 ANOVA 1 Fator Prof. Ivan
7/12
2 Entre r0!os *2E * & 815 955 9 (31)5 9 75 9 (35)5 * &7
2 #entro dos r0!os * 2# * ; 7; - 55.
; 7; - "8$; 6"8$;6 "8$;6 "8$;6 ";$; 6 "8$;6 "N$; 6"N$;6"N$6"8$; 6
"8$;
6"8$;
6"N$;
6"8$;
6"8$;
6 "8$;
6 "8$;
6"N$;
6"N$;
6";$;
6 "8$;6"N$;6"N$;6"N$;6"8$; -
; 7; - J6 ; 6 H 6 F 6 ; - ;;
2< * oa de 20adrados
8/20/2019 ANOVA 1 Fator Prof. Ivan
8/12
#es$%ual
& e r ' e
t
210-1-2
99
90
50
10
1
N 25
AD 1.493
P-Value
8/20/2019 ANOVA 1 Fator Prof. Ivan
9/12
sens#veis à ausência de normalidade que, na pr!tica, têm pouco valor. & solução é contar com
a robustez da &02%&.
Qual é a )ravidade de os desviospadrão serem desi)uaisR & &02%& não é muito
sens#vel a violações da suposição, particularmente quando todas as amostras têm taman1os
i)uais ou semel1antes e nen1uma das amostras é muito pequena. &o plane+ar um estudo, tente
tomar amostras do mesmo taman1o de todos os )rupos que pretende comparar. 2s desvios
padrão amostrais estimam os desviospadrão da população, lo)o, certifiquese antes de fazer a
&02%& de que os desviospadrão amostrais são semel1antes entre si. Esperase que 1a+a certa
variação entre eles devido ao acaso. & se)uir apresentamos uma re)ra pr!tica que é se)ura em
quase todas as situações3
%erificação dos esviosLadrão na &02%&3
2s resultados do teste > da &02%& são apro/imadamente corretos quando o maior desvio
padrão amostral n"o for mais do 6ue duas ve7es do que o menor desviopadrão amostral.
U
?m desviopadrão )rande muitas vezes ocorre devido a valores at#picos ou à assimetria.
(ontinuemos com a resolução de nosso e/emplo...
F>r0las ANOVA 1 fator
%arincia -
8/20/2019 ANOVA 1 Fator Prof. Ivan
10/12
& nossa 1ipótese "Bo$ é3 @sendo as médias nas populações das quais procedem as
amostras i)uaisA, qual é a probabilidade de obtermos valores X >calculado tão e/tremosR
>calculado - QVentre QVdentro - 8;,I 8,8 - 88,DF
2 p2valor quantifica a discrepncia entre os dados e Bo3 se a probabilidade de > étão discrepante ou mais que Bo.
& nossa 1ipótese em investi)ação "ou em estudo$ é se as médias diferem
estatisticamente. ?sualmente é e/pressa a 1ipótese estat#stica de nulidade "ou i)ualdade$
assim3 Bo3 5& - 5' - 5( - 5 - 5E.
& ri)or, Bo, não é um teste para verificar a probabilidade de i)ualdade das médias,
mas sim para verificar a probabilidade de ocorrência da estat#stica > tendo como condiçãoverdadeira o fato de que essas amostras procedem de populações que apresentam o mesmo
valor médio "no nosso e/emplo, 5 - F$. "Bo3 1ipótese onde quaisquer diferenças encontradas
são devido ao acaso$.
Em nosso e/emplo, a 1ipótese em investi)ação não coincide com a 1ipótese
estat#stica de nulidade "Bo$. &ssim, se re+eitarmos Bo, então se pode inferir @com cautelaA que
1! uma diferença sistem!tica atuando, o que e/plica a diferença entre os valores amostrais
mel1or do que a ação do acaso.
2s resultados obtidos são apresentados de forma resumida na tabela ;3
*abela ;. &02%& "8 fator$ para os dados da *abela 8.
>onte de variação "ou efeito$ )l
pvalor
Entre )rupos H IN 8;,I 88,DF N,NNNNFYentro "res#duo$ ;N ;; 8,8
*otal ;H G;
YpZ N,NI
8N
8/20/2019 ANOVA 1 Fator Prof. Ivan
11/12
Cálc0lo do !3"alor associado estatística F.
Lrocedimento no Vinitab.
0uma tabela @>A encontrada nos livros de estat#stica, obtemos > )l "H3;N$ - ;,JG para
I[. & estat#stica > : razão de varincia foi calculada. Ela ocorre muito ou pouco num
mecanismo de pura c1ance "diferenças amostrais devido ao acaso$R
“Se uma observação é rara (improvável) sob determinada hipótese (Ho), então é
evidência contra essa hipótese”
0o Vinitab "comando (*P 6 W$ temos de di)itar o comando (> "cumulative
distri'ution function$ e, a se)uir, o valor da estat#stica > calculada para indicar que estamos
considerando a distribuição > e, não por e/emplo a 0ormal. 0uma outra lin1a, os n\meros de
)raus de liberdade das varincias entre os )rupos "numerador$ e dentro dos )rupos
"denominador$. & constante M8 representa a probabilidade de ∞ até > "- ;.JG$ e o pvalor é a
parte da curva que falta para 8NN[ de probabilidade "!rea total da curva$4 por esse motivo,
para se obter o pvalor, !rea do que falta, temos de subtrair do total. 2 pro)rama Vinitab vai
armazenar esse resultado como constante M;
8/20/2019 ANOVA 1 Fator Prof. Ivan
12/12
Crva !
"# $%mera&'r( ) 4
"# $&e%'mi%a&'r( ) 20
0*0
0*1
0*2
0*3
0*4
0*5
0*6
0*7
0 1 2 3 4
CD!
5+
2*87
F calc0lado (* 11.') é aior 0e F (* 5.%$) ta+elado a &G@ ent-o@ reHeita3se Io
Jara se o+ter o !3"alor associado estatística Fl(D57) * 11.'
Edit]] (ommand Wine Editor3
cdf 88.DF M8D> H ;N.
let M; - 8 : M8
print M;
& resposta ser! M; - pvalor -8p "-M8$ - N,NNNNF - Z I[, lo)o re+eitase Bo.
(onclusão. B! evidência amostral de que as cinco médias diferem do
ponto de vista estat#stico.
8;