ANOVA 1 Fator Prof. Ivan

Embed Size (px)

Citation preview

  • 8/20/2019 ANOVA 1 Fator Prof. Ivan

    1/12

    Análise de Variância (ANOVA) 1 fator

    Queremos determinar se a diferença observada entre duas médias amostrais♣  é

    devida, apenas, às variações aleatórias de uma amostra a outra, ou se os dados vêm de

     populações onde as médias são verdadeiramente diferentes. Esse é um outro modo de dizer 

    que nós queremos descobrir se a diferença entre as médias é estatisticamente diferente. Enfim,

    mesmo que nós possamos concluir que as médias são diferentes, nós também temos de decidir 

    se elas diferem o suficiente para poderem ser consideradas de importncia pr!tica "cl#nica$.

    %amos considerar três situações "&, ' e ($ onde os )rupos (ontrole e *ratado

    apresentam a mesma média amostral, porém, diferem em termos de variabilidade "em

    dispersão, ou se+a, em desviopadrão$.

    C T C T C T

    0

    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

      caso A caso B caso C

            m

            m

    ( - )rupo controle

    * - )rupo tratado

    Caso A:  duas médias diferentes "não podemos dizer outra coisa, senão que diferem

    numericamente$.

    Caso B:  as mesmas duas médias "de &$ com valores bem dispersos "a diferença não é

    estatisticamente si)nificante$. evido à dispersão, a diferença não é muito convincente.

    Caso C: as mesmas médias "as duas de & e '$ com valores concentrados "pró/imos ao valor médio$. 0esse caso, 1! diferença estatisticamente si)nificante.

      O teste t (de Student) para a diferença entre duas médias é um caso especial de análise de

    variância (ANOVA 1 fator). A fórmula para t pode ser epressa para !. Vale a relaç"o# ! $ t %.

  • 8/20/2019 ANOVA 1 Fator Prof. Ivan

    2/12

    2 problema é como decidir quando as médias são diferentes, em relação à

    dispersão dos valores em cada )rupo, a fim de concluir se 1! diferença estatisticamente

    si)nificante entre as médias.

    & an!lise de varincia a+udanos a responder esta questão.

    2 que temos a fazer é descobrir um modo de avaliar "medir$ numericamente o

    quão diferentes são as médias e quanto as observações se afastam "encontramse dispersas$ ao

    redor das respectivas médias.

    (om essas duas medidas "avaliações$ à nossa disposição, somos capazes de dizer 

    se as médias diferem si)nificantemente ou não.

    A idéia da Análise de Variância

    Esta é a idéia principal para a comparação de médias3 o que importa não é o quanto

    as médias amostrais estão distantes , mas o quão distantes estão relativamente & varia'ilidade

    de o'servaçes individuais. 

    & &02%& compara a variação resultante de fontes espec#ficas com a variação

    entre indiv#duos que deveriam ser semel1antes. Em particular, a &02%& testa se v!rias

     populações têm a mesma média, comparando o afastamento entre as médias amostrais com a

    variação e/istente dentro das amostras.

    & &02%& pressupõe que podemos decompor cada valor observado em três termos

    aditivos4 ou se+a, nós somos capazes de escrever cada observação como uma soma de três

    termos. & decomposição pode ser escrita como3

    %alor obtido "/$ - média )eral "5$ 6 desvio da média do )rupo em relação à média )eral "   

    5$ 6 desvio "7i+ $ entre o valor observado em relação à média do )rupo " /   $ ou

    ata - fit 6 residue "error$

    2 modelo formal de &02%& "8 fator $ é3 /i+ - 5 6 9i+ 6 7i+ 

    /i+ : são os valores observados em cada )rupoi : referese ao )rupo

     + : referese à observação dentro do )rupo

    5 : é uma constante "é a média )eral$7 : são os termos residuais "diferença entre o valor observado e o fit, modelo a+ustado$

    ;

  • 8/20/2019 ANOVA 1 Fator Prof. Ivan

    3/12

    2bservação. - variação "entre médias amostrais$ / variação "entre indiv#duos dentro das amostras$

    &s medidas de variação no numerador e denominador de > são c1amadas de médias

    quadr!ticas. ?ma média quadr!tica é uma forma mais )eral de uma varincia amostral. ?ma

    varincia amostral usual s; é uma média dos desvios quadr!ticos das observações a partir de

    suas médias, lo)o se qualifica de @média quadr!ticaA.

    & estat#stica > testa a 1ipótese nula de que todas as   populações têm a mesma média3

    Bo3 C8 - C; - CD- .. - C *

    Ba3 nem todos os C são i)uais

    tem distribuição > com 8 e 0 )raus de

    liberdade.

    D

  • 8/20/2019 ANOVA 1 Fator Prof. Ivan

    4/12

    Exe!lo resol"ido:

     0a *abela 8, mostrada a se)uir, temos cinco )rupos com cinco observações em cada

    )rupo. Queremos saber @as diferenças nas médias amostrais são variações aleatórias que

    ocorrem apenas devido ao acaso " +ust ', c-ance$ ou se e/istem diferenças sistem!ticas entre

    as médiasA.

    *abela 8. ados obtidos em cinco )rupos num e/perimento inteiramente casualizado com

    cinco réplicas.

    A B C # E

    F G H I D

    F J H I H

    F J I F H

    J J F F HK K F J I

    édias aostrais (  $$ % & '

    édia eral * '

    O+ser"a,-o:

    Lrimeira re)ra de an!lise de dados3 @maMe a pictureA

  • 8/20/2019 ANOVA 1 Fator Prof. Ivan

    5/12

    Valores

          G    r    u    p    o    s

    109876543210

    A

    B

    C

    D

    E

    Dotplot of Valores vs Grupos

    9876543

    Dotplot for A-E

    A

    B

    C

    D

    E

    MeaMea !- 1 "tDe

    Descriptive Statistics: A, B, C, D, E

    Grupos N Média DP CoefVar (%)

    A 5 7.000 1.414 20.20

    B 5 .000 0.707 .4

    C 5 5.000 1.000 20.00

    D 5 !.000 1.225 20.41

    " 5 4.000 0.707 17.!

    O+s.: 8.H8H é o dobro de N.GNG

    I

  • 8/20/2019 ANOVA 1 Fator Prof. Ivan

    6/12

    esol0,-o:2 entre r0!os: n(  3 4)5

    6r0!o AOn#cio Efeito

    tratamento

    rupo

    "/$

    Pes#duo "+o)o$ >inal 7;

    F 68 G 8 F 8F 68 G 8 F 8

    F 68 G 8 F 8

    F 68 G 68 J 8

    F 68 G 6; K H

    & (1)5

    6r0!o BOn#cio Efeito

    tratamento

    rupo

    "/$

    Pes#duo "+o)o$ >inal 7;

    F 6; J 8 G 8

    F 6; J N J N

    F 6; J N J N

    F 6; J N J NF 6; J 68 K 8

    &(5)5

    6r0!o COn#cio Efeito

    tratamento

    rupo

    "/$

    Pes#duo "+o)o$ >inal 7;

    F 8 I 8 H 8

    F 8 I 8 H 8

    F 8 I N I N

    F 8 I 68 F 8

    F 8 I 68 F 8

    &(31)5

    6r0!o #On#cio Efeito

    tratamentorupo

    "/$Pes#duo "+o)o$ >inal 7;

    F N F 8 I 8

    F N F 8 I 8

    F N F N F N

    F N F N F N

    F N F 6; J H

    &(7)5

    6r0!o EOn#cio Efeito

    tratamento

    rupo

    "/$

    Pes#duo "+o)o$ >inal 7;

    F ; H 8 D 8

    F ; H N H N

    F ; H N H N

    F ; H N H N

    F ; H 68 I 8

    &(3')5 * &(35)5

    Cálc0lo da oa de 20adrados

    F

  • 8/20/2019 ANOVA 1 Fator Prof. Ivan

    7/12

    2 Entre r0!os *2E * & 815 955 9 (31)5 9 75 9 (35)5 * &7

    2 #entro dos r0!os * 2# * ; 7; -  55.

    ; 7; -  "8$; 6"8$;6 "8$;6 "8$;6 ";$; 6 "8$;6 "N$; 6"N$;6"N$6"8$; 6 

    "8$;

    6"8$;

    6"N$;

    6"8$;

    6"8$;

    6 "8$;

    6 "8$;

    6"N$;

    6"N$;

    6";$;

      6  "8$;6"N$;6"N$;6"N$;6"8$; -

    ; 7; -  J6 ; 6 H 6 F 6 ; - ;;

    2< * oa de 20adrados

  • 8/20/2019 ANOVA 1 Fator Prof. Ivan

    8/12

    #es$%ual

         &    e    r    '    e

             t

    210-1-2

    99

    90

    50

    10

    1

    N 25

    AD 1.493

    P-Value

  • 8/20/2019 ANOVA 1 Fator Prof. Ivan

    9/12

    sens#veis à ausência de normalidade que, na pr!tica, têm pouco valor. & solução é contar com

    a robustez da &02%&.

    Qual é a )ravidade de os desviospadrão serem desi)uaisR & &02%& não é muito

    sens#vel a violações da suposição, particularmente quando todas as amostras têm taman1os

    i)uais ou semel1antes e nen1uma das amostras é muito pequena. &o plane+ar um estudo, tente

    tomar amostras do mesmo taman1o de todos os )rupos que pretende comparar. 2s desvios

     padrão amostrais estimam os desviospadrão da população, lo)o, certifiquese antes de fazer a

    &02%& de que os desviospadrão amostrais são semel1antes entre si. Esperase que 1a+a certa

    variação entre eles devido ao acaso. & se)uir apresentamos uma re)ra pr!tica que é se)ura em

    quase todas as situações3

    %erificação dos esviosLadrão na &02%&3

    2s resultados do teste > da &02%& são apro/imadamente corretos quando o maior  desvio

     padrão amostral n"o for mais do 6ue duas ve7es do que o menor  desviopadrão amostral.

    U

    ?m desviopadrão )rande muitas vezes ocorre devido a valores at#picos ou à assimetria.

    (ontinuemos com a resolução de nosso e/emplo...

    F>r0las ANOVA 1 fator

    %arincia -

  • 8/20/2019 ANOVA 1 Fator Prof. Ivan

    10/12

    & nossa 1ipótese "Bo$ é3 @sendo as médias nas populações das quais procedem as

    amostras i)uaisA, qual é a probabilidade de obtermos valores X >calculado tão e/tremosR

    >calculado - QVentre QVdentro - 8;,I 8,8 - 88,DF

    2 p2valor  quantifica a discrepncia entre os dados e Bo3 se a probabilidade de > étão discrepante ou mais que Bo.

    & nossa 1ipótese em investi)ação "ou em estudo$ é se as médias diferem

    estatisticamente. ?sualmente é e/pressa a 1ipótese estat#stica de nulidade "ou i)ualdade$

    assim3 Bo3 5& - 5' - 5( - 5 - 5E.

    & ri)or, Bo, não é um teste para verificar a probabilidade de i)ualdade das médias,

    mas sim para verificar a probabilidade de ocorrência da estat#stica > tendo como condiçãoverdadeira o fato de que essas amostras procedem de populações que apresentam o mesmo

    valor médio "no nosso e/emplo, 5 - F$. "Bo3 1ipótese onde quaisquer diferenças encontradas

    são devido ao acaso$.

     Em nosso e/emplo, a 1ipótese em investi)ação não coincide com a 1ipótese

    estat#stica de nulidade "Bo$. &ssim, se re+eitarmos Bo, então se pode inferir @com cautelaA que

    1! uma diferença sistem!tica atuando, o que e/plica a diferença entre os valores amostrais

    mel1or do que a ação do acaso.

    2s resultados obtidos são apresentados de forma resumida na tabela ;3

    *abela ;. &02%& "8 fator$ para os dados da *abela 8.

    >onte de variação "ou efeito$ )l

     pvalor 

    Entre )rupos H IN 8;,I 88,DF N,NNNNFYentro "res#duo$ ;N ;; 8,8

    *otal ;H G;

    YpZ N,NI

    8N

  • 8/20/2019 ANOVA 1 Fator Prof. Ivan

    11/12

    Cálc0lo do !3"alor associado estatística F.

    Lrocedimento no Vinitab.

     0uma tabela @>A encontrada nos livros de estat#stica, obtemos > )l "H3;N$ - ;,JG para

    I[. & estat#stica > : razão de varincia foi calculada. Ela ocorre muito ou pouco num

    mecanismo de pura c1ance "diferenças amostrais devido ao acaso$R

    “Se uma observação é rara (improvável) sob determinada hipótese (Ho), então é 

    evidência contra essa hipótese”

     0o Vinitab "comando (*P 6 W$ temos de di)itar o comando (> "cumulative

    distri'ution function$ e, a se)uir, o valor da estat#stica > calculada para indicar que estamos

    considerando a distribuição > e, não por e/emplo a 0ormal. 0uma outra lin1a, os n\meros de

    )raus de liberdade das varincias entre os )rupos "numerador$ e dentro dos )rupos

    "denominador$. & constante M8 representa a probabilidade de ∞ até > "- ;.JG$ e o pvalor é a

     parte da curva que falta para 8NN[ de probabilidade "!rea total da curva$4 por esse motivo,

     para se obter o pvalor, !rea do que falta, temos de subtrair do total. 2 pro)rama Vinitab vai

    armazenar esse resultado como constante M;

  • 8/20/2019 ANOVA 1 Fator Prof. Ivan

    12/12

    Crva !

     "# $%mera&'r( ) 4

    "# $&e%'mi%a&'r( ) 20

    0*0

    0*1

    0*2

    0*3

    0*4

    0*5

    0*6

    0*7

    0 1 2 3 4

    CD!

    5+

    2*87

    F calc0lado (* 11.') é aior 0e F (* 5.%$) ta+elado a &G@ ent-o@ reHeita3se Io

    Jara se o+ter o !3"alor associado estatística Fl(D57) * 11.'

    Edit]] (ommand Wine Editor3

    cdf 88.DF M8D> H ;N.

    let M; - 8 : M8

     print M;

    & resposta ser! M; - pvalor -8p "-M8$ - N,NNNNF - Z I[, lo)o re+eitase Bo.

    (onclusão. B! evidência amostral de que as cinco médias diferem do

     ponto de vista estat#stico.

    8;