Statistica ANOVA

Embed Size (px)

DESCRIPTION

ASE Statistica

Citation preview

  • Analiza variaiei (ANOVA).

    Joi, 4 aprilie 2013

  • Analiza variaiei (1)

    Etimologie: ANOVA (ANalyses Of VAriance)Istoric:-A fost introdus n practica statistic n 1920 de ctre R. Fischer, care a vrut s vad diferenele semnificative dintre diferitele tipuri de plante.

    -Din 1970 este cea mai folosit metod statistic n studii de psihologie.

    -Aplicaiile sunt dintre cele mai variate: psihologie, biologie, sociologie, economie.

  • ANOVA (2)

    - Variabila dependent (variabil rspuns )variabila studiat

    Terminologie (1):

    - Variabila independent/explicativ (factor)o variabil care influeneaz variabila dependent

    - Nivelul factorului (tratament)o valoare particular (sau o grup de valori) a factorului

    - Variaia rezidualinfluene aleatoare asupra variabilei dependente (ali factori de influen)

  • ANOVA (3)

    Exemplu (1)

    Determinm cum recolta este influenat de tipul de ngrmnt folosit. Un fermier folosete 3 tipuri de ngrmnt notate A,B i C.

    - variabila rspuns - producia- factorul - tipul de ngrmnt- tratamentul - ngrmntul A, B i C

  • ANOVA (4)

    Exemplu (2)

    Analizm cum rezultatele la examenul de Admitere ASE sunt influenate de media obinuta de candidai la examenul de Bacalaureat. Studiem candidaii care au obinut la Bacalaureat urmtoarele categorii de note: (7-8], (8-9], (9-10]

    - variabila rspuns - rezultatul la admiterea ASE- factorul - media la Bacalaureat- tratamentul - grupe de note (7-8], (8-9], (9-10]

  • ANOVA (5)

    - Normalitatea n fiecare grup valorile sunt distribuite aproximativ normal

    Ipoteze:

    - Omogenitatea varianei n interiorul fiecrei grupe dispersiile sunt aproximativ egale

    -Setul de ipoteze: H0: factorul de grupare este nerelevantH1: factorul de grupare are o influen semnificativ asupra lui Y- Ideea de baz n testarea ipotezelor ANOVA este regula de adunare a dispersiilor, descompunerea dispersiei totale n dispersia dintre grupe (factorul sistematic) i dispersia din interiorul grupelor (factorul aleator).

  • ANOVA (6)

    - O singur variabil independent X, ale crei valori pot fi mprite n mai multe grupuri: X1,...,Xr.

    - Vrem s vedem dac exist o diferen semnificativ ntre valorile variabilei dependente Y n interiorul grupurilor create dup variabila de grupare X.

    - Practic, observaiile sunt valorile lui Y n interiorul celor r grupuri create dup valorile lui X.

    Aplicabilitate:

  • ANOVA (7)

    Media general pentru variabila Y va fi:

    .

    .

    i

    ii

    nny

    y

    j

    jj

    nny

    Mediile variabilei Y pentru fiecare grup dup variabila X vor fi:

    j

    iji

    ij

    ijij n

    nynny

    y.

    Deci media general se poate scrie i sub forma:

  • ANOVA (8)

    n aceast situaie, pentru variabila Y, putem identifica urmtoarele dispersii:

    - Dispersia total:

    .

    .2

    2

    i

    ii

    nnyy

    - Dispersia explicat/ sistematic/ dintre grupe:

    j

    jj

    nnyy 22

    - Dispersia rezidual/ medie din interiorul grupelor:

    - Dispersia din interiorul grupei j:

    ij

    ijjij n

    nyy 22

    j

    jj

    nn22

    Relaia dintre cele trei tipuri de dispersie este: 222 2

    22

  • ANOVA (9)

    Tabelul de analiz a varianei

    Practic, Fcalculat se poate calcula:12

    2

    rrnFcalculat

    2

    2

    2

    22 1

    R

  • ANOVA (10)

    Decizia:- Decizia se ia pe baza testului F: se compar valoarea statisticii Fcalculatcalculat n tabelul ANOVA cu valoarea critic, corespunztoare cuantilei repartiiei F cu (r-1,n-r) grade de libertate.

    - Dac atunci respingem ipoteza nul, deci putem afirma, cu probabilitatea , c factorul de grupare are o influen semnificativ asupra variabilei de interes.

    - Valoarea critic n EXCEL:

    1 rnrcalculatFF ;1;

    rnrFINVF rnr ;1;;1;

  • Exemplificare (1) Toi candidaii

    i

    ii

    nny

    y puncte452009000

    i

    ii

    nnyy 22 295

    20059000 2 puncte18,17295

    100y

    CV %17,381004518,17

  • Exemplificare (2)

  • Exemplificare (3) Candidai cu media la Bacalaureat ntre 7 i 8 Grupa 1

    1

    11

    i

    ii

    nny

    y puncte11,2445

    1085

    1

    12

    121

    i

    ii

    nnyy 88,65

    4544,2964

    211 puncte12,888,65 100

    1

    11 xCV

    %66,33100

    11,2412,8

  • Exemplificare (4) Candidai cu media la Bacalaureat ntre 8 i 9 Grupa 2

    2

    22

    i

    ii

    nny

    y puncte35,4385

    3685

    2

    22

    222

    i

    ii

    nnyy 64,119

    8541,10169

    222 puncte94,1064,119 100

    2

    22 xCV

    %23,25100

    35,4394,10

  • Exemplificare (5) Candidai cu media la Bacalaureat ntre 9 i 10 Grupa 3

    3

    33

    i

    ii

    nny

    y puncte43,6070

    4230

    3

    32

    323

    i

    ii

    nnyy 39,133

    7014,9337

    233 puncte55,1139,133 100

    3

    33 xCV

    %11,19100

    43,6055,11

  • Exemplificare (6)

    2952

    708545704543,60854535,43454511,24 222

    Dispersia total era:

    Dispersia explicat (dintre grupe) se calculeaz: j jj n

    nyy 22

    645,182200

    36529

    Dispersia rezidual (din interiorul grupelor) se calculeaz:

    j

    jj

    nn22

    355,11220022471

    7085457039,1338564,1194588,65

    295355,112645,182222

  • Exemplificare (7)

    62,0295645,182

    2

    22

    R

    12,160133200

    355,112645,182

    122

    r

    rnFcalculat

    Gradul de determiniaie:

    Testul F

    04,3197;2;05,01;; FF rrnDeoarece Fcalculat >Ftabelar alegem ipoteza H1 conform creia gruparea candidailor ASE dup media de la Bacalaureat este relevant.