12
Teoria e pratica della valutazione Laboratorio – Lezione X Analisi della varianza e test su due variabili ANOVA Analisi della varianza (a una via) L’analisi della varianza serve a studiare la relazione tra una variabile categoriale (X) e una variabile cardinale (Y): X è in ipotesi indipendente, le sue singole categorie (modalità) si definiscono “gruppi”; Y è in ipotesi dipendente da X. Lo scopo dell’analisi della varianza è testare l’ipotesi che la varianza di Y dipenda da X, o in altre parole che le medie dei gruppi costituiti dalle modalità di X sulla variabile Y siano significativamente differenti. Esempio: formuliamo l’ipotesi che la varianza dello scarto tra il primo ed il secondo test dipenda dal sesso dei soggetti.

Teoria e pratica della valutazione Laboratorio – Lezione X Analisi della varianza e test su due variabili ANOVA Analisi della varianza (a una via) Lanalisi

Embed Size (px)

Citation preview

Page 1: Teoria e pratica della valutazione Laboratorio – Lezione X Analisi della varianza e test su due variabili ANOVA Analisi della varianza (a una via) Lanalisi

Teoria e pratica della valutazioneLaboratorio – Lezione XAnalisi della varianza e test su due variabili

ANOVAAnalisi della varianza (a una via)

L’analisi della varianza serve a studiare la relazione tra una variabile categoriale (X) e una variabile cardinale (Y):

• X è in ipotesi indipendente, le sue singole categorie (modalità) si definiscono “gruppi”;

• Y è in ipotesi dipendente da X.

Lo scopo dell’analisi della varianza è testare l’ipotesi che la varianza di Y dipenda da X, o in altre parole che le medie dei gruppi costituiti dalle modalità di X sulla variabile Y siano significativamente differenti.

Esempio: formuliamo l’ipotesi che la varianza dello scarto tra il primo ed il secondo test dipenda dal sesso dei soggetti.

Page 2: Teoria e pratica della valutazione Laboratorio – Lezione X Analisi della varianza e test su due variabili ANOVA Analisi della varianza (a una via) Lanalisi

Teoria e pratica della valutazioneLaboratorio – Lezione XAnalisi della varianza e test su due variabili

L’analisi della varianza verifica l’ipotesi nulla:

H0: tutte le medie sono uguali tra di loroCioè:

H0: μ1 =μ2 =...=μK =μL’ipotesi alternativa è:

H1: almeno una media è diversa dalle altre Cioè:

H1: esiste almeno un gruppo k per cui μk = μ

L’ipotesi nulla viene rifiutata se c’è almeno un gruppo con una media significativamente diversa da quella di un altro.

Page 3: Teoria e pratica della valutazione Laboratorio – Lezione X Analisi della varianza e test su due variabili ANOVA Analisi della varianza (a una via) Lanalisi

Teoria e pratica della valutazioneLaboratorio – Lezione XAnalisi della varianza e test su due variabili

L’analisi della varianza rientra tra le analisi statistiche inferenziali, cioè mirate a valutare se le evidenze emerse su dati campionari sono estendibili all’intera popolazione da cui è estratto il campione.

Perché abbia senso applicare questa analisi devono darsi le seguenti condizioni:• Le osservazioni devono essere tra loro indipendenti • La variabile dipendente deve avere distribuzione normale• Le varianze all’interno degli strati devono essere omogenee (cioè simili tra loro).

Analisi della varianza

Page 4: Teoria e pratica della valutazione Laboratorio – Lezione X Analisi della varianza e test su due variabili ANOVA Analisi della varianza (a una via) Lanalisi

Teoria e pratica della valutazioneLaboratorio – Lezione XAnalisi della varianza e test su due variabili

La scomposizione della varianzaPossiamo scomporre lo scarto dalla media di un singolo valore della distribuzione di Y in due componenti: a.Lo scarto del valore dalla media del suo gruppo (ad esempio lo scarto del soggetto 25 dalla media delle donne);b.Lo scarto della media del gruppo dalla media generale (ad esempio lo scarto della media delle donne dalla media generale).

Allo stesso modo è possibile scomporre la somma del quadrato degli scarti di tutti i valori dalla media generale, cioè la devianza totale:

Page 5: Teoria e pratica della valutazione Laboratorio – Lezione X Analisi della varianza e test su due variabili ANOVA Analisi della varianza (a una via) Lanalisi

Teoria e pratica della valutazioneLaboratorio – Lezione XAnalisi della varianza e test su due variabili

La variabilità totale della variabile dipendente Y è descritta dalla devianza totale (cioè dalla somma dei quadrati degli scarti dalla media).

La scomposizione della varianza (2)

La variabilità nei gruppi (entro i gruppi) è descritta dalla devianza entro i gruppi (cioè dalla somma dei quadrati degli scarti dalla media del gruppo, detta anche somma interna dei quadrati o devianza non spiegata):

Page 6: Teoria e pratica della valutazione Laboratorio – Lezione X Analisi della varianza e test su due variabili ANOVA Analisi della varianza (a una via) Lanalisi

Teoria e pratica della valutazioneLaboratorio – Lezione XAnalisi della varianza e test su due variabili

La scomposizione della varianza (3)

La variabilità fra i gruppi (definiti dalle modalità di X) è descritta dalla devianza tra i gruppi (cioè dalla somma dei quadrati degli scarti tra le medie dei gruppi e la media generale, detta anche somma esterna dei quadrati o devianza spiegata):

p

iii yyn

1

2

Devianza spiegata da cosa?… dalla variabile categoriale: è la parte di variabilità della variabile dipendente attribuibile alla variabile dipendente (nell’esempio è la parte della variabilità dello scarto tra primo e secondo test attribuibile al sesso dei soggetti).

Page 7: Teoria e pratica della valutazione Laboratorio – Lezione X Analisi della varianza e test su due variabili ANOVA Analisi della varianza (a una via) Lanalisi

Teoria e pratica della valutazioneLaboratorio – Lezione XAnalisi della varianza e test su due variabili

SQesterna=0 in caso di

assenza di relazione

SQinterna=0 in caso di

relazione perfetta

Il diverso peso relativo della somma dei quadrati esterna e della somma dei quadrati interna (cioè della devianza spiegata e di quella non spiegata) può essere utilizzato per valutare la significatività e la forza della relazione tra X e Y.

La scomposizione della varianza (4)

Page 8: Teoria e pratica della valutazione Laboratorio – Lezione X Analisi della varianza e test su due variabili ANOVA Analisi della varianza (a una via) Lanalisi

Teoria e pratica della valutazioneLaboratorio – Lezione XAnalisi della varianza e test su due variabili

Ad ognuna delle devianze sono associati i gradi di libertà:• la devianza totale ha n − 1 gradi di libertà (dove n è la numerosità dei casi)• la devianza tra gruppi ha p − 1 gradi di libertà (dove p è il numero dei gruppi)• la devianza entro i gruppi ha n - p gradi di libertà

La significatività della relazione: i gradi di libertà

Dividendo la devianza per i gradi di libertà si ottiene la stima della varianza della popolazione.

Varianza tra i gruppi:

Varianza entro i gruppi:

Page 9: Teoria e pratica della valutazione Laboratorio – Lezione X Analisi della varianza e test su due variabili ANOVA Analisi della varianza (a una via) Lanalisi

Teoria e pratica della valutazioneLaboratorio – Lezione XAnalisi della varianza e test su due variabili

La significatività della relazione: il test F

Il test F serve a verificare l’ipotesi di uguaglianza delle medie confrontando varianza spiegata e varianza non spiegata:

Se l’ipotesi nulla è vera le due stime della varianza sono uguali; se è falsa la stima esterna è maggiore di quella interna.

La statistica F ha una distribuzione campionaria conosciuta, segue una distribuzione F di Fisher, cioè si conosce il suo valore critico in base al quale respingere o accettare H0 a seconda dei gradi di libertà delle due stime.

Esistono tabelle dei valori critici a seconda della significatività e la regola decisionale è: Rifiuto H0 se F (calcolato) > Fα (tabulato).

Page 10: Teoria e pratica della valutazione Laboratorio – Lezione X Analisi della varianza e test su due variabili ANOVA Analisi della varianza (a una via) Lanalisi

Teoria e pratica della valutazioneLaboratorio – Lezione XAnalisi della varianza e test su due variabili

La significatività della relazione: il test F

I risultati del test F per l’analisi della varianza con una sola variabile indipendente vengono sintetizzati in un’unica tabella dai programmi di analisi, Spss presenta una tabella di questo tipo:

Page 11: Teoria e pratica della valutazione Laboratorio – Lezione X Analisi della varianza e test su due variabili ANOVA Analisi della varianza (a una via) Lanalisi

Teoria e pratica della valutazioneLaboratorio – Lezione XAnalisi della varianza e test su due variabili

La forza della relazioneIl confronto tra le medie dei gruppo può rendere conto della forza della relazione: tanto più le medie differiscono tra loro maggiore sarà la forza della relazione. Esistono però diversi coefficienti per quantificare questa forza, il più semplice è l’eta-quadrato, dato dal rapporto tra la somma dei quadrati esterna (cioè la devianza spiegata) e la somma dei quadrati totale (la devianza totale).

Varia tra 0 (assenza di relazione) e 1 (relazione perfetta, tutta la devianza di Y è attribuibile a X) ed è chiamato anche rapporto di correlazione di Pearson.

Risente del numero delle categorie della variabile categoriale, quindi si deve fare attenzione nel confrontare eta-quadrati di una stessa Y con X aventi un numero di modalità differenti, inoltre presenta dei problemi se il numero dei casi in ogni gruppo è troppo ridotto.

Page 12: Teoria e pratica della valutazione Laboratorio – Lezione X Analisi della varianza e test su due variabili ANOVA Analisi della varianza (a una via) Lanalisi

Teoria e pratica della valutazioneLaboratorio – Lezione XAnalisi della varianza e test su due variabili

Il test T, come l’analisi della varianza, permette di valutare se le differenze nelle medie sono significative oppure dovute al caso, nel caso si abbiano a disposizione due medie, cioè ci interessi confrontare due gruppi.

Anche in questo caso siamo nell’ambito della statistica inferenziale, e le assunzioni alla base del test T sono le seguenti:Le osservazioni devono essere tra loro indipendenti La variabile dipendente deve avere distribuzione normale Le varianze all’interno degli strati devono essere uguali.

Il test T