Upload
truongnhi
View
219
Download
0
Embed Size (px)
Citation preview
1
M
Q
Analisi della Varianza - II
ANOVA entro i soggetti, modelli misti, ANCOVA
Marco Perugini
Milano-Bicocca
Lez: XXIX
2
ANOVA a una via – la VARIANZA
Possiamo stimare la varianza (MQ = media dei quadrati)
- Varianza totale: MQTOT = SQTOT
(N −1)
- Varianza entro: MQENTRO = SQENTRO
(N − k)
- Varianza tra: MQTRA = SQTRA
(k −1)
N = numerosità complessiva; k = numero di livelli
Gradi di libertà (g.l.)
[→quanti valori sono
liberi di variare]
Il rapporto F
𝑭 = 𝑴𝑸𝑻𝑹𝑨𝑴𝑸𝑬𝑵𝑻𝑹𝑶
F è il rapporto tra la varianza stimata a partire dalla variabilità tra i gruppi (BETWEEN) e la varianza stimata a partire dalla variabilità entro i gruppi (WITHIN). Segue la distribuzione F di Fisher. http://web.utah.edu/stat/introstats/anovaflash.html
Lezione: XXVIII
3
ANOVA fattoriale – la scomposizione della varianza
SQTOT
SQENTRO SQTRA
SQA SQB SQA * B
g.l.: N - 1
g.l.: N – a*b
g.l.: a – 1 g.l.: b – 1 g.l.: (a–1)*(b–1)
MQ = SQ / g.l.
FA = MQA / MQENTRO
FB = MQB / MQENTRO
FA*B = MQA*B / MQENTRO
Vantaggio dell’ANOVA fattoriale: SQENTRO e MQENTRO
sono tipicamente più piccole che nell’ANOVA a una via perché alcune fonti di variabilità non sono più d’errore. Questo aumenta la potenza del test.
Lezione: XXVIII
4
ANOVA entro i soggetti
(detta anche per misure ripetute o Within)
Disegni entro i soggetti (within subjects) La V.D. è rilevata più volte sugli stessi soggetti [unità osservative], nelle diverse condizioni sperimentali. Disegni per blocchi randomizzati La V.D. viene rilevata su soggetti ‘appaiati’ su una determinata variabile rilevante. Nelle diverse condizioni ci sono soggetti diversi che vengono trattati come se fossero la stessa persona esposta a prove differenti. Esempio: triplette di persone equiparabili per età, sesso, ideologia politica
Lezione XXIX
5
ANOVA a una via entro i soggetti
Ricerca ‘automobili di prestigio’ Intervista di marketing, indice di prestigio associato a tre diversi marchi: Porsche, Ferrari, Lamborghini Ogni intervistato esprime valutazioni per tutti e tre i marchi.
Le osservazioni non sono indipendenti.
Lezione XXIX
6
ANOVA a una via entro i soggetti
medie di ciascun soggetto rispetto alle 3 condizioni permettono di isolare la parte di devianza totale dei punteggi che dipende dalle differenze tra i soggetti.
medie della V.D. per ciascun livello permettono di stimare la variabilità legata al fattore
Lezione XXIX
7
ANOVA a una via entro i soggetti
Devianza tra i soggetti
devianza dovuta ai livelli del fattore
Devianza entro le celle
Devianza totale
SQTOTALE
SQTRA SQENTRO
SQSOGGETTI SQRESIDUA
La devianza totale viene suddivisa in una parte di devianza TRA le condizioni (l’effetto del marchio valutato) e una parte di devianza ENTRO le condizioni (non attribuibile al marchio). La devianza ENTRO è suddivisa in una parte dovuta alle differenze individuali tra i soggetti e una parte d’errore (variabilità residua). NOTA: le differenze individuali tra i soggetti non costituiscono variabilità d’errore perché rimangono costanti nelle diverse condizioni.
Lezione XXIX
8
ANOVA a una via entro i soggetti
SQTOTALE
SQTRA SQENTRO
SQSOGGETTI SQRESIDUA
g.l.: n*k - 1
g.l.: k - 1 g.l.: n - k
g.l.: n - 1 g.l.: (n – 1) * (k – 1)
MQ = SQ / g.l.
FEFFETTO = MQTRA / MQ RESIDUA
Vantaggio dei disegni entro i soggetti: riduzione della varianza d’errore (disegno più potente – richiede meno soggetti). Utile se la variabilità interindividuale incide molto sulla V.D.
Lezione XXIX
9
ANOVA a una via entro i soggetti:
esempio
Effetto significativo del tipo di marchio, F(2,158) = 31.703, p <.001, η2 = .427.
I test post hoc (correzione di Bonferroni) rivelano che le valutazioni medie del marchio Porsche si discostano significativa-mente da quelle degli altri due marchi, che invece in media non differiscono significativamente.
Lezione XXIX
Ai partecipanti alla ricerca viene chiesto di valutare i marchi Porsche, Ferrari e Lamborghini prima e dopo aver visto una comunicazione commerciale (spot TV) per il marchio Ferrari. Il disegno: 3 (Marchio: Porsche, Ferrari, Lamborghini) x 2 (Misurazione: Pre, Post) entro i soggetti. Per ogni partecipante, la V.D. viene misurata relativamente a tutte le 6 condizioni sperimentali.
10
ANOVA fattoriale entro i soggetti
Lezione XXIX
11
ANOVA fattoriale entro i soggetti
SQTOTALE
SQTRA SQENTRO
SQERR
MARCHIO
SQSOGGETTI
n*a*b - 1
a - 1
(a – 1) * (n – 1)
n – 1
Il disegno: 3 (Marchio: Porsche, Ferrari, Lamborghini) x 2 (Tempo: Pre, Post) entro i soggetti. Scomposizione della devianza (con i relativi g.l.):
SQMARCHIO SQTEMPO
SQINTERA-
ZIONE SQERR
TEMPO
SQERR
INTERAZIONE
Dove: a = nr. livelli fattore ‘marchio’, b = nr. livelli fattore ‘tempo’, n = nr. soggetti
b - 1
(a – 1) * (b – 1) (b – 1) * (n – 1)
(a – 1) * (b – 1) * (n – 1)
ANOVA fattoriale entro i soggetti
SQTOTALE
SQTRA SQENTRO
SQERR
MARCHIO
SQSOGGETTI SQMARCHIO SQTEMPO
SQINTERA-
ZIONE
SQERR
TEMPO
SQERR
INTERAZIONE
Scomposizione della devianza SQ totale: (𝑥𝑎𝑏𝑛 − 𝑥 )𝑛𝑏𝑎
2
SQ effetto principale A: n(x a − x )𝑏𝑎
2 SQ effetto principale B: n(x b − x )𝑏𝑎
2 SQ interazione A*B: n(x ab − x a− x b+ x )
2𝑏𝑎
SQ entro: (𝑥𝑎𝑏𝑛 − 𝑥𝑎𝑏)𝑛𝑏𝑎
2 SQ soggetti: n(x n − x )𝑏𝑎
2 SQ err A: n(x an − x a)𝑏𝑎
2 – SQ soggetti SQ err B: n(x bn − x b)𝑏𝑎
2 – SQ soggetti
SQ err interazione: SQ entro – SQ soggetti – SQ err A – SQ err B
Lezione XXIX
13
ANOVA fattoriale entro i soggetti
esempio
Esempio fattore tempo: F = MQTEMPO / MQERR. TEMPO =
50.70 / 4.02 = 12.60
Interazione. Può essere approfondita con effetti semplici
Lezione XXIX
14
ANOVA fattoriale entro i soggetti
esempio
L’esposizione al messaggio causa un
cambiamento significativo per tutti e
tre i marchi, ma un incremento per i
marchi Porsche e Ferrari, un decremento
per il marchio Lamborghini.
Lezione XXIX
15
ANOVA fattoriale entro i soggetti
esempio
Secondo una prospettiva diversa:
Prima della visione dello spot la percezione dei
marchi Ferrari e Lamborghini non era significativamente
diversa.
Anche dopo la visione dello spot è così.
Lezione XXIX
Almeno un fattore è tra i soggetti, almeno un fattore è entro i soggetti. Esempio: I soggetti sono esposti a tutti i livelli del fattore entro, solo a un livello del fattore tra.
16
ANOVA fattoriale mista
SQTOTALE
SQTRA SQENTRO
SQFatt Entro SQErr. Entro
n*a*b - 1
a - 1 b – 1
SQFatt Tra SQErr. Fatt.
Tra
SQInterazio
ne
a * (n – 1) (a – 1) * (b – 1)
Dove: a = nr. livelli fattore tra, b = nr. livelli fattore entro, n = numero totale di soggetti.
a * (b – 1) * (n – 1)
Sesso Maschi Femmine
17
ANOVA fattoriale mista – esempio – le statistiche
descrittive
Lezione XXIX
18
ANOVA fattoriale mista – esempio – effetti tra i
soggetti
Lezione XXIX
19
ANOVA fattoriale mista – esempio – effetti entro i
soggetti
Le valutazioni del corso intensivo in sede (2) si differenziano significativamente da quelle degli altri due corsi. Le valutazioni di questi ultimi non si differenziano invece significativamente.
Test post hoc sulle medie marginali relative al fattore ‘corso’:
Lezione XXIX
20
ANOVA fattoriale mista – esempio – riportiamo i
risultati
In media, le donne esprimono valutazioni leggermente inferiori agli uomini relativamente ai corsi di formazione, M = 26.45, SD = 3.94 e M = 27.55, SD = 4.08 rispettivamente per le donne e gli uomini. Questa differenza è statisticamente significativa, F (1,76) = 6.23, p = .02, η2
p = .07.
L’ANOVA evidenzia inoltre un effetto statisticamente significativo del tipo di corso, F (2,156) = 9.12, p < .01, η2
p = .10 con M = 25.40, SD = 5.43 per il corso residenziale,
M = 28.82, SD = 5.22 per il corso in sede intensivo e M = 27.00, SD = 4.02 per il corso in sede diluito. L’effetto dell’interazione non è significativo, F (2,156) =0.81, p = .45. I test post hoc sulle medie marginali relative al fattore ‘corso’ (eseguiti con la correzione di Bonferroni) evidenziano differenze significative tra la valutazione del corso intensivo in sede e le valutazioni di entrambi gli altri corsi, in entrambi i casi p < .03. Evidenziano inoltre che la valutazione media del corso residenziale non si differenzia significativamente dalla valutazione del corso diluito in sede, p = .19
Lezione XXIX
21
ANOVA fattoriale – disegni con 3 fattori
Presenza di tre Variabili Indipendenti (fattori) Possono essere sia tra sia entro i soggetti. Esempio tre fattori tra i soggetti: una multinazionale vuole introdurre un sistema di incentivi per aumentare l’efficacia dei suoi venditori. Prima testa il sistema di incentivi su un piccolo gruppo di venditori, in tre Paesi. Il disegno: - Sistema di incentivazione (2 livelli: incentivo vs. controllo) - Paese (3 livelli: Italia, Francia, Germania) - Sesso (2 livelli: maschi vs. femmine) D.V. Numero nuovi contratti in un mese, dopo l’introduzione nel campione del nuovo sistema d’incentivi. Attraverso l’ANOVA fattoriale possiamo analizzare se l’effetto dell’incentivo sia differente per donne ed uomini, o nei diversi Paesi, o tra i sessi in maniera diversa a seconda del Paese.
Lezione XXIX
22
ANOVA fattoriale – disegni con 3 fattori
Presenza di tre Variabili Indipendenti (fattori) Possono essere sia tra sia entro i soggetti. Esempio due fattori tra, uno entro i soggetti: una multinazionale vuole introdurre un sistema di incentivi per aumentare l’efficacia dei suoi venditori. Prima testa il sistema di incentivi su un piccolo gruppo di venditori, in tre Paesi. Il disegno: - Sistema di incentivazione (2 livelli: incentivo vs. controllo) - Paese (3 livelli: Italia, Francia, Germania) - Momento della misura: prima e dopo l’introduzione incentivo. D.V. Numero nuovi contratti in un mese
Lezione XXIX
23
ANOVA fattoriale – Esempio 3 fattori tra i soggetti
I dati:
N = 240 (n = 20 in ogni condizione)
Lezione XXIX
24
ANOVA fattoriale – Esempio 3 fattori tra i soggetti
Le medie
Incentivo Controllo
Lezione XXIX
25
ANOVA fattoriale – Esempio 3 fattori tra i soggetti
L’ANOVA
Lezione XXIX
26
ANOVA fattoriale – Esempio 3 fattori tra i soggetti
L’ANOVA
Lezione XXIX
Effetto principale dell’incentivo, non qualificato da interazioni significative.
27
ANOVA fattoriale – Esempio 3 fattori tra i soggetti
l’ANOVA
Lezione XXIX
28
ANOVA fattoriale – Esempio 3 fattori tra i soggetti
l’ANOVA
Lezione XXIX
29
Analisi della Covarianza (ANCOVA)
Cos’è: tecnica per controllare statisticamente la variabilità causata da (legata a) fonti esterne al disegno. Domande principali: le stesse dell’ANOVA (ossia differenze tra medie nella V.D. in condizioni diverse): Usi tipici: a) Abbassare la variabilità dell’errore tenendo sotto controllo una fonte di
variabilità [perciò escludendo questa varianza dalla componente d’errore] Esempio: Ci sono differenze nelle competenze di chi ha seguito il corso di formazione A e chi non l’ha seguito, dopo che teniamo sotto controllo le conoscenze pregresse?
b) Controllare statisticamente una fonte di disturbo [uso più problematico dell’ANOVA] Esempio: i partecipanti al corso di formazione A sono mediamente più giovani di quelli del corso B e l’età influisce sulla V.D. Si ‘aggiustano’ le medie della V.D.: come sarebbero se i soggetti dei due gruppi non differissero relativamente alla covariata? Come funziona: Gli effetti (principali e d’interazione) dei fattori sono analizzati dopo che i punteggi della V.D. sono corretti per l’effetto di una o più variabili (covariate).
Lezione XXIX
30
ANCOVA – Esempi
Efficacia delle mnemotecniche Fattore mnemotecniche: 3 livelli (Controllo vs. Mnemotecniche A vs. Mnemotecniche B) V.D.: Prestazione mnestica dopo il corso Covariate: Prestazione mnestica prima del corso La domanda: I corsi di mnemotecniche sono efficaci? Ci sono differenze tra i due corsi? Teniamo sotto controllo le differenze interindividuali di memoria
Lezione XXIX
31
ANCOVA – Esempi - II
Effetti di una pubblicità progresso sul risparmio energetico. Fattore pubblicità: 3 livelli (Controllo vs. Messaggio A vs. Messaggio B) V.D.: indice di consumo energetico Covariate: atteggiamenti ecologici; conoscenze pregresse. La domanda: Tenendo sotto controllo gli atteggiamenti e le conoscenze pregresse nei confronti dell’ecologia e del risparmio energetico, qual è l’effetto del messaggio sul consumo energetico?
Lezione XXIX
32
ANCOVA – La logica
1. La V.D. viene regredita sulla covariata (o sulle covariate). → i punteggi della V.D. vengono ‘corretti’ per rimuovere l’effetto della covariata.
Punteggi ‘corretti’ della V.D. = quelli che la V.D. avrebbe se tutti le osservazioni avessero lo stesso valore nella covariata. 2. Viene eseguita l’analisi della varianza per indagare gli effetti dei fattori sulla nuova variabile ‘corretta’. Indice di
consumo energetico
Atteggiamenti verso ecologia
PRE
Lezione XXIX
33
ANCOVA – Esempio
Qual è l’effetto di Spot sul consumo energetico? Fattore Spot - 2 livelli: Visione spot vs. controllo. V.D. Indice di consumo. Covariata: atteggiamento ecologico. [attenzione: misurare la covariata prima di introdurre la manipolazione, perché non ne sia influenzata]
Senza covariata: t-test per campioni indipendenti
Saremmo arrivati alla stessa conclusione con l’ANOVA ( F = t2)
L’effetto dello Spot
non è significativo
34
ANCOVA – Esempio
Importante legame tra atteggiamenti ecologici e consumi: ANCOVA:
Effetto significativo dello spot, tenendo
sotto controllo l’atteggiamento
(covariata)
35
ANCOVA – Esempio
Le medie marginali attese:
Stima puntuale e intervallo di confidenza per le medie nelle condizioni, se la Covariata assume uno specifico valore
Lezione XXIX
36
ANCOVA – Esempio
L’analisi permette di valutare anche l’effetto della
covariata sul consumo energetico
I test di significatività delle covariate permettono di valutare la loro utilità nell’aggiustamento della V.D. Prospettiva della regressione gerarchica: 1. Le covariate sono inserite al primo passo (tutte assieme)
nell’interpretare valgono le considerazioni relative all’analisi di regressione (il test concerne la varianza unica, nella regressione multipla, spiegata da ciascuna covariata).
2. I fattori e le interazioni tra i fattori sono inseriti al secondo passo.
Lezione XXIX
37
Alcune regole sulle covariate
• Dovrebbero essere poche, non correlate tra loro e correlate con la V.D. • Poche: ogni covariata sottrae un g.l. e questo deve essere almeno
compensato dalla riduzione dell’errore
• Se possibile, vanno misurate prima delle manipolazioni • altrimenti si rischia di rimuovere parte dell’effetto dei fattori sulla
V.D. (quella porzione di effetto che V.D. e covariata hanno in comune)
Lezione XXIX
38
ANCOVA - assunzioni
(oltre alle usuali assunzioni di normalità e omogeneità della varianza dell’ANOVA) • Linearità delle relazioni tra le coppie di covariate (se sono più di una)
• Linearità delle relazioni tra le covariate le la V.D.
• Omoschedasticità – la varianza della V.D. deve essere omogenea a
diversi valori della covariata
• Omogeneità della regressione per le diverse condizioni (i coefficienti di regressione tra covariate e D.V. devono essere gli stessi per tutte le condizioni) • Se si sospetta un’interazione tra fattori e covariate, non è
appropriato fare l’ANCOVA
Lezione XXIX