221
Combinare Regressione e ANOVA: predittori quantitativi e categoriali Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 1 / 58

Combinare Regressionee ANOVA: predittori quantitativi ecategoriali … · 2016. 1. 22. · Nicola Tedesco (Statistica Sociale) Combinare Regressione eANOVA: predittoriquantitativi

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

  • Combinare Regressione e ANOVA: predittori

    quantitativi e categoriali

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 1 / 58

  • Introduzione

    Controllare per una Covariata

    La regressione multipla consente di studiare la relazione tra variabiliquantitative

    L’ANOVA consente di verificare come le medie di una variabile quantitativa simodifichino al variare di più predittori categoriali (qualitativi)

    Domanda: è possibile costruire modelli che studino le variazione tra le mediein relazione a predittori di qualsiasi tipo?

    Ciò è possibile combinando le due metodologie

    Esempio: si stanno confrontando i redditi di M e F anche in relazione aidifferenti livelli di esperienza (anzianità di servizio)

    Si vuole studiare come variano i redditi medi tra i due gruppi (M e F)controllando per i valori di un altro predittore quantitativo (esperienza)

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 2 / 58

  • Introduzione

    Controllare per una Covariata

    La regressione multipla consente di studiare la relazione tra variabiliquantitative

    L’ANOVA consente di verificare come le medie di una variabile quantitativa simodifichino al variare di più predittori categoriali (qualitativi)

    Domanda: è possibile costruire modelli che studino le variazione tra le mediein relazione a predittori di qualsiasi tipo?

    Ciò è possibile combinando le due metodologie

    Esempio: si stanno confrontando i redditi di M e F anche in relazione aidifferenti livelli di esperienza (anzianità di servizio)

    Si vuole studiare come variano i redditi medi tra i due gruppi (M e F)controllando per i valori di un altro predittore quantitativo (esperienza)

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 2 / 58

  • Introduzione

    Controllare per una Covariata

    La regressione multipla consente di studiare la relazione tra variabiliquantitative

    L’ANOVA consente di verificare come le medie di una variabile quantitativa simodifichino al variare di più predittori categoriali (qualitativi)

    Domanda: è possibile costruire modelli che studino le variazione tra le mediein relazione a predittori di qualsiasi tipo?

    Ciò è possibile combinando le due metodologie

    Esempio: si stanno confrontando i redditi di M e F anche in relazione aidifferenti livelli di esperienza (anzianità di servizio)

    Si vuole studiare come variano i redditi medi tra i due gruppi (M e F)controllando per i valori di un altro predittore quantitativo (esperienza)

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 2 / 58

  • Introduzione

    Controllare per una Covariata

    La regressione multipla consente di studiare la relazione tra variabiliquantitative

    L’ANOVA consente di verificare come le medie di una variabile quantitativa simodifichino al variare di più predittori categoriali (qualitativi)

    Domanda: è possibile costruire modelli che studino le variazione tra le mediein relazione a predittori di qualsiasi tipo?

    Ciò è possibile combinando le due metodologie

    Esempio: si stanno confrontando i redditi di M e F anche in relazione aidifferenti livelli di esperienza (anzianità di servizio)

    Si vuole studiare come variano i redditi medi tra i due gruppi (M e F)controllando per i valori di un altro predittore quantitativo (esperienza)

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 2 / 58

  • Introduzione

    Controllare per una Covariata

    La regressione multipla consente di studiare la relazione tra variabiliquantitative

    L’ANOVA consente di verificare come le medie di una variabile quantitativa simodifichino al variare di più predittori categoriali (qualitativi)

    Domanda: è possibile costruire modelli che studino le variazione tra le mediein relazione a predittori di qualsiasi tipo?

    Ciò è possibile combinando le due metodologie

    Esempio: si stanno confrontando i redditi di M e F anche in relazione aidifferenti livelli di esperienza (anzianità di servizio)

    Si vuole studiare come variano i redditi medi tra i due gruppi (M e F)controllando per i valori di un altro predittore quantitativo (esperienza)

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 2 / 58

  • Introduzione

    Controllare per una Covariata

    La regressione multipla consente di studiare la relazione tra variabiliquantitative

    L’ANOVA consente di verificare come le medie di una variabile quantitativa simodifichino al variare di più predittori categoriali (qualitativi)

    Domanda: è possibile costruire modelli che studino le variazione tra le mediein relazione a predittori di qualsiasi tipo?

    Ciò è possibile combinando le due metodologie

    Esempio: si stanno confrontando i redditi di M e F anche in relazione aidifferenti livelli di esperienza (anzianità di servizio)

    Si vuole studiare come variano i redditi medi tra i due gruppi (M e F)controllando per i valori di un altro predittore quantitativo (esperienza)

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 2 / 58

  • Introduzione

    Analisi della Covarianza

    In questo caso la variabile rispetto alla quale si effettua il controllo prende ilnome di covariata

    Il modello di regressione, in presenza di covariate, prende il nome di Analisidella Covarianza

    Sostanzialmente, gli effetti di un predittore (qualitativo) possono modificarsial variare dei livelli di un altro predittore (quantitativo) definito covariata

    Es.: i redditi di M e F sono generalmente differenti (+M -F). Ma sappiamoche il reddito è positivamente correlato con l’esperienza. Se i M tendono adavere più esperienza lavorativa delle F, allora la differenza nei loro redditi èdovuta alla variabile esperienza e non al sesso

    Per ragioni di semplicità espositiva ci limiteremo al caso di un predittorecategoriale e di un predittore quantitativo

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 3 / 58

  • Introduzione

    Analisi della Covarianza

    In questo caso la variabile rispetto alla quale si effettua il controllo prende ilnome di covariata

    Il modello di regressione, in presenza di covariate, prende il nome di Analisidella Covarianza

    Sostanzialmente, gli effetti di un predittore (qualitativo) possono modificarsial variare dei livelli di un altro predittore (quantitativo) definito covariata

    Es.: i redditi di M e F sono generalmente differenti (+M -F). Ma sappiamoche il reddito è positivamente correlato con l’esperienza. Se i M tendono adavere più esperienza lavorativa delle F, allora la differenza nei loro redditi èdovuta alla variabile esperienza e non al sesso

    Per ragioni di semplicità espositiva ci limiteremo al caso di un predittorecategoriale e di un predittore quantitativo

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 3 / 58

  • Introduzione

    Analisi della Covarianza

    In questo caso la variabile rispetto alla quale si effettua il controllo prende ilnome di covariata

    Il modello di regressione, in presenza di covariate, prende il nome di Analisidella Covarianza

    Sostanzialmente, gli effetti di un predittore (qualitativo) possono modificarsial variare dei livelli di un altro predittore (quantitativo) definito covariata

    Es.: i redditi di M e F sono generalmente differenti (+M -F). Ma sappiamoche il reddito è positivamente correlato con l’esperienza. Se i M tendono adavere più esperienza lavorativa delle F, allora la differenza nei loro redditi èdovuta alla variabile esperienza e non al sesso

    Per ragioni di semplicità espositiva ci limiteremo al caso di un predittorecategoriale e di un predittore quantitativo

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 3 / 58

  • Introduzione

    Analisi della Covarianza

    In questo caso la variabile rispetto alla quale si effettua il controllo prende ilnome di covariata

    Il modello di regressione, in presenza di covariate, prende il nome di Analisidella Covarianza

    Sostanzialmente, gli effetti di un predittore (qualitativo) possono modificarsial variare dei livelli di un altro predittore (quantitativo) definito covariata

    Es.: i redditi di M e F sono generalmente differenti (+M -F). Ma sappiamoche il reddito è positivamente correlato con l’esperienza. Se i M tendono adavere più esperienza lavorativa delle F, allora la differenza nei loro redditi èdovuta alla variabile esperienza e non al sesso

    Per ragioni di semplicità espositiva ci limiteremo al caso di un predittorecategoriale e di un predittore quantitativo

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 3 / 58

  • Introduzione

    Analisi della Covarianza

    In questo caso la variabile rispetto alla quale si effettua il controllo prende ilnome di covariata

    Il modello di regressione, in presenza di covariate, prende il nome di Analisidella Covarianza

    Sostanzialmente, gli effetti di un predittore (qualitativo) possono modificarsial variare dei livelli di un altro predittore (quantitativo) definito covariata

    Es.: i redditi di M e F sono generalmente differenti (+M -F). Ma sappiamoche il reddito è positivamente correlato con l’esperienza. Se i M tendono adavere più esperienza lavorativa delle F, allora la differenza nei loro redditi èdovuta alla variabile esperienza e non al sesso

    Per ragioni di semplicità espositiva ci limiteremo al caso di un predittorecategoriale e di un predittore quantitativo

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 3 / 58

  • Confrontare le medie e le rette di regressione

    Confrontare le medie e le rette di regressione

    Notazione:

    a X variabile esplicativa quantitativa

    b Z variabile esplicativa categoriale. Se dicotomica è una dummy, se politomicasegue un set di dummy

    Se controllo per Z, sto studiando la relazione di X su Y in ogni categoria di Z

    Se controllo per X, sto studiando se vi sono differenze nelle medie di Y alvariare di Z, per ogni valore di X

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 4 / 58

  • Confrontare le medie e le rette di regressione

    Confrontare le medie e le rette di regressione

    Notazione:

    a X variabile esplicativa quantitativa

    b Z variabile esplicativa categoriale. Se dicotomica è una dummy, se politomicasegue un set di dummy

    Se controllo per Z, sto studiando la relazione di X su Y in ogni categoria di Z

    Se controllo per X, sto studiando se vi sono differenze nelle medie di Y alvariare di Z, per ogni valore di X

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 4 / 58

  • Confrontare le medie e le rette di regressione

    Confrontare le medie e le rette di regressione

    Notazione:

    a X variabile esplicativa quantitativa

    b Z variabile esplicativa categoriale. Se dicotomica è una dummy, se politomicasegue un set di dummy

    Se controllo per Z, sto studiando la relazione di X su Y in ogni categoria di Z

    Se controllo per X, sto studiando se vi sono differenze nelle medie di Y alvariare di Z, per ogni valore di X

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 4 / 58

  • Confrontare le medie e le rette di regressione

    Confrontare le medie e le rette di regressione

    Notazione:

    a X variabile esplicativa quantitativa

    b Z variabile esplicativa categoriale. Se dicotomica è una dummy, se politomicasegue un set di dummy

    Se controllo per Z, sto studiando la relazione di X su Y in ogni categoria di Z

    Se controllo per X, sto studiando se vi sono differenze nelle medie di Y alvariare di Z, per ogni valore di X

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 4 / 58

  • Confrontare le medie e le rette di regressione

    Confrontare le rette di regressione

    Riprendiamo l’esempio sui prezzi di vendita delle caseCasa Prezzo Dimensione Tasse Stanze Letto Bagni Nuova1 279900 2048 3104 4 2 no2 146500 912 1173 2 1 no3 237700 1654 3076 4 2 no4 200000 2068 1608 3 2 no5 159900 1477 1454 3 3 no6 499900 3153 2997 3 2 s̀ı7 265500 1355 4054 3 2 no8 289900 2075 3002 3 2 s̀ı

    La variabile risposta è il Prezzo

    I predittori sono: Dimensione (in yarde quadrate) e Casa Nuova (1 = S e0 = N)

    L’analisi consisterà nel costruire due rette di regressione (una per le casenuove e una per le vecchie) e confrontare i risultati

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 5 / 58

  • Confrontare le medie e le rette di regressione

    Confrontare le rette di regressione

    Riprendiamo l’esempio sui prezzi di vendita delle caseCasa Prezzo Dimensione Tasse Stanze Letto Bagni Nuova1 279900 2048 3104 4 2 no2 146500 912 1173 2 1 no3 237700 1654 3076 4 2 no4 200000 2068 1608 3 2 no5 159900 1477 1454 3 3 no6 499900 3153 2997 3 2 s̀ı7 265500 1355 4054 3 2 no8 289900 2075 3002 3 2 s̀ı

    La variabile risposta è il Prezzo

    I predittori sono: Dimensione (in yarde quadrate) e Casa Nuova (1 = S e0 = N)

    L’analisi consisterà nel costruire due rette di regressione (una per le casenuove e una per le vecchie) e confrontare i risultati

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 5 / 58

  • Confrontare le medie e le rette di regressione

    Confrontare le rette di regressione

    Riprendiamo l’esempio sui prezzi di vendita delle caseCasa Prezzo Dimensione Tasse Stanze Letto Bagni Nuova1 279900 2048 3104 4 2 no2 146500 912 1173 2 1 no3 237700 1654 3076 4 2 no4 200000 2068 1608 3 2 no5 159900 1477 1454 3 3 no6 499900 3153 2997 3 2 s̀ı7 265500 1355 4054 3 2 no8 289900 2075 3002 3 2 s̀ı

    La variabile risposta è il Prezzo

    I predittori sono: Dimensione (in yarde quadrate) e Casa Nuova (1 = S e0 = N)

    L’analisi consisterà nel costruire due rette di regressione (una per le casenuove e una per le vecchie) e confrontare i risultati

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 5 / 58

  • Confrontare le medie e le rette di regressione

    Confrontare le rette di regressione

    Riprendiamo l’esempio sui prezzi di vendita delle caseCasa Prezzo Dimensione Tasse Stanze Letto Bagni Nuova1 279900 2048 3104 4 2 no2 146500 912 1173 2 1 no3 237700 1654 3076 4 2 no4 200000 2068 1608 3 2 no5 159900 1477 1454 3 3 no6 499900 3153 2997 3 2 s̀ı7 265500 1355 4054 3 2 no8 289900 2075 3002 3 2 s̀ı

    La variabile risposta è il Prezzo

    I predittori sono: Dimensione (in yarde quadrate) e Casa Nuova (1 = S e0 = N)

    L’analisi consisterà nel costruire due rette di regressione (una per le casenuove e una per le vecchie) e confrontare i risultati

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 5 / 58

  • Confrontare le medie e le rette di regressione

    Confrontare le rette di regressione

    Riprendiamo l’esempio sui prezzi di vendita delle caseCasa Prezzo Dimensione Tasse Stanze Letto Bagni Nuova1 279900 2048 3104 4 2 no2 146500 912 1173 2 1 no3 237700 1654 3076 4 2 no4 200000 2068 1608 3 2 no5 159900 1477 1454 3 3 no6 499900 3153 2997 3 2 s̀ı7 265500 1355 4054 3 2 no8 289900 2075 3002 3 2 s̀ı

    La variabile risposta è il Prezzo

    I predittori sono: Dimensione (in yarde quadrate) e Casa Nuova (1 = S e0 = N)

    L’analisi consisterà nel costruire due rette di regressione (una per le casenuove e una per le vecchie) e confrontare i risultati

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 5 / 58

  • Confrontare le medie e le rette di regressione

    Confrontare le rette di regressione

    Con l’analisi della covarianza è possibile confrontare lerette di regressione perciascun livello del predittore qualitativo

    Ad es., si osservi la figura

    x

    y

    x

    y

    x

    yz 5 1

    z 5 0

    z 5 1

    z 5 0

    z 5 0 or 1

    (a) No interaction (b) No interaction, with identical y-intercepts

    (c) Interaction

    Il caso (a) ci dice che i prezzi delle case N e V dipendono allo stesso mododal predittore X (Dimensione)

    Il caso (b) ci dice che il prezzo delle case N o V è lo stesso per ogni valore diX

    Il caso (c) ci dice che il predittore X influenza il prezzo delle case in mododiverso a seconda del fatto che sia N o V (è l’interazione)

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 6 / 58

  • Confrontare le medie e le rette di regressione

    Confrontare le rette di regressione

    Con l’analisi della covarianza è possibile confrontare lerette di regressione perciascun livello del predittore qualitativo

    Ad es., si osservi la figura

    x

    y

    x

    y

    x

    yz 5 1

    z 5 0

    z 5 1

    z 5 0

    z 5 0 or 1

    (a) No interaction (b) No interaction, with identical y-intercepts

    (c) Interaction

    Il caso (a) ci dice che i prezzi delle case N e V dipendono allo stesso mododal predittore X (Dimensione)

    Il caso (b) ci dice che il prezzo delle case N o V è lo stesso per ogni valore diX

    Il caso (c) ci dice che il predittore X influenza il prezzo delle case in mododiverso a seconda del fatto che sia N o V (è l’interazione)

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 6 / 58

  • Confrontare le medie e le rette di regressione

    Confrontare le rette di regressione

    Con l’analisi della covarianza è possibile confrontare lerette di regressione perciascun livello del predittore qualitativo

    Ad es., si osservi la figura

    x

    y

    x

    y

    x

    yz 5 1

    z 5 0

    z 5 1

    z 5 0

    z 5 0 or 1

    (a) No interaction (b) No interaction, with identical y-intercepts

    (c) Interaction

    Il caso (a) ci dice che i prezzi delle case N e V dipendono allo stesso mododal predittore X (Dimensione)

    Il caso (b) ci dice che il prezzo delle case N o V è lo stesso per ogni valore diX

    Il caso (c) ci dice che il predittore X influenza il prezzo delle case in mododiverso a seconda del fatto che sia N o V (è l’interazione)

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 6 / 58

  • Confrontare le medie e le rette di regressione

    Confrontare le rette di regressione

    Con l’analisi della covarianza è possibile confrontare lerette di regressione perciascun livello del predittore qualitativo

    Ad es., si osservi la figura

    x

    y

    x

    y

    x

    yz 5 1

    z 5 0

    z 5 1

    z 5 0

    z 5 0 or 1

    (a) No interaction (b) No interaction, with identical y-intercepts

    (c) Interaction

    Il caso (a) ci dice che i prezzi delle case N e V dipendono allo stesso mododal predittore X (Dimensione)

    Il caso (b) ci dice che il prezzo delle case N o V è lo stesso per ogni valore diX

    Il caso (c) ci dice che il predittore X influenza il prezzo delle case in mododiverso a seconda del fatto che sia N o V (è l’interazione)

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 6 / 58

  • Confrontare le medie e le rette di regressione

    Confrontare le rette di regressione

    Con l’analisi della covarianza è possibile confrontare lerette di regressione perciascun livello del predittore qualitativo

    Ad es., si osservi la figura

    x

    y

    x

    y

    x

    yz 5 1

    z 5 0

    z 5 1

    z 5 0

    z 5 0 or 1

    (a) No interaction (b) No interaction, with identical y-intercepts

    (c) Interaction

    Il caso (a) ci dice che i prezzi delle case N e V dipendono allo stesso mododal predittore X (Dimensione)

    Il caso (b) ci dice che il prezzo delle case N o V è lo stesso per ogni valore diX

    Il caso (c) ci dice che il predittore X influenza il prezzo delle case in mododiverso a seconda del fatto che sia N o V (è l’interazione)

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 6 / 58

  • Confrontare le medie e le rette di regressione

    Confrontare le rette di regressione

    Con l’analisi della covarianza è possibile confrontare lerette di regressione perciascun livello del predittore qualitativo

    Ad es., si osservi la figura

    x

    y

    x

    y

    x

    yz 5 1

    z 5 0

    z 5 1

    z 5 0

    z 5 0 or 1

    (a) No interaction (b) No interaction, with identical y-intercepts

    (c) Interaction

    Il caso (a) ci dice che i prezzi delle case N e V dipendono allo stesso mododal predittore X (Dimensione)

    Il caso (b) ci dice che il prezzo delle case N o V è lo stesso per ogni valore diX

    Il caso (c) ci dice che il predittore X influenza il prezzo delle case in mododiverso a seconda del fatto che sia N o V (è l’interazione)

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 6 / 58

  • Confrontare le medie e le rette di regressione

    Confrontare le rette di regressione

    Può accadere che il modo in cui X influenza Y sia diverso al variare dei livellidi Z

    La figura mostra come la relazione di X su Y sia nel complesso positiva, masi annulla per ogni livello di Z

    x

    yOverallrelationship

    Partialrelationships

    Category 1Category 2Category 3

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 7 / 58

  • Confrontare le medie e le rette di regressione

    Confrontare le rette di regressione

    Può accadere che il modo in cui X influenza Y sia diverso al variare dei livellidi Z

    La figura mostra come la relazione di X su Y sia nel complesso positiva, masi annulla per ogni livello di Z

    x

    yOverallrelationship

    Partialrelationships

    Category 1Category 2Category 3

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 7 / 58

  • Confrontare le medie e le rette di regressione

    Confrontare le rette di regressione

    Può accadere che il modo in cui X influenza Y sia diverso al variare dei livellidi Z

    La figura mostra come la relazione di X su Y sia nel complesso positiva, masi annulla per ogni livello di Z

    x

    yOverallrelationship

    Partialrelationships

    Category 1Category 2Category 3

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 7 / 58

  • Confrontare le medie e le rette di regressione

    Confrontare le medie di Y controllando per X

    L’altro caso riguarda lo studio di come la covariata Z influenza Y ,controllando per i diversi valori di X

    L’esempio è quello del reddito Y , il sesso Z e l’esperienza X

    La relazione nota è che il reddito dei M sia superiore a quello delle F, quindiZ influenza Y

    Tuttavia controllando per l’esperienza può accadere che tale relazionescompaia, cioè M e F hanno redditi uguali a parità di esperienza

    Si tratterebbe di una relazione concatenata dove i M hanno un redditomaggiore delle F solo perchè hanno complessivamente più esperienza (tracoloro con elevata esperienza prevalgono i M sulle F)

    Se cos̀ı non fosse, allora davvero il sesso Z influenzerebbe il reddito Y

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 8 / 58

  • Confrontare le medie e le rette di regressione

    Confrontare le medie di Y controllando per X

    L’altro caso riguarda lo studio di come la covariata Z influenza Y ,controllando per i diversi valori di X

    L’esempio è quello del reddito Y , il sesso Z e l’esperienza X

    La relazione nota è che il reddito dei M sia superiore a quello delle F, quindiZ influenza Y

    Tuttavia controllando per l’esperienza può accadere che tale relazionescompaia, cioè M e F hanno redditi uguali a parità di esperienza

    Si tratterebbe di una relazione concatenata dove i M hanno un redditomaggiore delle F solo perchè hanno complessivamente più esperienza (tracoloro con elevata esperienza prevalgono i M sulle F)

    Se cos̀ı non fosse, allora davvero il sesso Z influenzerebbe il reddito Y

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 8 / 58

  • Confrontare le medie e le rette di regressione

    Confrontare le medie di Y controllando per X

    L’altro caso riguarda lo studio di come la covariata Z influenza Y ,controllando per i diversi valori di X

    L’esempio è quello del reddito Y , il sesso Z e l’esperienza X

    La relazione nota è che il reddito dei M sia superiore a quello delle F, quindiZ influenza Y

    Tuttavia controllando per l’esperienza può accadere che tale relazionescompaia, cioè M e F hanno redditi uguali a parità di esperienza

    Si tratterebbe di una relazione concatenata dove i M hanno un redditomaggiore delle F solo perchè hanno complessivamente più esperienza (tracoloro con elevata esperienza prevalgono i M sulle F)

    Se cos̀ı non fosse, allora davvero il sesso Z influenzerebbe il reddito Y

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 8 / 58

  • Confrontare le medie e le rette di regressione

    Confrontare le medie di Y controllando per X

    L’altro caso riguarda lo studio di come la covariata Z influenza Y ,controllando per i diversi valori di X

    L’esempio è quello del reddito Y , il sesso Z e l’esperienza X

    La relazione nota è che il reddito dei M sia superiore a quello delle F, quindiZ influenza Y

    Tuttavia controllando per l’esperienza può accadere che tale relazionescompaia, cioè M e F hanno redditi uguali a parità di esperienza

    Si tratterebbe di una relazione concatenata dove i M hanno un redditomaggiore delle F solo perchè hanno complessivamente più esperienza (tracoloro con elevata esperienza prevalgono i M sulle F)

    Se cos̀ı non fosse, allora davvero il sesso Z influenzerebbe il reddito Y

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 8 / 58

  • Confrontare le medie e le rette di regressione

    Confrontare le medie di Y controllando per X

    L’altro caso riguarda lo studio di come la covariata Z influenza Y ,controllando per i diversi valori di X

    L’esempio è quello del reddito Y , il sesso Z e l’esperienza X

    La relazione nota è che il reddito dei M sia superiore a quello delle F, quindiZ influenza Y

    Tuttavia controllando per l’esperienza può accadere che tale relazionescompaia, cioè M e F hanno redditi uguali a parità di esperienza

    Si tratterebbe di una relazione concatenata dove i M hanno un redditomaggiore delle F solo perchè hanno complessivamente più esperienza (tracoloro con elevata esperienza prevalgono i M sulle F)

    Se cos̀ı non fosse, allora davvero il sesso Z influenzerebbe il reddito Y

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 8 / 58

  • Confrontare le medie e le rette di regressione

    Confrontare le medie di Y controllando per X

    L’altro caso riguarda lo studio di come la covariata Z influenza Y ,controllando per i diversi valori di X

    L’esempio è quello del reddito Y , il sesso Z e l’esperienza X

    La relazione nota è che il reddito dei M sia superiore a quello delle F, quindiZ influenza Y

    Tuttavia controllando per l’esperienza può accadere che tale relazionescompaia, cioè M e F hanno redditi uguali a parità di esperienza

    Si tratterebbe di una relazione concatenata dove i M hanno un redditomaggiore delle F solo perchè hanno complessivamente più esperienza (tracoloro con elevata esperienza prevalgono i M sulle F)

    Se cos̀ı non fosse, allora davvero il sesso Z influenzerebbe il reddito Y

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 8 / 58

  • Confrontare le medie e le rette di regressione

    Confrontare le le medie di Y controllando per X

    La figura mostra molto bene i diversi casi

    x

    y

    x

    y

    x

    y

    (a) No interaction (b) No interaction, with identical regression lines

    Men

    Women

    (c) Interaction

    Il caso (a) mostra come non ci sia interazione tra sesso e esperienza. Larelazione tra X e Y è la stessa per M e F

    Il caso (b) mostra come M e F abbiano lo stesso reddito a parità diesperienza (la relazione Z su Y è la stessa controllando per X )

    Il caso (c) mostra, invece, come il reddito dei M sia superiore a quello delle F(influenza di Z ), e cresca più velocemente a parità di esperienza X

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 9 / 58

  • Confrontare le medie e le rette di regressione

    Confrontare le le medie di Y controllando per X

    La figura mostra molto bene i diversi casi

    x

    y

    x

    y

    x

    y

    (a) No interaction (b) No interaction, with identical regression lines

    Men

    Women

    (c) Interaction

    Il caso (a) mostra come non ci sia interazione tra sesso e esperienza. Larelazione tra X e Y è la stessa per M e F

    Il caso (b) mostra come M e F abbiano lo stesso reddito a parità diesperienza (la relazione Z su Y è la stessa controllando per X )

    Il caso (c) mostra, invece, come il reddito dei M sia superiore a quello delle F(influenza di Z ), e cresca più velocemente a parità di esperienza X

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 9 / 58

  • Confrontare le medie e le rette di regressione

    Confrontare le le medie di Y controllando per X

    La figura mostra molto bene i diversi casi

    x

    y

    x

    y

    x

    y

    (a) No interaction (b) No interaction, with identical regression lines

    Men

    Women

    (c) Interaction

    Il caso (a) mostra come non ci sia interazione tra sesso e esperienza. Larelazione tra X e Y è la stessa per M e F

    Il caso (b) mostra come M e F abbiano lo stesso reddito a parità diesperienza (la relazione Z su Y è la stessa controllando per X )

    Il caso (c) mostra, invece, come il reddito dei M sia superiore a quello delle F(influenza di Z ), e cresca più velocemente a parità di esperienza X

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 9 / 58

  • Confrontare le medie e le rette di regressione

    Confrontare le le medie di Y controllando per X

    La figura mostra molto bene i diversi casi

    x

    y

    x

    y

    x

    y

    (a) No interaction (b) No interaction, with identical regression lines

    Men

    Women

    (c) Interaction

    Il caso (a) mostra come non ci sia interazione tra sesso e esperienza. Larelazione tra X e Y è la stessa per M e F

    Il caso (b) mostra come M e F abbiano lo stesso reddito a parità diesperienza (la relazione Z su Y è la stessa controllando per X )

    Il caso (c) mostra, invece, come il reddito dei M sia superiore a quello delle F(influenza di Z ), e cresca più velocemente a parità di esperienza X

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 9 / 58

  • Regressione con predittori quantitativi e categoriali

    Variabili esplicative quantitative e dummy

    Si consideri il modello con un regressore quantitativo X e uno categoriale a 3livelli, da cui conseguono 2 dummy

    E (y) = α+ βx + β1z1 + β2z2.

    Il coefficiente β indica l’effetto di X sulla media di Y

    I coefficienti β1 e β2 indicano, rispettivamente, gli effetti per le categoriedell’altro predittore (Z )

    Ovviamente si tratta di effetti che si aggiungono (algebricamente) a quellorappresentato da β

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 10 / 58

  • Regressione con predittori quantitativi e categoriali

    Variabili esplicative quantitative e dummy

    Si consideri il modello con un regressore quantitativo X e uno categoriale a 3livelli, da cui conseguono 2 dummy

    E (y) = α+ βx + β1z1 + β2z2.

    Il coefficiente β indica l’effetto di X sulla media di Y

    I coefficienti β1 e β2 indicano, rispettivamente, gli effetti per le categoriedell’altro predittore (Z )

    Ovviamente si tratta di effetti che si aggiungono (algebricamente) a quellorappresentato da β

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 10 / 58

  • Regressione con predittori quantitativi e categoriali

    Variabili esplicative quantitative e dummy

    Si consideri il modello con un regressore quantitativo X e uno categoriale a 3livelli, da cui conseguono 2 dummy

    E (y) = α+ βx + β1z1 + β2z2.

    Il coefficiente β indica l’effetto di X sulla media di Y

    I coefficienti β1 e β2 indicano, rispettivamente, gli effetti per le categoriedell’altro predittore (Z )

    Ovviamente si tratta di effetti che si aggiungono (algebricamente) a quellorappresentato da β

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 10 / 58

  • Regressione con predittori quantitativi e categoriali

    Variabili esplicative quantitative e dummy

    Si consideri il modello con un regressore quantitativo X e uno categoriale a 3livelli, da cui conseguono 2 dummy

    E (y) = α+ βx + β1z1 + β2z2.

    Il coefficiente β indica l’effetto di X sulla media di Y

    I coefficienti β1 e β2 indicano, rispettivamente, gli effetti per le categoriedell’altro predittore (Z )

    Ovviamente si tratta di effetti che si aggiungono (algebricamente) a quellorappresentato da β

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 10 / 58

  • Regressione con predittori quantitativi e categoriali

    Esempio 13.1 — Regressione Reddito Istruzione e Gruppo

    Etnico-Razziale

    Si è considerato un campione di americani ultra 25-enni su cui si sono rilevatele seguenti variabili:

    1 y = reddito annuale

    2 x = anni di istruzione (12 = high school graduate, 16 = college)

    3 z = gruppo etnico-razziale (Neri, Ispanici, Bianchi)

    Il campione di n = 80 intervistati è cos̀ı suddiviso: n1 = 16 neri, n2 = 14ispanici e n3 = 50 bianchi

    Si hanno, in pratica, 3 gruppi di soggetti diversi per gruppo etnico-razziale, esi vuole studiare se il reddito annuale dipende dall’istruzione e/o dal gruppoetnico di appartnenza

    Si introduce il controllo per gruppo etnico

    Lo schema delle dummy è il seguente:

    a z1 = se il soggetto è nero, z1 = 0 altrimenti;

    b z2 = se il soggetto è ispanico, z2 = 0 altrimenti;

    c z1 = z2 = 0 se il soggetto è bianco.

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 11 / 58

  • Regressione con predittori quantitativi e categoriali

    Esempio 13.1 — Regressione Reddito Istruzione e Gruppo

    Etnico-Razziale

    Si è considerato un campione di americani ultra 25-enni su cui si sono rilevatele seguenti variabili:

    1 y = reddito annuale

    2 x = anni di istruzione (12 = high school graduate, 16 = college)

    3 z = gruppo etnico-razziale (Neri, Ispanici, Bianchi)

    Il campione di n = 80 intervistati è cos̀ı suddiviso: n1 = 16 neri, n2 = 14ispanici e n3 = 50 bianchi

    Si hanno, in pratica, 3 gruppi di soggetti diversi per gruppo etnico-razziale, esi vuole studiare se il reddito annuale dipende dall’istruzione e/o dal gruppoetnico di appartnenza

    Si introduce il controllo per gruppo etnico

    Lo schema delle dummy è il seguente:

    a z1 = se il soggetto è nero, z1 = 0 altrimenti;

    b z2 = se il soggetto è ispanico, z2 = 0 altrimenti;

    c z1 = z2 = 0 se il soggetto è bianco.

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 11 / 58

  • Regressione con predittori quantitativi e categoriali

    Esempio 13.1 — Regressione Reddito Istruzione e Gruppo

    Etnico-Razziale

    Si è considerato un campione di americani ultra 25-enni su cui si sono rilevatele seguenti variabili:

    1 y = reddito annuale

    2 x = anni di istruzione (12 = high school graduate, 16 = college)

    3 z = gruppo etnico-razziale (Neri, Ispanici, Bianchi)

    Il campione di n = 80 intervistati è cos̀ı suddiviso: n1 = 16 neri, n2 = 14ispanici e n3 = 50 bianchi

    Si hanno, in pratica, 3 gruppi di soggetti diversi per gruppo etnico-razziale, esi vuole studiare se il reddito annuale dipende dall’istruzione e/o dal gruppoetnico di appartnenza

    Si introduce il controllo per gruppo etnico

    Lo schema delle dummy è il seguente:

    a z1 = se il soggetto è nero, z1 = 0 altrimenti;

    b z2 = se il soggetto è ispanico, z2 = 0 altrimenti;

    c z1 = z2 = 0 se il soggetto è bianco.

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 11 / 58

  • Regressione con predittori quantitativi e categoriali

    Esempio 13.1 — Regressione Reddito Istruzione e Gruppo

    Etnico-Razziale

    Si è considerato un campione di americani ultra 25-enni su cui si sono rilevatele seguenti variabili:

    1 y = reddito annuale

    2 x = anni di istruzione (12 = high school graduate, 16 = college)

    3 z = gruppo etnico-razziale (Neri, Ispanici, Bianchi)

    Il campione di n = 80 intervistati è cos̀ı suddiviso: n1 = 16 neri, n2 = 14ispanici e n3 = 50 bianchi

    Si hanno, in pratica, 3 gruppi di soggetti diversi per gruppo etnico-razziale, esi vuole studiare se il reddito annuale dipende dall’istruzione e/o dal gruppoetnico di appartnenza

    Si introduce il controllo per gruppo etnico

    Lo schema delle dummy è il seguente:

    a z1 = se il soggetto è nero, z1 = 0 altrimenti;

    b z2 = se il soggetto è ispanico, z2 = 0 altrimenti;

    c z1 = z2 = 0 se il soggetto è bianco.

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 11 / 58

  • Regressione con predittori quantitativi e categoriali

    Esempio 13.1 — Regressione Reddito Istruzione e Gruppo

    Etnico-Razziale

    Si è considerato un campione di americani ultra 25-enni su cui si sono rilevatele seguenti variabili:

    1 y = reddito annuale

    2 x = anni di istruzione (12 = high school graduate, 16 = college)

    3 z = gruppo etnico-razziale (Neri, Ispanici, Bianchi)

    Il campione di n = 80 intervistati è cos̀ı suddiviso: n1 = 16 neri, n2 = 14ispanici e n3 = 50 bianchi

    Si hanno, in pratica, 3 gruppi di soggetti diversi per gruppo etnico-razziale, esi vuole studiare se il reddito annuale dipende dall’istruzione e/o dal gruppoetnico di appartnenza

    Si introduce il controllo per gruppo etnico

    Lo schema delle dummy è il seguente:

    a z1 = se il soggetto è nero, z1 = 0 altrimenti;

    b z2 = se il soggetto è ispanico, z2 = 0 altrimenti;

    c z1 = z2 = 0 se il soggetto è bianco.

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 11 / 58

  • Regressione con predittori quantitativi e categoriali

    Esempio 13.1 — Regressione Reddito Istruzione e Gruppo

    Etnico-Razziale

    Si è considerato un campione di americani ultra 25-enni su cui si sono rilevatele seguenti variabili:

    1 y = reddito annuale

    2 x = anni di istruzione (12 = high school graduate, 16 = college)

    3 z = gruppo etnico-razziale (Neri, Ispanici, Bianchi)

    Il campione di n = 80 intervistati è cos̀ı suddiviso: n1 = 16 neri, n2 = 14ispanici e n3 = 50 bianchi

    Si hanno, in pratica, 3 gruppi di soggetti diversi per gruppo etnico-razziale, esi vuole studiare se il reddito annuale dipende dall’istruzione e/o dal gruppoetnico di appartnenza

    Si introduce il controllo per gruppo etnico

    Lo schema delle dummy è il seguente:

    a z1 = se il soggetto è nero, z1 = 0 altrimenti;

    b z2 = se il soggetto è ispanico, z2 = 0 altrimenti;

    c z1 = z2 = 0 se il soggetto è bianco.

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 11 / 58

  • Regressione con predittori quantitativi e categoriali

    Tabella: y = Reddito Annuale (in Migliaia di Dollari) e x = Numero di Anni di Istruzioneper 3 Gruppi Etnici

    Black Hispanic White White White

    y x y x y x y x y x

    16 10 32 16 30 14 62 16 50 1618 7 16 11 48 14 24 10 50 1426 9 20 10 40 7 50 13 22 1116 11 58 16 84 18 32 10 26 1234 14 30 12 50 10 34 16 46 1622 12 26 10 38 12 52 18 22 942 16 20 8 30 12 24 12 24 942 16 40 12 76 16 22 14 64 1416 9 32 10 48 16 20 13 28 1220 10 22 11 36 11 30 14 32 1266 16 20 10 40 11 24 13 38 1426 12 56 14 44 12 120 18 44 1220 10 32 12 30 10 22 10 22 1230 15 30 11 60 15 82 16 18 1020 10 24 9 18 12 24 1230 19 88 17 26 12 56 20

    46 16 104 14

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 12 / 58

  • Regressione con predittori quantitativi e categoriali

    I dati della Tabella mostrano chiaramente che i redditi si differenziano tra igruppi etnici

    Tuttavia ciò potrebbe essere dovuto alle differenze nelle distribuzioni dellavariabile Istruzione

    Se ciò fosse vero, controllando per l’Istruzione, ci aspetteremmo redditi medisimili

    In sintesi abbiamo:

    Tabella: Redditi Medi e Istruzione, per Gruppo Etnico

    Neri Ispanici Bianchi TotaleMedia Reddito y1 = 27.8 y 2 = 31.0 y3 = 42.4 y = 37.6Media Istruzione x̄1 = 12.2 x̄2 = 11.6 x̄3 = 13.1 x̄ = 12.7Dim. campionaria n1 = 16 n2 = 14 n3 = 50 n = 80

    Appare chiaro che i Bianchi hanno il Reddito maggiore ma anche il valore piùelevato per Istruzione

    Domanda: qual è l’effetto più rilevante?

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 13 / 58

  • Regressione con predittori quantitativi e categoriali

    I dati della Tabella mostrano chiaramente che i redditi si differenziano tra igruppi etnici

    Tuttavia ciò potrebbe essere dovuto alle differenze nelle distribuzioni dellavariabile Istruzione

    Se ciò fosse vero, controllando per l’Istruzione, ci aspetteremmo redditi medisimili

    In sintesi abbiamo:

    Tabella: Redditi Medi e Istruzione, per Gruppo Etnico

    Neri Ispanici Bianchi TotaleMedia Reddito y1 = 27.8 y 2 = 31.0 y3 = 42.4 y = 37.6Media Istruzione x̄1 = 12.2 x̄2 = 11.6 x̄3 = 13.1 x̄ = 12.7Dim. campionaria n1 = 16 n2 = 14 n3 = 50 n = 80

    Appare chiaro che i Bianchi hanno il Reddito maggiore ma anche il valore piùelevato per Istruzione

    Domanda: qual è l’effetto più rilevante?

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 13 / 58

  • Regressione con predittori quantitativi e categoriali

    I dati della Tabella mostrano chiaramente che i redditi si differenziano tra igruppi etnici

    Tuttavia ciò potrebbe essere dovuto alle differenze nelle distribuzioni dellavariabile Istruzione

    Se ciò fosse vero, controllando per l’Istruzione, ci aspetteremmo redditi medisimili

    In sintesi abbiamo:

    Tabella: Redditi Medi e Istruzione, per Gruppo Etnico

    Neri Ispanici Bianchi TotaleMedia Reddito y1 = 27.8 y 2 = 31.0 y3 = 42.4 y = 37.6Media Istruzione x̄1 = 12.2 x̄2 = 11.6 x̄3 = 13.1 x̄ = 12.7Dim. campionaria n1 = 16 n2 = 14 n3 = 50 n = 80

    Appare chiaro che i Bianchi hanno il Reddito maggiore ma anche il valore piùelevato per Istruzione

    Domanda: qual è l’effetto più rilevante?

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 13 / 58

  • Regressione con predittori quantitativi e categoriali

    I dati della Tabella mostrano chiaramente che i redditi si differenziano tra igruppi etnici

    Tuttavia ciò potrebbe essere dovuto alle differenze nelle distribuzioni dellavariabile Istruzione

    Se ciò fosse vero, controllando per l’Istruzione, ci aspetteremmo redditi medisimili

    In sintesi abbiamo:

    Tabella: Redditi Medi e Istruzione, per Gruppo Etnico

    Neri Ispanici Bianchi TotaleMedia Reddito y1 = 27.8 y 2 = 31.0 y3 = 42.4 y = 37.6Media Istruzione x̄1 = 12.2 x̄2 = 11.6 x̄3 = 13.1 x̄ = 12.7Dim. campionaria n1 = 16 n2 = 14 n3 = 50 n = 80

    Appare chiaro che i Bianchi hanno il Reddito maggiore ma anche il valore piùelevato per Istruzione

    Domanda: qual è l’effetto più rilevante?

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 13 / 58

  • Regressione con predittori quantitativi e categoriali

    I dati della Tabella mostrano chiaramente che i redditi si differenziano tra igruppi etnici

    Tuttavia ciò potrebbe essere dovuto alle differenze nelle distribuzioni dellavariabile Istruzione

    Se ciò fosse vero, controllando per l’Istruzione, ci aspetteremmo redditi medisimili

    In sintesi abbiamo:

    Tabella: Redditi Medi e Istruzione, per Gruppo Etnico

    Neri Ispanici Bianchi TotaleMedia Reddito y1 = 27.8 y 2 = 31.0 y3 = 42.4 y = 37.6Media Istruzione x̄1 = 12.2 x̄2 = 11.6 x̄3 = 13.1 x̄ = 12.7Dim. campionaria n1 = 16 n2 = 14 n3 = 50 n = 80

    Appare chiaro che i Bianchi hanno il Reddito maggiore ma anche il valore piùelevato per Istruzione

    Domanda: qual è l’effetto più rilevante?

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 13 / 58

  • Regressione con predittori quantitativi e categoriali

    I dati della Tabella mostrano chiaramente che i redditi si differenziano tra igruppi etnici

    Tuttavia ciò potrebbe essere dovuto alle differenze nelle distribuzioni dellavariabile Istruzione

    Se ciò fosse vero, controllando per l’Istruzione, ci aspetteremmo redditi medisimili

    In sintesi abbiamo:

    Tabella: Redditi Medi e Istruzione, per Gruppo Etnico

    Neri Ispanici Bianchi TotaleMedia Reddito y1 = 27.8 y 2 = 31.0 y3 = 42.4 y = 37.6Media Istruzione x̄1 = 12.2 x̄2 = 11.6 x̄3 = 13.1 x̄ = 12.7Dim. campionaria n1 = 16 n2 = 14 n3 = 50 n = 80

    Appare chiaro che i Bianchi hanno il Reddito maggiore ma anche il valore piùelevato per Istruzione

    Domanda: qual è l’effetto più rilevante?

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 13 / 58

  • Regressione con predittori quantitativi e categoriali

    La Tabella riporta i risultati di un modello di regressione con le dummy per ilGruppo Etnico

    Tabella: Modello senza interazioni per la Variabile risposta y = Reddito e VariabiliEsplicative Istruzione e Gruppo Etnico (con variabili dummy per le categorie Neri eIspanici)

    IC 95%Parametri B Std. Error t Sig Inferiore Superiore

    Intercetta -15.663 8.412 -1.862 .066 -32.4 1.09istruzione 4.432 .619 7.158 .000 3.2 5.70razza = N -10.874 4.473 -2.431 .017 -19.8 -2.00razza = I -4.934 4.763 -1.036 .304 -14.4 4.60razza = B 0

    R-Quadro = .462

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 14 / 58

  • Regressione con predittori quantitativi e categoriali

    Si ottiene il seguente modello

    ŷ = −15.7 + 4.4x − 10.9z1 − 4.9z2.

    Considerando i Neri, z1 = 1 e z2 = 0, l’equazione è

    ŷ = −15.7 + 4.4x − 10.9(1)− 4.9(0) = −26.6 + 4.4x .

    Per gli altri gruppi etnici avremo

    ŷ = −20.6 + 4.4x (Ispanici)ŷ = −15.7 + 4.4x (Bianchi)

    I coefficienti angolari sono tutti uguali. Cosa significa?

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 15 / 58

  • Regressione con predittori quantitativi e categoriali

    Si ottiene il seguente modello

    ŷ = −15.7 + 4.4x − 10.9z1 − 4.9z2.

    Considerando i Neri, z1 = 1 e z2 = 0, l’equazione è

    ŷ = −15.7 + 4.4x − 10.9(1)− 4.9(0) = −26.6 + 4.4x .

    Per gli altri gruppi etnici avremo

    ŷ = −20.6 + 4.4x (Ispanici)ŷ = −15.7 + 4.4x (Bianchi)

    I coefficienti angolari sono tutti uguali. Cosa significa?

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 15 / 58

  • Regressione con predittori quantitativi e categoriali

    Si ottiene il seguente modello

    ŷ = −15.7 + 4.4x − 10.9z1 − 4.9z2.

    Considerando i Neri, z1 = 1 e z2 = 0, l’equazione è

    ŷ = −15.7 + 4.4x − 10.9(1)− 4.9(0) = −26.6 + 4.4x .

    Per gli altri gruppi etnici avremo

    ŷ = −20.6 + 4.4x (Ispanici)ŷ = −15.7 + 4.4x (Bianchi)

    I coefficienti angolari sono tutti uguali. Cosa significa?

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 15 / 58

  • Regressione con predittori quantitativi e categoriali

    Si ottiene il seguente modello

    ŷ = −15.7 + 4.4x − 10.9z1 − 4.9z2.

    Considerando i Neri, z1 = 1 e z2 = 0, l’equazione è

    ŷ = −15.7 + 4.4x − 10.9(1)− 4.9(0) = −26.6 + 4.4x .

    Per gli altri gruppi etnici avremo

    ŷ = −20.6 + 4.4x (Ispanici)ŷ = −15.7 + 4.4x (Bianchi)

    I coefficienti angolari sono tutti uguali. Cosa significa?

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 15 / 58

  • Regressione con predittori quantitativi e categoriali

    L’effetto dell’Istruzione sul Reddito è lo stesso in tutti i Gruppi Etnici

    White

    White (y 5 215.7 1 4.4x)

    Black

    Black (y 5 226.6 1 4.4x)

    Income

    Hispanic

    Hispanic (y 5 220.6 1 4.4x)

    Education105

    0

    20

    40

    60

    80

    100

    120

    15 20

    ˆ

    ˆ

    ˆ

    Si può concludere, quindi che il modo in cui l’Istruzione influenza il Reddito èlo stesso in ogni Gruppo Etnico, quindi i Bianchi guadagnano di più non permotivi discriminatori, ma perchè mediamente più istruiti.

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 16 / 58

  • Regressione con predittori quantitativi e categoriali

    L’effetto dell’Istruzione sul Reddito è lo stesso in tutti i Gruppi Etnici

    White

    White (y 5 215.7 1 4.4x)

    Black

    Black (y 5 226.6 1 4.4x)

    Income

    Hispanic

    Hispanic (y 5 220.6 1 4.4x)

    Education105

    0

    20

    40

    60

    80

    100

    120

    15 20

    ˆ

    ˆ

    ˆ

    Si può concludere, quindi che il modo in cui l’Istruzione influenza il Reddito èlo stesso in ogni Gruppo Etnico, quindi i Bianchi guadagnano di più non permotivi discriminatori, ma perchè mediamente più istruiti.

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 16 / 58

  • Regressione con predittori quantitativi e categoriali

    Interpretazione dei parametri: il Modello senza Interazioni

    Riprendiamo il modello teorico

    E (y) = α+ βx + β1z1 + β2z2.

    Per la categoria 1 di Z , con z1 = 1 e z2 = 0, si ha

    E (y) = α+ βx + β1(1) + β2(0) = (α+ β1) + βx .

    In pratica il coefficiente β1 modifica il valore dell’intercetta per la categoria diZ di riferimento

    Stesso discorso per la categoria 2 di Z , per cui il modello sarà

    E (y) = (α+ β2) + βx

    Ovviamente per la categoria 3 di Z si ha E (y) = α+ βx

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 17 / 58

  • Regressione con predittori quantitativi e categoriali

    Interpretazione dei parametri: il Modello senza Interazioni

    Riprendiamo il modello teorico

    E (y) = α+ βx + β1z1 + β2z2.

    Per la categoria 1 di Z , con z1 = 1 e z2 = 0, si ha

    E (y) = α+ βx + β1(1) + β2(0) = (α+ β1) + βx .

    In pratica il coefficiente β1 modifica il valore dell’intercetta per la categoria diZ di riferimento

    Stesso discorso per la categoria 2 di Z , per cui il modello sarà

    E (y) = (α+ β2) + βx

    Ovviamente per la categoria 3 di Z si ha E (y) = α+ βx

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 17 / 58

  • Regressione con predittori quantitativi e categoriali

    Interpretazione dei parametri: il Modello senza Interazioni

    Riprendiamo il modello teorico

    E (y) = α+ βx + β1z1 + β2z2.

    Per la categoria 1 di Z , con z1 = 1 e z2 = 0, si ha

    E (y) = α+ βx + β1(1) + β2(0) = (α+ β1) + βx .

    In pratica il coefficiente β1 modifica il valore dell’intercetta per la categoria diZ di riferimento

    Stesso discorso per la categoria 2 di Z , per cui il modello sarà

    E (y) = (α+ β2) + βx

    Ovviamente per la categoria 3 di Z si ha E (y) = α+ βx

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 17 / 58

  • Regressione con predittori quantitativi e categoriali

    Interpretazione dei parametri: il Modello senza Interazioni

    Riprendiamo il modello teorico

    E (y) = α+ βx + β1z1 + β2z2.

    Per la categoria 1 di Z , con z1 = 1 e z2 = 0, si ha

    E (y) = α+ βx + β1(1) + β2(0) = (α+ β1) + βx .

    In pratica il coefficiente β1 modifica il valore dell’intercetta per la categoria diZ di riferimento

    Stesso discorso per la categoria 2 di Z , per cui il modello sarà

    E (y) = (α+ β2) + βx

    Ovviamente per la categoria 3 di Z si ha E (y) = α+ βx

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 17 / 58

  • Regressione con predittori quantitativi e categoriali

    Interpretazione dei parametri: il Modello senza Interazioni

    Riprendiamo il modello teorico

    E (y) = α+ βx + β1z1 + β2z2.

    Per la categoria 1 di Z , con z1 = 1 e z2 = 0, si ha

    E (y) = α+ βx + β1(1) + β2(0) = (α+ β1) + βx .

    In pratica il coefficiente β1 modifica il valore dell’intercetta per la categoria diZ di riferimento

    Stesso discorso per la categoria 2 di Z , per cui il modello sarà

    E (y) = (α+ β2) + βx

    Ovviamente per la categoria 3 di Z si ha E (y) = α+ βx

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 17 / 58

  • Regressione con predittori quantitativi e categoriali

    Più in dettaglio, ciascun coefficiente di regressione indica la differenza tral’intercetta della propria categoria e quella della categoria di riferimento

    In questo caso le rette sono tra loro parallele, quindi ciascun βi rappresenta ladistanza verticale tra le rette di regressione, per ogni valore di xi di X

    In buona sostanza, controllando per X , ciascun βi è la differenza tra la mediadella categoria i-ma e l’ultima.

    Tabella: Equazioni di Regressione e interpretazione dei Parametri

    Differenze fra lemedie della Cat. 3,

    Categoria y-Int. Pendenza E(y) per un fissato x controllando per X

    1 α+ β1 β (α+ β1) + βx β12 α+ β2 β (α+ β2) + βx β23 α β α+ βx 0

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 18 / 58

  • Regressione con predittori quantitativi e categoriali

    Più in dettaglio, ciascun coefficiente di regressione indica la differenza tral’intercetta della propria categoria e quella della categoria di riferimento

    In questo caso le rette sono tra loro parallele, quindi ciascun βi rappresenta ladistanza verticale tra le rette di regressione, per ogni valore di xi di X

    In buona sostanza, controllando per X , ciascun βi è la differenza tra la mediadella categoria i-ma e l’ultima.

    Tabella: Equazioni di Regressione e interpretazione dei Parametri

    Differenze fra lemedie della Cat. 3,

    Categoria y-Int. Pendenza E(y) per un fissato x controllando per X

    1 α+ β1 β (α+ β1) + βx β12 α+ β2 β (α+ β2) + βx β23 α β α+ βx 0

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 18 / 58

  • Regressione con predittori quantitativi e categoriali

    Più in dettaglio, ciascun coefficiente di regressione indica la differenza tral’intercetta della propria categoria e quella della categoria di riferimento

    In questo caso le rette sono tra loro parallele, quindi ciascun βi rappresenta ladistanza verticale tra le rette di regressione, per ogni valore di xi di X

    In buona sostanza, controllando per X , ciascun βi è la differenza tra la mediadella categoria i-ma e l’ultima.

    Tabella: Equazioni di Regressione e interpretazione dei Parametri

    Differenze fra lemedie della Cat. 3,

    Categoria y-Int. Pendenza E(y) per un fissato x controllando per X

    1 α+ β1 β (α+ β1) + βx β12 α+ β2 β (α+ β2) + βx β23 α β α+ βx 0

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 18 / 58

  • Regressione con predittori quantitativi e categoriali

    Più in dettaglio, ciascun coefficiente di regressione indica la differenza tral’intercetta della propria categoria e quella della categoria di riferimento

    In questo caso le rette sono tra loro parallele, quindi ciascun βi rappresenta ladistanza verticale tra le rette di regressione, per ogni valore di xi di X

    In buona sostanza, controllando per X , ciascun βi è la differenza tra la mediadella categoria i-ma e l’ultima.

    Tabella: Equazioni di Regressione e interpretazione dei Parametri

    Differenze fra lemedie della Cat. 3,

    Categoria y-Int. Pendenza E(y) per un fissato x controllando per X

    1 α+ β1 β (α+ β1) + βx β12 α+ β2 β (α+ β2) + βx β23 α β α+ βx 0

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 18 / 58

  • Regressione con predittori quantitativi e categoriali

    Graficamente si ha:

    x

    y

    a

    a 1 b2

    a 1 b1

    E(y) 5 a 1 bx (category 3)

    E(y) 5 (a 1 b1) 1 bx (category 1)

    E(y) 5 (a 1 b2) 1 bx (category 2)

    b1

    b2

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 19 / 58

  • Regressione con predittori quantitativi e categoriali

    In riferimento all’esercizio precedente, abbiamo questa equazione diregressione

    ŷ = −15.7 + 4.4x − 10.9z1 − 4.9z2

    Poiché la categoria di riferimento è Bianchi, il coefficiente β1 = −10.9, indicache i Neri guadagnano in media $10.900 in meno rispetto ai Bianchi, perciascun livello di istruzione

    Più esattamente per ciascun valore della variabile X Istruzione

    Nel caso di β2 = −4.9, diremo che gli Ispanici hanno in media un RedditoAnnuale inferiore di $4.900 rispetto ai Bianchi ∀xOvviamente la differenza β1 − β2 = −10.9− (−4.9) = −6.0 ci dice che i Nerihanno un Reddito Annuale inferiore di $6.000 rispetto agli Ispanici ∀x

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 20 / 58

  • Regressione con predittori quantitativi e categoriali

    In riferimento all’esercizio precedente, abbiamo questa equazione diregressione

    ŷ = −15.7 + 4.4x − 10.9z1 − 4.9z2

    Poiché la categoria di riferimento è Bianchi, il coefficiente β1 = −10.9, indicache i Neri guadagnano in media $10.900 in meno rispetto ai Bianchi, perciascun livello di istruzione

    Più esattamente per ciascun valore della variabile X Istruzione

    Nel caso di β2 = −4.9, diremo che gli Ispanici hanno in media un RedditoAnnuale inferiore di $4.900 rispetto ai Bianchi ∀xOvviamente la differenza β1 − β2 = −10.9− (−4.9) = −6.0 ci dice che i Nerihanno un Reddito Annuale inferiore di $6.000 rispetto agli Ispanici ∀x

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 20 / 58

  • Regressione con predittori quantitativi e categoriali

    In riferimento all’esercizio precedente, abbiamo questa equazione diregressione

    ŷ = −15.7 + 4.4x − 10.9z1 − 4.9z2

    Poiché la categoria di riferimento è Bianchi, il coefficiente β1 = −10.9, indicache i Neri guadagnano in media $10.900 in meno rispetto ai Bianchi, perciascun livello di istruzione

    Più esattamente per ciascun valore della variabile X Istruzione

    Nel caso di β2 = −4.9, diremo che gli Ispanici hanno in media un RedditoAnnuale inferiore di $4.900 rispetto ai Bianchi ∀xOvviamente la differenza β1 − β2 = −10.9− (−4.9) = −6.0 ci dice che i Nerihanno un Reddito Annuale inferiore di $6.000 rispetto agli Ispanici ∀x

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 20 / 58

  • Regressione con predittori quantitativi e categoriali

    In riferimento all’esercizio precedente, abbiamo questa equazione diregressione

    ŷ = −15.7 + 4.4x − 10.9z1 − 4.9z2

    Poiché la categoria di riferimento è Bianchi, il coefficiente β1 = −10.9, indicache i Neri guadagnano in media $10.900 in meno rispetto ai Bianchi, perciascun livello di istruzione

    Più esattamente per ciascun valore della variabile X Istruzione

    Nel caso di β2 = −4.9, diremo che gli Ispanici hanno in media un RedditoAnnuale inferiore di $4.900 rispetto ai Bianchi ∀xOvviamente la differenza β1 − β2 = −10.9− (−4.9) = −6.0 ci dice che i Nerihanno un Reddito Annuale inferiore di $6.000 rispetto agli Ispanici ∀x

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 20 / 58

  • Regressione con predittori quantitativi e categoriali

    In riferimento all’esercizio precedente, abbiamo questa equazione diregressione

    ŷ = −15.7 + 4.4x − 10.9z1 − 4.9z2

    Poiché la categoria di riferimento è Bianchi, il coefficiente β1 = −10.9, indicache i Neri guadagnano in media $10.900 in meno rispetto ai Bianchi, perciascun livello di istruzione

    Più esattamente per ciascun valore della variabile X Istruzione

    Nel caso di β2 = −4.9, diremo che gli Ispanici hanno in media un RedditoAnnuale inferiore di $4.900 rispetto ai Bianchi ∀xOvviamente la differenza β1 − β2 = −10.9− (−4.9) = −6.0 ci dice che i Nerihanno un Reddito Annuale inferiore di $6.000 rispetto agli Ispanici ∀x

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 20 / 58

  • Modello con Interazioni tra Predittori Quantitativi e Qualitativi

    Modello con Interazioni tra Predittori Quantitativi e

    Qualitativi

    Nelle Scienze Sociali, come al solito, il caso più frequente prevede l’esistenzadi Interazioni

    In questo caso si tratta di stimarle considerando che abbiamo predittori diogni tipo (quantitativi e qualitativi). Ci limitiamo al caso di 2 predittori

    In questo caso le rette di regressione avranno pendenze differenti

    Per calcolare le interazioni si considerano i prodotti vettoriali tra le variabiliesplicative, definiti anche prodotti incrociati

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 21 / 58

  • Modello con Interazioni tra Predittori Quantitativi e Qualitativi

    Modello con Interazioni tra Predittori Quantitativi e

    Qualitativi

    Nelle Scienze Sociali, come al solito, il caso più frequente prevede l’esistenzadi Interazioni

    In questo caso si tratta di stimarle considerando che abbiamo predittori diogni tipo (quantitativi e qualitativi). Ci limitiamo al caso di 2 predittori

    In questo caso le rette di regressione avranno pendenze differenti

    Per calcolare le interazioni si considerano i prodotti vettoriali tra le variabiliesplicative, definiti anche prodotti incrociati

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 21 / 58

  • Modello con Interazioni tra Predittori Quantitativi e Qualitativi

    Modello con Interazioni tra Predittori Quantitativi e

    Qualitativi

    Nelle Scienze Sociali, come al solito, il caso più frequente prevede l’esistenzadi Interazioni

    In questo caso si tratta di stimarle considerando che abbiamo predittori diogni tipo (quantitativi e qualitativi). Ci limitiamo al caso di 2 predittori

    In questo caso le rette di regressione avranno pendenze differenti

    Per calcolare le interazioni si considerano i prodotti vettoriali tra le variabiliesplicative, definiti anche prodotti incrociati

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 21 / 58

  • Modello con Interazioni tra Predittori Quantitativi e Qualitativi

    Modello con Interazioni tra Predittori Quantitativi e

    Qualitativi

    Nelle Scienze Sociali, come al solito, il caso più frequente prevede l’esistenzadi Interazioni

    In questo caso si tratta di stimarle considerando che abbiamo predittori diogni tipo (quantitativi e qualitativi). Ci limitiamo al caso di 2 predittori

    In questo caso le rette di regressione avranno pendenze differenti

    Per calcolare le interazioni si considerano i prodotti vettoriali tra le variabiliesplicative, definiti anche prodotti incrociati

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 21 / 58

  • Modello con Interazioni tra Predittori Quantitativi e Qualitativi

    Esempio 13.2 — Regressione Reddito Istruzione e Gruppo

    Etnico-Razziale con Interazioni

    Rispetto al caso precedente (assenza di interazioni) abbiamo anche i terminidi interazione x × z1 e x × z2Rappresentano i prodotti incrociati delle prime 2 categorie con la variabile X

    Tabella: Modello con interazioni per la Var. risposta y = Reddito e Var. EsplicativeIstruzione e Gruppo Etnico (con variabili dummy per le categorie Neri e Ispanici)

    Parametri B Std. Error t SigIntercetta -25.869 10.498 -2.464 .016Istruzione 5.210 .783 6.655 .000razza = N 19.333 18.293 1.057 .294razza = I 9.264 24.282 .382 .704razza = B 0 . . .razza = N ∗ Istruzione -2.411 1.418 -1.700 .093razza = I ∗ Istruzione -1.121 2.006 -.559 .578razza = B ∗ Istruzione 0 . . .R-Quadro = 0.482

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 22 / 58

  • Modello con Interazioni tra Predittori Quantitativi e Qualitativi

    Esempio 13.2 — Regressione Reddito Istruzione e Gruppo

    Etnico-Razziale con Interazioni

    Rispetto al caso precedente (assenza di interazioni) abbiamo anche i terminidi interazione x × z1 e x × z2Rappresentano i prodotti incrociati delle prime 2 categorie con la variabile X

    Tabella: Modello con interazioni per la Var. risposta y = Reddito e Var. EsplicativeIstruzione e Gruppo Etnico (con variabili dummy per le categorie Neri e Ispanici)

    Parametri B Std. Error t SigIntercetta -25.869 10.498 -2.464 .016Istruzione 5.210 .783 6.655 .000razza = N 19.333 18.293 1.057 .294razza = I 9.264 24.282 .382 .704razza = B 0 . . .razza = N ∗ Istruzione -2.411 1.418 -1.700 .093razza = I ∗ Istruzione -1.121 2.006 -.559 .578razza = B ∗ Istruzione 0 . . .R-Quadro = 0.482

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 22 / 58

  • Modello con Interazioni tra Predittori Quantitativi e Qualitativi

    Esempio 13.2 — Regressione Reddito Istruzione e Gruppo

    Etnico-Razziale con Interazioni

    Rispetto al caso precedente (assenza di interazioni) abbiamo anche i terminidi interazione x × z1 e x × z2Rappresentano i prodotti incrociati delle prime 2 categorie con la variabile X

    Tabella: Modello con interazioni per la Var. risposta y = Reddito e Var. EsplicativeIstruzione e Gruppo Etnico (con variabili dummy per le categorie Neri e Ispanici)

    Parametri B Std. Error t SigIntercetta -25.869 10.498 -2.464 .016Istruzione 5.210 .783 6.655 .000razza = N 19.333 18.293 1.057 .294razza = I 9.264 24.282 .382 .704razza = B 0 . . .razza = N ∗ Istruzione -2.411 1.418 -1.700 .093razza = I ∗ Istruzione -1.121 2.006 -.559 .578razza = B ∗ Istruzione 0 . . .R-Quadro = 0.482

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 22 / 58

  • Modello con Interazioni tra Predittori Quantitativi e Qualitativi

    In forma analitica l’equazione di regressione (o equazione di previsione) sarà

    ŷ = −25.9 + 5.2x + 19.3z1 + 9.3z2 − 2.4(x × z1)− 1.1(x × z2).

    Se vogliamo considerare solo il gruppo dei Bianchi (z1 = z2 = 0) l’equazionesarà

    ŷ = −25.9 + 5.2x + 19.3(0) + 9.3(0)− 2.4x(0)− 1.1x(0) = −25.9 + 5.2x .

    Rispettivamente per i Neri (z1 = 1 e z2 = 0,) e gli Ispanici (z1 = 0, z2 = 1)avremo

    ŷ = −6.6 + 2.8x .

    ŷ = −16.6 + 4.1x .

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 23 / 58

  • Modello con Interazioni tra Predittori Quantitativi e Qualitativi

    In forma analitica l’equazione di regressione (o equazione di previsione) sarà

    ŷ = −25.9 + 5.2x + 19.3z1 + 9.3z2 − 2.4(x × z1)− 1.1(x × z2).

    Se vogliamo considerare solo il gruppo dei Bianchi (z1 = z2 = 0) l’equazionesarà

    ŷ = −25.9 + 5.2x + 19.3(0) + 9.3(0)− 2.4x(0)− 1.1x(0) = −25.9 + 5.2x .

    Rispettivamente per i Neri (z1 = 1 e z2 = 0,) e gli Ispanici (z1 = 0, z2 = 1)avremo

    ŷ = −6.6 + 2.8x .

    ŷ = −16.6 + 4.1x .

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 23 / 58

  • Modello con Interazioni tra Predittori Quantitativi e Qualitativi

    In forma analitica l’equazione di regressione (o equazione di previsione) sarà

    ŷ = −25.9 + 5.2x + 19.3z1 + 9.3z2 − 2.4(x × z1)− 1.1(x × z2).

    Se vogliamo considerare solo il gruppo dei Bianchi (z1 = z2 = 0) l’equazionesarà

    ŷ = −25.9 + 5.2x + 19.3(0) + 9.3(0)− 2.4x(0)− 1.1x(0) = −25.9 + 5.2x .

    Rispettivamente per i Neri (z1 = 1 e z2 = 0,) e gli Ispanici (z1 = 0, z2 = 1)avremo

    ŷ = −6.6 + 2.8x .

    ŷ = −16.6 + 4.1x .

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 23 / 58

  • Modello con Interazioni tra Predittori Quantitativi e Qualitativi

    Significato e dei Coefficienti del Modello

    Il coeff. di z1 β1 = 19.3 fornisce la differenza tra le intercette del modello perla categoria 1 e quello per la categoria 3

    Questa è la differenza, però, solo se x = 0, in quanto le due equazioni hannopendenze differenti

    In questo caso contano le interazioni: infatti, il parametro dell’interazionex × z1 = −2.4, misura la differenza tra le pendenze dei due modelli

    2.4 = 5.2− 2.8

    Sostanzialmente ci dice di quanto diminuisce l’effetto dell’Istruzione sulReddito Annuale per i Neri rispetto ai Bianchi, in quanto esiste un’interazioneIstruzione-Gruppo Etnico

    Ovviamente le due rette saranno parallele quando il coefficientedell’interazione è nullo

    Stesso discorso per la categoria 2 (Ispanici), il cui coefficiente di interazione èpari a x × z2 = −1.1

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 24 / 58

  • Modello con Interazioni tra Predittori Quantitativi e Qualitativi

    Significato e dei Coefficienti del Modello

    Il coeff. di z1 β1 = 19.3 fornisce la differenza tra le intercette del modello perla categoria 1 e quello per la categoria 3

    Questa è la differenza, però, solo se x = 0, in quanto le due equazioni hannopendenze differenti

    In questo caso contano le interazioni: infatti, il parametro dell’interazionex × z1 = −2.4, misura la differenza tra le pendenze dei due modelli

    2.4 = 5.2− 2.8

    Sostanzialmente ci dice di quanto diminuisce l’effetto dell’Istruzione sulReddito Annuale per i Neri rispetto ai Bianchi, in quanto esiste un’interazioneIstruzione-Gruppo Etnico

    Ovviamente le due rette saranno parallele quando il coefficientedell’interazione è nullo

    Stesso discorso per la categoria 2 (Ispanici), il cui coefficiente di interazione èpari a x × z2 = −1.1

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 24 / 58

  • Modello con Interazioni tra Predittori Quantitativi e Qualitativi

    Significato e dei Coefficienti del Modello

    Il coeff. di z1 β1 = 19.3 fornisce la differenza tra le intercette del modello perla categoria 1 e quello per la categoria 3

    Questa è la differenza, però, solo se x = 0, in quanto le due equazioni hannopendenze differenti

    In questo caso contano le interazioni: infatti, il parametro dell’interazionex × z1 = −2.4, misura la differenza tra le pendenze dei due modelli

    2.4 = 5.2− 2.8

    Sostanzialmente ci dice di quanto diminuisce l’effetto dell’Istruzione sulReddito Annuale per i Neri rispetto ai Bianchi, in quanto esiste un’interazioneIstruzione-Gruppo Etnico

    Ovviamente le due rette saranno parallele quando il coefficientedell’interazione è nullo

    Stesso discorso per la categoria 2 (Ispanici), il cui coefficiente di interazione èpari a x × z2 = −1.1

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 24 / 58

  • Modello con Interazioni tra Predittori Quantitativi e Qualitativi

    Significato e dei Coefficienti del Modello

    Il coeff. di z1 β1 = 19.3 fornisce la differenza tra le intercette del modello perla categoria 1 e quello per la categoria 3

    Questa è la differenza, però, solo se x = 0, in quanto le due equazioni hannopendenze differenti

    In questo caso contano le interazioni: infatti, il parametro dell’interazionex × z1 = −2.4, misura la differenza tra le pendenze dei due modelli

    2.4 = 5.2− 2.8

    Sostanzialmente ci dice di quanto diminuisce l’effetto dell’Istruzione sulReddito Annuale per i Neri rispetto ai Bianchi, in quanto esiste un’interazioneIstruzione-Gruppo Etnico

    Ovviamente le due rette saranno parallele quando il coefficientedell’interazione è nullo

    Stesso discorso per la categoria 2 (Ispanici), il cui coefficiente di interazione èpari a x × z2 = −1.1

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 24 / 58

  • Modello con Interazioni tra Predittori Quantitativi e Qualitativi

    Significato e dei Coefficienti del Modello

    Il coeff. di z1 β1 = 19.3 fornisce la differenza tra le intercette del modello perla categoria 1 e quello per la categoria 3

    Questa è la differenza, però, solo se x = 0, in quanto le due equazioni hannopendenze differenti

    In questo caso contano le interazioni: infatti, il parametro dell’interazionex × z1 = −2.4, misura la differenza tra le pendenze dei due modelli

    2.4 = 5.2− 2.8

    Sostanzialmente ci dice di quanto diminuisce l’effetto dell’Istruzione sulReddito Annuale per i Neri rispetto ai Bianchi, in quanto esiste un’interazioneIstruzione-Gruppo Etnico

    Ovviamente le due rette saranno parallele quando il coefficientedell’interazione è nullo

    Stesso discorso per la categoria 2 (Ispanici), il cui coefficiente di interazione èpari a x × z2 = −1.1

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 24 / 58

  • Modello con Interazioni tra Predittori Quantitativi e Qualitativi

    Significato e dei Coefficienti del Modello

    Il coeff. di z1 β1 = 19.3 fornisce la differenza tra le intercette del modello perla categoria 1 e quello per la categoria 3

    Questa è la differenza, però, solo se x = 0, in quanto le due equazioni hannopendenze differenti

    In questo caso contano le interazioni: infatti, il parametro dell’interazionex × z1 = −2.4, misura la differenza tra le pendenze dei due modelli

    2.4 = 5.2− 2.8

    Sostanzialmente ci dice di quanto diminuisce l’effetto dell’Istruzione sulReddito Annuale per i Neri rispetto ai Bianchi, in quanto esiste un’interazioneIstruzione-Gruppo Etnico

    Ovviamente le due rette saranno parallele quando il coefficientedell’interazione è nullo

    Stesso discorso per la categoria 2 (Ispanici), il cui coefficiente di interazione èpari a x × z2 = −1.1

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 24 / 58

  • Modello con Interazioni tra Predittori Quantitativi e Qualitativi

    In sintesi abbiamo il seguente prospetto:

    Tabella: Equazione di Previsione ŷ = −25.9 + 5.2x + 19.3z1 + 9.3z2 −2.4(x × z1)− 1.1(x × z2) con Interazioni

    Diff. dallaCat. 3

    Cat. y-Int. Pend. Equazione di Previsione y-Int. Pend.

    1 −25.9 + 19.3 5.2− 2.4 (−25.9 + 19.3) + (5.2− 2.4)x 19.3 −2.42 −25.9 + 9.3 5.2− 1.1 (−25.9 + 9.3) + (5.2− 1.1)x 9.3 −1.13 −25.9 5.2 −25.9 + 5.2x 0 0

    In pratica i valori delle differenze nelle Pendenze, indicano qual è la diminuzione nelReddito Annuale al crescere di un anno nell’Istruzione, per ogni categoria rispetto aquella di riferimento (Bianchi)

    I Neri tendono, a parità di Istruzione, a guadagnare meno dei Bianchi, mentre pergli Ispanici tale tendenza è meno forte

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 25 / 58

  • Modello con Interazioni tra Predittori Quantitativi e Qualitativi

    In sintesi abbiamo il seguente prospetto:

    Tabella: Equazione di Previsione ŷ = −25.9 + 5.2x + 19.3z1 + 9.3z2 −2.4(x × z1)− 1.1(x × z2) con Interazioni

    Diff. dallaCat. 3

    Cat. y-Int. Pend. Equazione di Previsione y-Int. Pend.

    1 −25.9 + 19.3 5.2− 2.4 (−25.9 + 19.3) + (5.2− 2.4)x 19.3 −2.42 −25.9 + 9.3 5.2− 1.1 (−25.9 + 9.3) + (5.2− 1.1)x 9.3 −1.13 −25.9 5.2 −25.9 + 5.2x 0 0

    In pratica i valori delle differenze nelle Pendenze, indicano qual è la diminuzione nelReddito Annuale al crescere di un anno nell’Istruzione, per ogni categoria rispetto aquella di riferimento (Bianchi)

    I Neri tendono, a parità di Istruzione, a guadagnare meno dei Bianchi, mentre pergli Ispanici tale tendenza è meno forte

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 25 / 58

  • Modello con Interazioni tra Predittori Quantitativi e Qualitativi

    In sintesi abbiamo il seguente prospetto:

    Tabella: Equazione di Previsione ŷ = −25.9 + 5.2x + 19.3z1 + 9.3z2 −2.4(x × z1)− 1.1(x × z2) con Interazioni

    Diff. dallaCat. 3

    Cat. y-Int. Pend. Equazione di Previsione y-Int. Pend.

    1 −25.9 + 19.3 5.2− 2.4 (−25.9 + 19.3) + (5.2− 2.4)x 19.3 −2.42 −25.9 + 9.3 5.2− 1.1 (−25.9 + 9.3) + (5.2− 1.1)x 9.3 −1.13 −25.9 5.2 −25.9 + 5.2x 0 0

    In pratica i valori delle differenze nelle Pendenze, indicano qual è la diminuzione nelReddito Annuale al crescere di un anno nell’Istruzione, per ogni categoria rispetto aquella di riferimento (Bianchi)

    I Neri tendono, a parità di Istruzione, a guadagnare meno dei Bianchi, mentre pergli Ispanici tale tendenza è meno forte

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 25 / 58

  • Modello con Interazioni tra Predittori Quantitativi e Qualitativi

    Graficamente abbiamo:

    White

    White (y 5 225.9 1 5.2x)

    Black

    Black (y 5 26.6 1 2.8x)

    Hispanic

    Hispanic (y 5 216.6 1 4.1x)

    ˆ

    ˆ

    ˆ

    Income

    Education10

    0

    20

    40

    60

    80

    100

    120

    15 205

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 26 / 58

  • Modello con Interazioni tra Predittori Quantitativi e Qualitativi

    Si può concludere che in un modello con interazioni, le medie della variabilerisposta Y variano in funzione della covariata X

    Ad. es., possiamo calcolare la differenza nel Reddito Medio Annuale traBianchi e Ispanici al variare di x in modo semplice:

    (−25.9 + 5.2x)− (−16.6 + 4.1x) = −9.3 + 1.1x .

    Ciò significa che il differenziale nel Reddito Medio Annuale per le duecategorie è diverso per ogni livello dell’Istruzione

    In pratica all’aumentare dell’Istruzione aumenta la differenza nel RedditoMedio Annuale

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 27 / 58

  • Modello con Interazioni tra Predittori Quantitativi e Qualitativi

    Si può concludere che in un modello con interazioni, le medie della variabilerisposta Y variano in funzione della covariata X

    Ad. es., possiamo calcolare la differenza nel Reddito Medio Annuale traBianchi e Ispanici al variare di x in modo semplice:

    (−25.9 + 5.2x)− (−16.6 + 4.1x) = −9.3 + 1.1x .

    Ciò significa che il differenziale nel Reddito Medio Annuale per le duecategorie è diverso per ogni livello dell’Istruzione

    In pratica all’aumentare dell’Istruzione aumenta la differenza nel RedditoMedio Annuale

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 27 / 58

  • Modello con Interazioni tra Predittori Quantitativi e Qualitativi

    Si può concludere che in un modello con interazioni, le medie della variabilerisposta Y variano in funzione della covariata X

    Ad. es., possiamo calcolare la differenza nel Reddito Medio Annuale traBianchi e Ispanici al variare di x in modo semplice:

    (−25.9 + 5.2x)− (−16.6 + 4.1x) = −9.3 + 1.1x .

    Ciò significa che il differenziale nel Reddito Medio Annuale per le duecategorie è diverso per ogni livello dell’Istruzione

    In pratica all’aumentare dell’Istruzione aumenta la differenza nel RedditoMedio Annuale

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 27 / 58

  • Modello con Interazioni tra Predittori Quantitativi e Qualitativi

    Si può concludere che in un modello con interazioni, le medie della variabilerisposta Y variano in funzione della covariata X

    Ad. es., possiamo calcolare la differenza nel Reddito Medio Annuale traBianchi e Ispanici al variare di x in modo semplice:

    (−25.9 + 5.2x)− (−16.6 + 4.1x) = −9.3 + 1.1x .

    Ciò significa che il differenziale nel Reddito Medio Annuale per le duecategorie è diverso per ogni livello dell’Istruzione

    In pratica all’aumentare dell’Istruzione aumenta la differenza nel RedditoMedio Annuale

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 27 / 58

  • Modello con Interazioni tra Predittori Quantitativi e Qualitativi

    R o R2 per Confrontare Modelli Diversi

    Un metodo che consente di capire se l’aggiunta dei termini di interazione e/odegli effetti singoli sia utile, si basa sull’incremento del valore di R2 o quellodel Coefficiente di Correlazione Multipla R

    Nel nostro esempio, il modello privo di interazioni mostra un R2 = 0.462,mentre il modello con interazioni mostra un R2 = 0.482

    Conseguentemente , i Coefficienti di Correlazione Multipla saranno√0.462 = 0.680 e

    √0.482 = 0.695

    Si osserva chiaramente come l’incremento sia modesto

    Quindi introdurre i termini di interazione non aggiunge nulla di importanteper spiegare le relazioni tra i predittori e la variabile risposta

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 28 / 58

  • Modello con Interazioni tra Predittori Quantitativi e Qualitativi

    R o R2 per Confrontare Modelli Diversi

    Un metodo che consente di capire se l’aggiunta dei termini di interazione e/odegli effetti singoli sia utile, si basa sull’incremento del valore di R2 o quellodel Coefficiente di Correlazione Multipla R

    Nel nostro esempio, il modello privo di interazioni mostra un R2 = 0.462,mentre il modello con interazioni mostra un R2 = 0.482

    Conseguentemente , i Coefficienti di Correlazione Multipla saranno√0.462 = 0.680 e

    √0.482 = 0.695

    Si osserva chiaramente come l’incremento sia modesto

    Quindi introdurre i termini di interazione non aggiunge nulla di importanteper spiegare le relazioni tra i predittori e la variabile risposta

    Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 28 / 58

  • Modello con Interazioni tra Predittori Quantitativi e Qualitativi

    R o R2 per Confrontare Modelli Diversi

    Un metodo che consente di capire se l’aggiunta dei termini di interazione e/odegli effetti singoli sia utile, si basa sull’incremento del valore di R2 o quellodel Coefficiente di Correlazione Multipla R

    Nel nostro esempio, il modello privo di interazioni mostra un R2 = 0.462,mentre il modello con interazioni mostra un R2 = 0.482

    Conseguentemente , i Coefficienti di Correlazione Multipla s