Transcript
Page 1: Quale retta ? Quale retta? - Moodle@Units · 2018-04-09 · 119 Stima retta di regressione esempio supermercati 0 50 100 150 200 250 0 50 100 150 200 250 300 350 Spazio espositivo

115

Quale retta ?

13

Quale retta?

Questa certamente

no!

Questa?

Oppure questa?

Metodo dei minimi quadrati

Indichiamo la generica retta come:

dove b0 e b1 sono da determinare e sono le stime di E0 e E1La retta “migliore” è quella che più si avvicina all’insieme deipunti corrispondenti alle coppie di valori (xi, yi).Per la stima dei parametri si impiega abitualmente il metododei minimi quadrati

min))(()ˆ(1

210

1

2 �� � ¦¦

n

iii

n

iii xbbyyy

ii xbby 10ˆ �

Page 2: Quale retta ? Quale retta? - Moodle@Units · 2018-04-09 · 119 Stima retta di regressione esempio supermercati 0 50 100 150 200 250 0 50 100 150 200 250 300 350 Spazio espositivo

116

Metodo dei minimi quadrati

retta di regressione stimata è tanto più adatta a descrivere la relazione studiata quanto più i punti osservati (Yi) si trovano in prossimità di essaSi definiscono residui campionari:

Criterio dei minimi quadrati (OLS): a e b sono scelti in modo da minimizzare la somma dei quadrati dei residui campionari

ˆi i i i ie Y Y Y a bX= - = - -

( )22

1 1( , )

n n

i i ii i

f a b e Y a bX= =

= = - -å å

Y a bX= +Retta stimata:

!" ordinata teorica corrispondente ad un dato valore di Xcoefficiente a - intercetta – è l’ordinata all’origine della rettacoefficiente di regressione b è il coefficiente angolare della retta

Page 3: Quale retta ? Quale retta? - Moodle@Units · 2018-04-09 · 119 Stima retta di regressione esempio supermercati 0 50 100 150 200 250 0 50 100 150 200 250 300 350 Spazio espositivo

117

Stima dei parametri con metodo dei minimi quadrati

( )22

1 1( , )

n n

i i ii i

f a b e Y a bX= =

= = - -å å = minimo

( , ) ( , ) 0f a b f a ba b

¶ ¶= =

¶ ¶

Risolvendo le due derivate rispetto ad a e b, si ottiene:

1 1

n n

i ii iY na b X

= =

= +å å 2

1 1 1

n n n

i i i ii i iX Y a X b X

= = =

= +å å å

a Y bX= - 2

1 1

n n

i i ii i

b x y x= =

=å åxi e yi indicano gli scarti delle osservazioni campionariedal relativo valore medio

Page 4: Quale retta ? Quale retta? - Moodle@Units · 2018-04-09 · 119 Stima retta di regressione esempio supermercati 0 50 100 150 200 250 0 50 100 150 200 250 300 350 Spazio espositivo

118

Proprietà dei minimi quadratiPROPRIETA’ I dei MQ

La somma dei valori teorici è uguale alla

somma dei valori osservati:

Da ciò consegue che anche la media dei valoriteorici e la media dei valori osservati sonouguali e, inoltre, che la somma dei residui deiminimi quadrati è identicamente nulla:

¦¦

n

ii

n

ii yy

11

ˆ

0)ˆ(11

� ¦¦

n

iii

n

ii yyrei

PROPRIETA’ II dei MQ

Page 5: Quale retta ? Quale retta? - Moodle@Units · 2018-04-09 · 119 Stima retta di regressione esempio supermercati 0 50 100 150 200 250 0 50 100 150 200 250 300 350 Spazio espositivo

119

Stima retta di regressione esempio supermercati

0

50

100

150

200

250

0 50 100 150 200 250 300 350

Spazio espositivo

Volume vendite

ˆ 10,19 0,67Y X= - + ×coefficiente di regressione:

ad ogni incremento unitario della variabile X la variabile Y subisce anch’essa un incremento, di intensità 0,67 – ovvero ad ogni incremento di un m2 nella superficie del supermercato il volume delle vendite settimanali aumenta di 67 euro (0,67 x 100)

Che dire del valore dell’intercetta ?

Page 6: Quale retta ? Quale retta? - Moodle@Units · 2018-04-09 · 119 Stima retta di regressione esempio supermercati 0 50 100 150 200 250 0 50 100 150 200 250 300 350 Spazio espositivo

120

Bontà di adattamento

Bontà di adattamento

La verifica della validità o bontà di adattamento della retta di regressione è diretta a controllare che la retta di regressione sia realmente in grado di spiegare l’andamento delle osservazioni

La retta (modello) stimata descrive bene i dati osservati ?

Page 7: Quale retta ? Quale retta? - Moodle@Units · 2018-04-09 · 119 Stima retta di regressione esempio supermercati 0 50 100 150 200 250 0 50 100 150 200 250 300 350 Spazio espositivo

121

Scomposizione dello scostamento dalla media di Y La scomposizione dello scostamento dalla media

xix

yi Retta stimata

ei

ei

Page 8: Quale retta ? Quale retta? - Moodle@Units · 2018-04-09 · 119 Stima retta di regressione esempio supermercati 0 50 100 150 200 250 0 50 100 150 200 250 300 350 Spazio espositivo

122

Scomposizione della devianza di Y SCOMPOSIZIONE DELLA DEVIANZA

)()ˆ()( EDEVYDEVYDEV �

¦

� n

ii yyYDEV

1

2)()(

¦

� n

ii yyYDEV

1

2)ˆ()ˆ(

¦¦

� n

ii

n

iii ryyEDEV

1

2

1

2)ˆ()(

devianza totale dei valori della variabile dipendente

Misura la variazione dei valori di Y intorno alla loro media

devianza dei valori stimati: devianza di regressione

Variazione spiegata attribuibile alla relazione fra la X e Y

devianza dei residui: devianza residua

Variazione attribuibile a fattori estranei alla relazione fra la X e Y

ei

SCOMPOSIZIONE DELLA DEVIANZA

)()ˆ()( EDEVYDEVYDEV �

¦

� n

ii yyYDEV

1

2)()(

¦

� n

ii yyYDEV

1

2)ˆ()ˆ(

¦¦

� n

ii

n

iii ryyEDEV

1

2

1

2)ˆ()(

devianza totale dei valori della variabile dipendente

Misura la variazione dei valori di Y intorno alla loro media

devianza dei valori stimati: devianza di regressione

Variazione spiegata attribuibile alla relazione fra la X e Y

devianza dei residui: devianza residua

Variazione attribuibile a fattori estranei alla relazione fra la X e Y

ei2

Page 9: Quale retta ? Quale retta? - Moodle@Units · 2018-04-09 · 119 Stima retta di regressione esempio supermercati 0 50 100 150 200 250 0 50 100 150 200 250 300 350 Spazio espositivo

123

MISURA DELLA BONTA’ DI ADATTAMENTOUna misura relativa (e normalizzata) è l’ indice di determinazione lineare che si indica con R2 (R-squared) ed è il rapporto tra la devianza di regressione e la devianza totale:

L’indice R2, essendo un rapporto d’una parte al tutto, può assumere valori compresi tra 0 ed 1:

se R2 = 0 l’adattamento è pessimose R2 = 1 l’adattamento è perfetto

)()(1

)()ˆ(R2

YDEVEDEV

YDEVYDEV

Misura della bontà di adattamento

frazione di varianza della variabile risposta “spiegata” dal modello

Page 10: Quale retta ? Quale retta? - Moodle@Units · 2018-04-09 · 119 Stima retta di regressione esempio supermercati 0 50 100 150 200 250 0 50 100 150 200 250 300 350 Spazio espositivo

124

Esempi di R2

Y

X

R2 = 1

Y

X

R2 = 1

Relazione lineare perfetta fra X e Y:Il 100% della variabilità di Y è spiegata dalla variabilità di X

Y

XR2 =0,73

Solo una parte della variabilità di Y è spiegata dalla variabilità di X

Y

XR2 =0,28

Possibili situazioni

Page 11: Quale retta ? Quale retta? - Moodle@Units · 2018-04-09 · 119 Stima retta di regressione esempio supermercati 0 50 100 150 200 250 0 50 100 150 200 250 300 350 Spazio espositivo

125

Esempi di R2

R2 = 0

Nessuna relazione lineare fra X e Y:

Il valore di Y non dipende da X. (Nessuna variazione di Y è spiegata da X)

Y

XR2 = 0

Possibili situazioni

se la situazione è quella indicata dal grafico !

Page 12: Quale retta ? Quale retta? - Moodle@Units · 2018-04-09 · 119 Stima retta di regressione esempio supermercati 0 50 100 150 200 250 0 50 100 150 200 250 300 350 Spazio espositivo

126

Osservazioni su R2 /1OSSERVAZIONI

1. R2=0 e R2=1 rappresentano dei casi limite che in pratica non sipresentano mai

2. L‘indice R2 non misura se c’è una relazione tra le 2 variabili, ma soloquanto i dati osservati possano essere approssimati da una retta: sel’indice di determinazione lineare si rivela prossimo ad 1, si può dire chela variabilità di Y è “spiegata” in misura notevole dalla retta diregressione.

3. Non si utilizza il termini “causata” poiché un valore di R2 prossimo ad 1non implica necessariamente un nesso causale tra le due variabili.

Y

X

Fra X e Y sussiste unarelazione, ma non è di tipolineare: R2 prossimo allo 0

Page 13: Quale retta ? Quale retta? - Moodle@Units · 2018-04-09 · 119 Stima retta di regressione esempio supermercati 0 50 100 150 200 250 0 50 100 150 200 250 300 350 Spazio espositivo

127

Osservazioni su R2 /2

R2: indicazione globale su bontà di adattamento

Page 14: Quale retta ? Quale retta? - Moodle@Units · 2018-04-09 · 119 Stima retta di regressione esempio supermercati 0 50 100 150 200 250 0 50 100 150 200 250 300 350 Spazio espositivo

128

situazione ideale ! situazione simile ma relazione più debole: residui più dispersi

Fonte: Chambers et al., 1983

Possibili situazioni

Page 15: Quale retta ? Quale retta? - Moodle@Units · 2018-04-09 · 119 Stima retta di regressione esempio supermercati 0 50 100 150 200 250 0 50 100 150 200 250 300 350 Spazio espositivo

129

relazione curvilinea: curvatura ancora più evidente dei residui (alto, basso, alto o viceversa)

un punto presenta un valore x molto distante dagli altri ma consistente (in termini di y) rispetto alla configurazione lineare del resto dei punti (x = leverage point)

*"

Fonte: Chambers et al., 1983

Page 16: Quale retta ? Quale retta? - Moodle@Units · 2018-04-09 · 119 Stima retta di regressione esempio supermercati 0 50 100 150 200 250 0 50 100 150 200 250 300 350 Spazio espositivo

130

Variabilità dei punti non è costante al variare di x, ancora più evidente nei residui. Possibile alternativa: trasformare le variabili

Fonte: Chambers et al., 1983

Page 17: Quale retta ? Quale retta? - Moodle@Units · 2018-04-09 · 119 Stima retta di regressione esempio supermercati 0 50 100 150 200 250 0 50 100 150 200 250 300 350 Spazio espositivo

131

Relazioni non lineari ma “linearizzabili” mediante trasformazioni di variabili (a seguito dell’ispezione del diagramma di dispersione): Trasformazioni più comuni per tener conto di un andamento curvilineo con y che cresce più velocemente di x

1.  Y = α + βX2

2.  Log(Y) = α + βX

3.  Log(Y) = α + βLog(X)

(Metodo minimi quadrati può essere applicato a modelli generali g(Y) = α + βh(X)+(errore) con g(Y) e h(X) appropriate funzioni. Importante è che il modello sia lineare nei parametri

Relazioni “linearizzabili”


Recommended