10 Linearizzazione e retta dei min quad 2017 18

X

Y

Il diagramma di dispersione suggerisce che le funzione di interpolazione dei dati non sono lineari, ma presentano un andamento che in un caso (dots neri) potrebbe essere di tipo esponenziale, mentre nell’altro caso (dots rossi) potrebbe essere di tipo radice.

Linearizzazione

Quando i dati sperimentali non evidenziano una correlazione di tipolineare, ma presentano un andamento di tipo esponenziale,polinomiale, etc. è difficile (se non impossibile) ricavaregraficamente i parametri caratteristici della curva, che spesso hannoun significato chimico-fisico ben preciso e potrebbero pertantofornire utilissime informazioni su un certo fenomeno.

In questi casi è conveniente trasformare l'equazione che rappresentala curva che meglio approssima i dati in quella di una rettaeffettuando un cambiamento di variabili (linearizzazione)

Il procedimento di linearizzazione consiste nell'usare una funzionedelle variabili anziché le variabili stesse.

Una classe importante di linearizzazioni è quella legata adandamenti esponenziali (o logaritmici) e a leggi di potenza.Consideriamo la funzione

Per ricondurci ad una forma più «comoda», applichiamo una"linearizzazione" della funzione applicando la funzione logaritmo:

PonendoY = ln y, C = ln A, X = x

Si graficano i dati mediante le nuove variabili funzionali X,Y chehanno così dipendenza lineare.

BxAey =

BXCY +=

BxAy += lnln

x3.0Bx e2Aey == 6391.0x3.02lnx3.0ylnY +=+==

Esempio

0

5

10

15

20

25

30

35

40

45

0 1 2 3 4 5 6 7 8 9 10

y

x

0

0,5

1

1,5

2

2,5

3

3,5

4

0 1 2 3 4 5 6 7 8 9 10

Y = ln y

X

Altri esempi:

7x5y 3 +=

nxX = yY =

7X5Y +=

0

100

200

300

400

500

600

700

0 1 2 3 4 5

y

x

0

100

200

300

400

500

600

700

0 20 40 60 80 100 120

y

X=x3

BAxy n +=

xX = yY =

xAy =

x5y =

0

2

4

6

8

10

12

14

16

18

0 2 4 6 8 10 12

y

x

0

2

4

6

8

10

12

14

16

18

0 1 2 3 4

Y

X=radice quadrata x

X5Y =

oppure

xX = 2yY =

xAy =

0

2

4

6

8

10

12

14

16

18

0 2 4 6 8 10 12

y

x0

50

100

150

200

250

300

0 2 4 6 8 10 12

Y=y^2

X

x5y =

xAy 22 =

X25Y =

Grafici con scale non lineari

Scale Logaritmiche

Una scala logaritmica è un asse sul quale sono riportati segmenti proporzionali ai logaritmi dei numeri

• sull’asse prescelto (ad es. asse x ) si rappresenta il punto di ascissa 1 = 100

• nella direzione positiva si rappresentano, a distanze uguali fra di loro, i punti di ascissa 101 , 102 , 103 , . . .

• nella direzione negativa si rappresentano, a distanze uguali fra di loro, i puntidi ascissa 10−1 , 10−2 , 10−3 , . . .

• i valori intermedi tra una potenza di 10 e la successiva (ad.es. 2 , 3 , . . . 9 ) sono posizionati ai valori dei rispettivi logaritmi decimali

1 2 3 4 5 6 … 10 20 30 40 50…. 100 200 300 400……

Carta SemiLogaritmica

scala lineare sull’asse delle ascisse X e scala logaritmica sull’asse delle ordinate Y (o viceversa)

TRASFORMAZIONE DI VARIABILI

xX = ylogY 10=lineare sull’asse X e logaritmica sull’asse Y

xlogX 10= yY =logaritmica sull’asse X e lineare sull’asse Y

Carta Logaritmica

scala logaritmica sull’asse delle ascisse X e scala logaritmica sull’asse delle ordinate Y

TRASFORMAZIONE DI VARIABILI

ylogY 10=xlogX 10=

APPLICAZIONI:

• rappresentare misure positive con ordini di grandezza molto diversi fra loro

• linearizzare funzioni esponenziali scale semilogaritmiche

• linearizzare funzioni potenza scale logaritmiche

xKay =

aBxy =

Data la funzione esponenziale

passando ai logaritmi decimali e utilizzando le proprietà dei logaritmi

ponendo

si ha l’equazione di una retta

xKay =

ylogY 10=xX =

alogxKlog

alogKlogKalogylog

1010

x1010

x1010

+=+==

alogXKlogY 1010 +=

intercetta coefficiente angolare

Carta SemiLogaritmica

Data la funzione potenza

passando ai logaritmi decimali e utilizzando le proprietà dei logaritmi

ponendo

si ha l’equazione di una retta

ylogY 10=

xlogaBlog

xlogBlogBxlogylog

1010

a1010

a1010

+=+==

intercetta coefficiente angolare

aXBlogY 10 +=

Carta Logaritmica

aBxy =

xlogX 10=

0 10000

1 50002 25003 12504 625

5 3126 1567 788 39

9 2010 10

0 1 2 3 4 5 6 7 8 9 10

10

100

1000

10000

x4 )5.0(10y =

0

2000

4000

6000

8000

10000

12000

0 2 4 6 8 10

y

x

Esempio

Retta dei minimi quadrati

Il metodo della massima e minima pendenza per determinare laretta di best-fit è un metodo grafico che funziona abbastanzabene, ma non esiste alcuna giustificazione teorica dellaprocedura.

Affrontiamo il problema con un metodo più rigoroso.

Consideriamo N coppie di misure (xi, yi) di due grandezze x e yfra le quali sappiamo che esiste una relazione di tipo lineare:

Supponiamo che l’incertezza su una delle due variabili (adesempio sulla x) sia trascurabile rispetto a quella dell’altra (y)

baxy +=

determiniamo i migliori valori di a e b corrispondenti

ai dati sperimentali

In corrispondenza di ogni xi esiste un valore “teorico”dato dalla relazione

ovvero rappresenta l’ordinata del punto di ascissa xi

appartenente alla retta, mentre yi è quello misuratosperimentalmente in corrispondenza di xi .

baxy iti +=

tiy

tiy

baxy +=

xi

yitiy

In genere, a causa degli errori di misura,

e può essere a volte a volte

La quantità rappresenta lo scarto del valoresperimentale da quello teorico

iti yy ≠

iti yy < i

ti yy >

tiii yy −=ε

xi

yitiy

εi( )

baxy

baxyyy

ii

iitiii

−−+−=−=ε

Al variare di a e b la retta cambierà

pendenza o traslerà e gli scarti

assumeranno valori diversi

Osservazione: un grande valore di εi non ha di per sè un grandesignificato . Ciò che conta è il valore assoluto dello scarto rispettoall’errore da cui e’ affetto yi.

La “miglior retta” deve rendere il più possibile piccoli i valoriassoluti degli scarti (divisi per i rispettivi errori).

Poichè rendere piccolo uno scarto può renderne grandi altri,allora come “miglior retta” si prende quella che rende minima

la somma dei quadrati degli scarti (divisi per i rispettivi errori)

(Principio di Massima Verosimiglianza)

La “miglior retta” è quella che rende minima la quantità

( )∑∑==

−−=

=

N

1i2i

2ii

2N

1i i

i baxyz

σσε

dove σi è l’incertezza statistica sulla misura yi.

z = z (a, b) , al variare di a e b, assume uno ed un solo minimo in corrispondenza dei valori per cui le derivate parziali rispetto a e b si annullano

0b

z

a

z =∂∂=

∂∂

( ) ( )( )

( )0

baxy2

1baxy2baxy

bb

z

N

1i2i

ii

N

1i2i

iiN

1i2i

2ii

=−−−

=−−−=

−−∂∂=

∂∂

∑

∑∑

=

==

σ

σσ

( ) ( )( )

( )0

baxyx2

xbaxy2baxy

aa

z

N

1i2i

iii

N

1i2i

iiiN

1i2i

2ii

=−−−

=−−−=

−−∂∂=

∂∂

∑

∑∑

=

==

σ

σσ

( )0

baxyN

1i2i

ii =−−∑= σ

( )0

baxyxN

1i2i

iii =−−∑= σ

Che equivale ad avere il sistema:

0xbxayxN

1ii

N

1i

2i

N

1iii =−− ∑∑∑

===

Supponendo che le σi siano tutte uguali σi = σ

0bxayN

1i

N

1ii

N

1ii =−− ∑∑∑

===

Sistema di 2 equazioni in 2 incognite

0=⋅−⋅− SxbSxxaSxy

0xbxayxN

1ii

N

1i

2i

N

1iii =−− ∑∑∑

===

0bxayN

1i

N

1ii

N

1ii =−− ∑∑∑

===

SxxSxySx

Sy Sx bN

0NbSxaSy =⋅−⋅−

SxySxbSxxa =⋅+⋅SyNbSxa =⋅−⋅

Usando la regola di Cramer

2SxSxxN

SxSySxyNa

−−=

2SxSxxN

SxSxySxxSyb

−−=

2

11

2

111

−

−=

∑∑

∑∑∑

==

===

N

ii

N

ii

N

ii

N

iii

N

ii

xxN

yxyxNa

2

11

2

1111

2

−

−=

∑∑

∑∑∑∑

==

====

N

ii

N

ii

N

iii

N

ii

N

ii

N

ii

xxN

yxxyxb

I parametri a e b sono affetti da incertezza (perché lo sono le yi).

Per la propagazione degli errori statistici:

∑=

⋅

∂∂=

N

iy

iiy

aa

1

2

2

2 )( σσ

∑=

⋅

∂∂=

N

iy

iiy

bb

1

2

2

2 )( σσ

2

11

2

1

−

−=

∂∂

∑∑

∑

==

=

N

ii

N

ii

N

iii

ixxN

xNx

y

a

2y2N

1ii

N

1i

2i

N

1i

2y

2

2N

1ii

N

1i

2i

N

1iii

2

xxN

N

xxN

xNx

)a(

σ

σσ

−

=⋅

−

−=

∑∑

∑∑∑

∑

==

=

==

=

Nell’ipotesi che tutte le varianze siano uguali

22

11

2

1

2

2 )( yN

ii

N

ii

N

ii

xxN

xb σσ

−=

∑∑

∑

==

=

Analogamente si calcola

Riassumendo:

( ) Nxx

1

xN

1xN

1

xN

1x

N

1N

N

xxN

N)a(

2y

222y2N

1ii

2

2y2N

1ii2

N

1i

2i

2

2y2N

1ii

N

1i

2i

2

σσ

σσσ

−=

−

=

−

=

−

=

∑

∑∑∑∑

=

====

Nxx

x

xxN

x

)b(2y

22

22y2N

1ii

N

1i

2i

N

1i

2i

2 σσσ

−=

−

=

∑∑

∑

==

=

Queste espressioni indicano che le incertezze sui parametridella retta diminuiscono all’aumentare di N, ma anche dellaquantità

denominata “braccio della leva” della estensione dellemisure: lo stesso numero di misure sparse su un intervallopiù grande determinano i parametri con una maggioreprecisione.

Si può inoltre dimostrare che la retta dei minimi quadratipassa per il punto B(xB,yB) le cui coordinate sono i baricentridelle misure di x ed y.

22 xx −

∑=

=N

1iiB x

N

1x ∑

==

N

1iiB y

N

1y

[ ]2N

)bax(yN

1i

2ii

y −

+−=∑=σ

Se la non è nota la si può stimare tramite la dispersione dei punti intorno alla retta:

yσ

È stata così determinata la “migliore retta” che approssima uninsieme di dati sperimentali rendendo minima la somma deiquadrati delle distanze, misurate nella direzione della asse y, deipunti dalla retta.

La retta così determinata di dice retta di regressione (di y su x)

residui

Avremmo potuto minimizzare la somma dei quadrati delledistanze misurate nella direzione dell’asse x, ovvero laquantità

( )∑

=

−−N

i i

ii byax

12

2''

σ

La retta così determinata di dice retta di regressione (di x su y).

In genere le due rette non coincidono, ma quanto più ladistribuzione dei punti è prossima ad essere rettilinea, tanto piùle due rette di regressione si avvicinano.

Infine è possibile rendere minima la somma dei quadrati delledistanze misurate ortogonalmente dai punti alla retta.La retta così determinata di dice retta di regressione

ortogonale.

Generalizzazione del metodo dei minimi quadrati

Il metodo può essere applicato in modo molto più generale.

Consideriamo N coppie di misure (xi, yi) di due grandezze x e ye supponiamo che l’incertezza su una delle due variabili (adesempio sulla x) sia trascurabile rispetto a quella dell’altra (y) eche le σi siano tutte uguali σi = σ

Inoltre la relazione che lega le 2 variabili sia espressa dallagenerica funzione

( )pcccccxfy ,...,,,, 4321=

cj sono i parametri di cui si vogliono determinare i

valori in corrispondenza dei quali la curva meglio si

adatta ai dati sperimentali

Il metodo dei minimi quadrati permette di determinare i valoridei parametri cj che rendono minima la quantità:

( )[ ]∑=

−=N

1i2

221ii ,...c,c,xfy

zσ

0...21

=∂∂==

∂∂=

∂∂

pc

z

c

z

c

z

Mediante la risoluzione del sistema di equazioni:

Documents

10 Linearizzazione e retta dei min quad 2017 18