Upload
others
View
3
Download
0
Embed Size (px)
Citation preview
X
Y
Il diagramma di dispersione suggerisce che le funzione di interpolazione dei dati non sono lineari, ma presentano un andamento che in un caso (dots neri) potrebbe essere di tipo esponenziale, mentre nell’altro caso (dots rossi) potrebbe essere di tipo radice.
Linearizzazione
Quando i dati sperimentali non evidenziano una correlazione di tipolineare, ma presentano un andamento di tipo esponenziale,polinomiale, etc. è difficile (se non impossibile) ricavaregraficamente i parametri caratteristici della curva, che spesso hannoun significato chimico-fisico ben preciso e potrebbero pertantofornire utilissime informazioni su un certo fenomeno.
In questi casi è conveniente trasformare l'equazione che rappresentala curva che meglio approssima i dati in quella di una rettaeffettuando un cambiamento di variabili (linearizzazione)
Il procedimento di linearizzazione consiste nell'usare una funzionedelle variabili anziché le variabili stesse.
Una classe importante di linearizzazioni è quella legata adandamenti esponenziali (o logaritmici) e a leggi di potenza.Consideriamo la funzione
Per ricondurci ad una forma più «comoda», applichiamo una"linearizzazione" della funzione applicando la funzione logaritmo:
PonendoY = ln y, C = ln A, X = x
Si graficano i dati mediante le nuove variabili funzionali X,Y chehanno così dipendenza lineare.
BxAey =
BXCY +=
BxAy += lnln
x3.0Bx e2Aey == 6391.0x3.02lnx3.0ylnY +=+==
Esempio
0
5
10
15
20
25
30
35
40
45
0 1 2 3 4 5 6 7 8 9 10
y
x
0
0,5
1
1,5
2
2,5
3
3,5
4
0 1 2 3 4 5 6 7 8 9 10
Y = ln y
X
Altri esempi:
7x5y 3 +=
nxX = yY =
7X5Y +=
0
100
200
300
400
500
600
700
0 1 2 3 4 5
y
x
0
100
200
300
400
500
600
700
0 20 40 60 80 100 120
y
X=x3
BAxy n +=
xX = yY =
xAy =
x5y =
0
2
4
6
8
10
12
14
16
18
0 2 4 6 8 10 12
y
x
0
2
4
6
8
10
12
14
16
18
0 1 2 3 4
Y
X=radice quadrata x
X5Y =
oppure
xX = 2yY =
xAy =
0
2
4
6
8
10
12
14
16
18
0 2 4 6 8 10 12
y
x0
50
100
150
200
250
300
0 2 4 6 8 10 12
Y=y^2
X
x5y =
xAy 22 =
X25Y =
Grafici con scale non lineari
Scale Logaritmiche
Una scala logaritmica è un asse sul quale sono riportati segmenti proporzionali ai logaritmi dei numeri
• sull’asse prescelto (ad es. asse x ) si rappresenta il punto di ascissa 1 = 100
• nella direzione positiva si rappresentano, a distanze uguali fra di loro, i punti di ascissa 101 , 102 , 103 , . . .
• nella direzione negativa si rappresentano, a distanze uguali fra di loro, i puntidi ascissa 10−1 , 10−2 , 10−3 , . . .
• i valori intermedi tra una potenza di 10 e la successiva (ad.es. 2 , 3 , . . . 9 ) sono posizionati ai valori dei rispettivi logaritmi decimali
1 2 3 4 5 6 … 10 20 30 40 50…. 100 200 300 400……
Carta SemiLogaritmica
scala lineare sull’asse delle ascisse X e scala logaritmica sull’asse delle ordinate Y (o viceversa)
TRASFORMAZIONE DI VARIABILI
xX = ylogY 10=lineare sull’asse X e logaritmica sull’asse Y
xlogX 10= yY =logaritmica sull’asse X e lineare sull’asse Y
Carta Logaritmica
scala logaritmica sull’asse delle ascisse X e scala logaritmica sull’asse delle ordinate Y
TRASFORMAZIONE DI VARIABILI
ylogY 10=xlogX 10=
APPLICAZIONI:
• rappresentare misure positive con ordini di grandezza molto diversi fra loro
• linearizzare funzioni esponenziali scale semilogaritmiche
• linearizzare funzioni potenza scale logaritmiche
xKay =
aBxy =
Data la funzione esponenziale
passando ai logaritmi decimali e utilizzando le proprietà dei logaritmi
ponendo
si ha l’equazione di una retta
xKay =
ylogY 10=xX =
alogxKlog
alogKlogKalogylog
1010
x1010
x1010
+=+==
alogXKlogY 1010 +=
intercetta coefficiente angolare
Carta SemiLogaritmica
Data la funzione potenza
passando ai logaritmi decimali e utilizzando le proprietà dei logaritmi
ponendo
si ha l’equazione di una retta
ylogY 10=
xlogaBlog
xlogBlogBxlogylog
1010
a1010
a1010
+=+==
intercetta coefficiente angolare
aXBlogY 10 +=
Carta Logaritmica
aBxy =
xlogX 10=
0 10000
1 50002 25003 12504 625
5 3126 1567 788 39
9 2010 10
0 1 2 3 4 5 6 7 8 9 10
10
100
1000
10000
x4 )5.0(10y =
0
2000
4000
6000
8000
10000
12000
0 2 4 6 8 10
y
x
Esempio
Retta dei minimi quadrati
Il metodo della massima e minima pendenza per determinare laretta di best-fit è un metodo grafico che funziona abbastanzabene, ma non esiste alcuna giustificazione teorica dellaprocedura.
Affrontiamo il problema con un metodo più rigoroso.
Consideriamo N coppie di misure (xi, yi) di due grandezze x e yfra le quali sappiamo che esiste una relazione di tipo lineare:
Supponiamo che l’incertezza su una delle due variabili (adesempio sulla x) sia trascurabile rispetto a quella dell’altra (y)
baxy +=
determiniamo i migliori valori di a e b corrispondenti
ai dati sperimentali
In corrispondenza di ogni xi esiste un valore “teorico”dato dalla relazione
ovvero rappresenta l’ordinata del punto di ascissa xi
appartenente alla retta, mentre yi è quello misuratosperimentalmente in corrispondenza di xi .
baxy iti +=
tiy
tiy
baxy +=
xi
yitiy
In genere, a causa degli errori di misura,
e può essere a volte a volte
La quantità rappresenta lo scarto del valoresperimentale da quello teorico
iti yy ≠
iti yy < i
ti yy >
tiii yy −=ε
xi
yitiy
εi( )
baxy
baxyyy
ii
iitiii
−−+−=−=ε
Al variare di a e b la retta cambierà
pendenza o traslerà e gli scarti
assumeranno valori diversi
Osservazione: un grande valore di εi non ha di per sè un grandesignificato . Ciò che conta è il valore assoluto dello scarto rispettoall’errore da cui e’ affetto yi.
La “miglior retta” deve rendere il più possibile piccoli i valoriassoluti degli scarti (divisi per i rispettivi errori).
Poichè rendere piccolo uno scarto può renderne grandi altri,allora come “miglior retta” si prende quella che rende minima
la somma dei quadrati degli scarti (divisi per i rispettivi errori)
(Principio di Massima Verosimiglianza)
La “miglior retta” è quella che rende minima la quantità
( )∑∑==
−−=
=
N
1i2i
2ii
2N
1i i
i baxyz
σσε
dove σi è l’incertezza statistica sulla misura yi.
z = z (a, b) , al variare di a e b, assume uno ed un solo minimo in corrispondenza dei valori per cui le derivate parziali rispetto a e b si annullano
0b
z
a
z =∂∂=
∂∂
( ) ( )( )
( )0
baxy2
1baxy2baxy
bb
z
N
1i2i
ii
N
1i2i
iiN
1i2i
2ii
=−−−
=−−−=
−−∂∂=
∂∂
∑
∑∑
=
==
σ
σσ
( ) ( )( )
( )0
baxyx2
xbaxy2baxy
aa
z
N
1i2i
iii
N
1i2i
iiiN
1i2i
2ii
=−−−
=−−−=
−−∂∂=
∂∂
∑
∑∑
=
==
σ
σσ
( )0
baxyN
1i2i
ii =−−∑= σ
( )0
baxyxN
1i2i
iii =−−∑= σ
Che equivale ad avere il sistema:
0xbxayxN
1ii
N
1i
2i
N
1iii =−− ∑∑∑
===
Supponendo che le σi siano tutte uguali σi = σ
0bxayN
1i
N
1ii
N
1ii =−− ∑∑∑
===
Sistema di 2 equazioni in 2 incognite
0=⋅−⋅− SxbSxxaSxy
0xbxayxN
1ii
N
1i
2i
N
1iii =−− ∑∑∑
===
0bxayN
1i
N
1ii
N
1ii =−− ∑∑∑
===
SxxSxySx
Sy Sx bN
0NbSxaSy =⋅−⋅−
SxySxbSxxa =⋅+⋅SyNbSxa =⋅−⋅
Usando la regola di Cramer
2SxSxxN
SxSySxyNa
−−=
2SxSxxN
SxSxySxxSyb
−−=
2
11
2
111
−
−=
∑∑
∑∑∑
==
===
N
ii
N
ii
N
ii
N
iii
N
ii
xxN
yxyxNa
2
11
2
1111
2
−
−=
∑∑
∑∑∑∑
==
====
N
ii
N
ii
N
iii
N
ii
N
ii
N
ii
xxN
yxxyxb
I parametri a e b sono affetti da incertezza (perché lo sono le yi).
Per la propagazione degli errori statistici:
∑=
⋅
∂∂=
N
iy
iiy
aa
1
2
2
2 )( σσ
∑=
⋅
∂∂=
N
iy
iiy
bb
1
2
2
2 )( σσ
2
11
2
1
−
−=
∂∂
∑∑
∑
==
=
N
ii
N
ii
N
iii
ixxN
xNx
y
a
2y2N
1ii
N
1i
2i
N
1i
2y
2
2N
1ii
N
1i
2i
N
1iii
2
xxN
N
xxN
xNx
)a(
σ
σσ
−
=⋅
−
−=
∑∑
∑∑∑
∑
==
=
==
=
Nell’ipotesi che tutte le varianze siano uguali
22
11
2
1
2
2 )( yN
ii
N
ii
N
ii
xxN
xb σσ
−=
∑∑
∑
==
=
Analogamente si calcola
Riassumendo:
( ) Nxx
1
xN
1xN
1
xN
1x
N
1N
N
xxN
N)a(
2y
222y2N
1ii
2
2y2N
1ii2
N
1i
2i
2
2y2N
1ii
N
1i
2i
2
σσ
σσσ
−=
−
=
−
=
−
=
∑
∑∑∑∑
=
====
Nxx
x
xxN
x
)b(2y
22
22y2N
1ii
N
1i
2i
N
1i
2i
2 σσσ
−=
−
=
∑∑
∑
==
=
Queste espressioni indicano che le incertezze sui parametridella retta diminuiscono all’aumentare di N, ma anche dellaquantità
denominata “braccio della leva” della estensione dellemisure: lo stesso numero di misure sparse su un intervallopiù grande determinano i parametri con una maggioreprecisione.
Si può inoltre dimostrare che la retta dei minimi quadratipassa per il punto B(xB,yB) le cui coordinate sono i baricentridelle misure di x ed y.
22 xx −
∑=
=N
1iiB x
N
1x ∑
==
N
1iiB y
N
1y
[ ]2N
)bax(yN
1i
2ii
y −
+−=∑=σ
Se la non è nota la si può stimare tramite la dispersione dei punti intorno alla retta:
yσ
È stata così determinata la “migliore retta” che approssima uninsieme di dati sperimentali rendendo minima la somma deiquadrati delle distanze, misurate nella direzione della asse y, deipunti dalla retta.
La retta così determinata di dice retta di regressione (di y su x)
residui
Avremmo potuto minimizzare la somma dei quadrati delledistanze misurate nella direzione dell’asse x, ovvero laquantità
( )∑
=
−−N
i i
ii byax
12
2''
σ
La retta così determinata di dice retta di regressione (di x su y).
In genere le due rette non coincidono, ma quanto più ladistribuzione dei punti è prossima ad essere rettilinea, tanto piùle due rette di regressione si avvicinano.
Infine è possibile rendere minima la somma dei quadrati delledistanze misurate ortogonalmente dai punti alla retta.La retta così determinata di dice retta di regressione
ortogonale.
Generalizzazione del metodo dei minimi quadrati
Il metodo può essere applicato in modo molto più generale.
Consideriamo N coppie di misure (xi, yi) di due grandezze x e ye supponiamo che l’incertezza su una delle due variabili (adesempio sulla x) sia trascurabile rispetto a quella dell’altra (y) eche le σi siano tutte uguali σi = σ
Inoltre la relazione che lega le 2 variabili sia espressa dallagenerica funzione
( )pcccccxfy ,...,,,, 4321=
cj sono i parametri di cui si vogliono determinare i
valori in corrispondenza dei quali la curva meglio si
adatta ai dati sperimentali
Il metodo dei minimi quadrati permette di determinare i valoridei parametri cj che rendono minima la quantità:
( )[ ]∑=
−=N
1i2
221ii ,...c,c,xfy
zσ
0...21
=∂∂==
∂∂=
∂∂
pc
z
c
z
c
z
Mediante la risoluzione del sistema di equazioni: