42
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei Stima dei parametri di una parametri di una distribuzione distribuzione Giovanni Filatrella Giovanni Filatrella ( ( [email protected] [email protected] ) ) Elaborazione Statistica dei Dati Elaborazione Statistica dei Dati Sperimentali Sperimentali Facoltà di Scienze MM FF e NN, Università Sannio

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( [email protected]

Embed Size (px)

Citation preview

Page 1: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali1

Stima dei parametri Stima dei parametri di una distribuzionedi una distribuzione

Giovanni Filatrella (Giovanni Filatrella ([email protected]@unisannio.it))

Elaborazione Statistica dei Dati Elaborazione Statistica dei Dati SperimentaliSperimentali Facoltà di Scienze MM FF e NN,

Università Sannio

Page 2: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali2

Legame fra statistica e probabilità

Statistics: Given the information in your hand, what is the box?

Probability: Given the information in the box, what is in your hand?

from: Statistics, Norma Gilbert, W.B. Saunders Co., 1976

Page 3: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali3

Cos’è la statistica inferenziale?

Tratta i metodi per fare delle valutazioni sulla popolazione basate sulle proprietà del campione estratto dalla popolazione

Terminologia:– Stima: valutazione di un parametro della popolazione– Test delle ipotesi: controllare un’ipotesi fatta su una caratteristica

ignota della popolazioneEsempi:– Stima: Qual è il diametro di una lotto di pezzi prodotto?– Test delle ipotesi: i pezzi sono conformi alle specifiche? Ci sono due livelli di stime o test delle ipotesi:– Qualitativo: usando i metodi della statistica descrittiva dare una

valutazione della correttezza delle affermazioni.-Quantitativo: usando i metodi del calcolo delle probabilità asserire in

maniera riproducibile la ragionevolezza della stima (o delle ipotesi) fatte.

Page 4: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali4

Stima puntuale dei parametri

Si sono fatte delle misure sperimentali:x1, x2,…,xN

Che si suppone derivino da una distribuzione di probabilità dipendenti da M parametri f(x

Si definisce “Stimatore” T, una funzione vettoriale che permette di valutare (stimare) i parametri, cioè che colleghi i parametri ai dati sperimentali.

Page 5: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali5

)x,, x,(xT~.

.

.

)x,, x,(xT~

)x,, x,(xT~

N21M

N2122

N2111

M

La stima dei parametri.I valori trovati dipendonodai dati specifici.

Le funzioni con le quali sistimano i parametri sono definite a prescindere dagli esperimenti effettuati,ma dipendono dalla distribuzione che si suppone abbia generato i dati.

I dati degli esperimenti dipendono dalle misure effettivamente svolte

Page 6: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali6

Ovviamente , altrimenti conosceremmo la distribuzione da cui sono generati i dati sperimentali.

è una quantità fluttuante – cioè una variabile casuale di cui dobbiamo scoprire le caratteristiche.

Importante: La distribuzione delle differenze non è la stessa delle distribuzioni dei dati sperimentali xi.

Proprietà degli stimatori

0~

ii

ii ~

ii ~

Page 7: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali7

Terminologia degli stimatori

Stima: il valore numerico calcolato a partire dagli esperimenti effettuati

Stimatore: una funzione dei dati T(x1,x2,…,xn) sperimentali osservati. Poiché i dati osservati sono una variabile casuale, lo stimatore è una variabile casuale.

~

~

Page 8: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali8

La funzione di verosimiglianza

Definizione:Definizione: Supponendo di conoscere i parametri della distribuzione, potremmo calcolare la probabilità di ottenere i dati sperimentali che abbiamo ottenuto. Questa probabilità (o qualsiasi grandezza ad essa proporzionale con costante di proporzionalità positiva) si chiama verosimiglianza. La verosimiglianza è una funzione, perché in effetti non conosciamo i parametri, e quindi non conosciamo neanche la probabilità di ottenere una determinata sequenza di dati sperimentali.

Page 9: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali9

Interpretazione della verosimiglianza

Per interpretare cosa intende quantitativamente per verosimiglianza, si può immaginare il seguente ragionamento:

Supponendo di conoscere il valore dei parametri, qual è la probabilità che quei parametri abbiano generato i dati che sono stati trovati?

Page 10: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali10

Metodo per ricavare gli stimatori: Il principio di massima

verosimiglianza

La migliore stima che possiamo attribuire ai valori dei parametri è quella che, se fosse esatta, renderebbe massima la probabilità di ottenere i dati sperimentali che abbiamo ottenuto.

Per trovare un metodo generale che colleghi i dati sperimentali ai parametri della distribuzione di probabilità che li ha generati si ragiona come segue:

Page 11: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali11

Perché viene definito un principio e non un teorema

Non è possibile dimostrare che il valore del parametro della distribuzione che massimizza la probabilità di realizzare i dati sperimentali sia davvero il miglior valore della stima.

Page 12: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali12

Un problema concettuale connesso al principio di massima

verosimiglianza

In questo approccio si scambia il ruolo dei dati sperimentali e delle stime: le stime diventano dei dati “certi” del problema.Fatto questo ai dati sperimentali già ottenuti si attribuisce una probabilità di verificarsi.

Page 13: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali13

La logica del principio di massima verosimiglianza

La realizzazione del modello teorico è avvenuta secondo la più semplice delle traiettorie, ovvero la più probabile

Modello

Esperimenti

Page 14: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali14

Un errore molto comune:I valori ottenuti con il principio di massima verosimiglianza sono i più

probabili.

Non è vero perché sarebbe un’asserzione sulla realtà, come se la realtà avesse una certa probabilità di verificarsi, il che non è il caso. Concettualmente si ragiona come se fosse:

Realtà 1Esperimenti

Realtà 2

Page 15: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali15

Definizioni per il principio di massima verosimiglianza o Maximum Likelihood

Estimation (MLE)Data una distribuzione di probabilità,

dipendente da M parametri f(x, M), si introduce una funzione di verosimiglianza che è la probabilità di ottenere N misure, in funzione dei valori assunti dai parametri, che è detta funzione di verosimiglianza L:

N

iMiMN xfxxxL

1212121 ),...,,,(),...,,;,...,,(

variabili parametri

Page 16: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali16

Formulazione matematica del principio

Per interpretare la L come la probabilità di ottenere i dati, dobbiamo valutare la funzione di massima verosimiglianza in corrispondenza delle N misure effettivamente svolte, così per questa specifica serie di misure la funzione di verosimiglianza diviene:

),...,,;x,...,x,x(L M21N21

Page 17: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali17

0

L ., . . ,0

L ,0

L

Max è )~

,...,~

,~

;x,...,x,x(L :~

,...,~

,~

MM2211~1~1~1

M21N21N21

Formulazione matematica del principioA questo punto la L è comunque indeterminata perché

non si conoscono i valori dei parametri. Il principio di massima verosimiglianza asserisce che:

Assunto un modello (la f(x, M)) i più ragionevoli valori che si possono assegnare ai parametri date le N misure, sono quelli che rendono più plausibile il risultato delle misure:

Page 18: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali18

In un grafico, per un solo parametro:

L(x1,x2,...xN,)

best

Risultato più ragionevole per la stima del parametro

Page 19: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali19

Proprietà della verosimiglianza:

Sembra ovvio che uno stimatore costruito a partire da L1 sia migliore di uno costruito a partire da L2.

best

L1(x,)

L2(x,)

best

Page 20: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali20

La distribuzione di probabilità dei parametri di Max

Verosimiglianza1. Dim. 1: supponendo di aver trovato la formula, se questa

è una combinazione di variabili casuali si può applicare il Teorema del Limite Centrale, e quindi sarà Gaussiana

2. Dim. 2: senza entrare nei dettagli, sia P() la distribuzione (ignota) di probabilità di , allora:

2

~2

2

)~

(2

1

d

)(Pd

2

~2

2

~

e)(P

)~

(2

1

d

)(Pd)

~(

d

)(dP)

~(Pln)(Pln

Termine nullo per definizione di Max Ver.

Gaussiano

1

~2

22 )(

,0

d

Pd

Page 21: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali21

Stima dei parametri di una distribuzione binomiale

Si supponga di fare N misure di una variabile casuale che può assumere solo due valori (“successo” ed “insuccesso”). Fra queste misure, n corrispondono ad un successo. Come posso stimare la probabilità di successo p?

Page 22: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali22

Stima diretta applicando la “legge dei grandi numeri”

La frequenza delle osservazioni positive è

pN

n

niosservazio di #

favorevoli niosservazio di #f

L’approssimare le frequenze alle probabilità avviene per valori sufficientemente alti del numero di osservazioni.

Page 23: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali23

Stima di p di una binomiale utilizzando il principio di max

verosimiglianza

N

np~)nN(p~)p~1(n

0)1(p~1

1)nN(

p~1

ndp

)p(Llogd

)p1(log)nN(plognn

Nlog)p(Llog)p1(p

n

N)p(L

p~p

nNn

In questo caso dunque il principio fornisce la stessa formula, però non è basato sull’ipotesi di infinite misure.

La “~” ricorda che è una stima

Page 24: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali24

Valutazione della bontà della stima di p di una binomiale

Se il valore stimato è quello trovato come il valore che massimizza la probabilità, è naturale valutare la bontà della stima dalla distribuzione delle probabilità attorno a questo valore più probabile.

Page 25: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali25

La bontà di una stima di max verosimiglianza:

La dispersione dei valori attorno al più probabile, cioè un suo indice (), è una valutazione della bontà della stima.

Ex.: Var[L1]<Var[L2] => L1 è migliore di L2.

best

L1(x,)

L2(x,)

best

Page 26: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali26

Valutazione della bontà della stima con il metodo di Max

Verosimiglianza

N

np ~Nella “formula”per la

stima:Gli N tentativi sono in realtà N variabili casuali, con una probabilità incognita p di successo ( è una stima!).

La stima è una somma di variabili casuali, e come tale avrà una distribuzione circa gaussiana.

La varianza della gaussiana viene assunta come una misura quantitativa della bontà della stima.

p~

Page 27: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali27

La varianza della stima con il metodo di Max Verosimiglianza

Ricapitoliamo il teorema del limite centrale, la somma delle variabili casuali

X=i Xi

tende ad essere Gaussiana per N , qualunque sia la distribuzione delle Xi, con valore medio:

E[X]=i E[ Xi]

e varianzaVar[X]=i

Var[ Xi]Per utilizzarlo in questo contesto occorre

dunque stimare la varianza di ogni variabile casuale

Page 28: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali28

Applicazione del teorema del limite centrale alla stima

Avendo effettuato N misure, la stima:

insuccesso di casoin 0

successo di casoin 1

1~1

i

N

ii nn

Np

E’ dunque la somma delle N variabili casuali ni. Ogni variabile casuale (ogni singola misura) ha probabilità di successo p (ignota), valore medio p (vedi distribuzione binomiale) e varianza p(1-p) (sempre della distribuzione binomiale).

Page 29: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali29

Calcolo esplicito della varianza della stima della

probabilità binomiale:La varianza della stima è dunque:

ppN

ppNN

N

i

N

inp i

11

)1(11

12

1

22

2~

N

iinN

p1

1~

Anche se p non è nota (se fosse conosciuta sapremmo già tutto della distribuzione incognita) si può approssimare con la sua migliore stima:

N

n

N

n

Npp

Npp

Np 11~1~1

112

~

Page 30: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali30

ProblemaPerché compare N2?

ppN

ppNN

N

i

N

inp i

11

)1(11

12

1

22

2~

Page 31: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali31

Esempio numerico di stima di una variabile binomiale

Supponiamo di voler stimare il numero di parole che una persona conosce in una lingua. Per fare questo apriamo un dizionario di 20000 voci a caso su 100 termini e controlliamo quante ne riconosce. La stima è dunque:

osconosciut rmine te0

conosciuto ermine t1

100

1~100

1i

ii nnp

Ed il numero di parole note viene stimato essere: pN iter

~20000min

Page 32: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali32

Esempio numerico di valutazione della bontà della

stima di una variabile binomialeA questo punto ci si potrebbe porre il problema:

è corretto controllare solo 100 termini? Per fare questo è necessario valutare la deviazione standard:

ppp~1~

100

1~

Page 33: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali33

Osservazioni sulla valutazione della bontà della

stima:1) La migliore stima della probabilità di

verificarsi di un evento di tipo binomiale è:

N

iinN

p1

1~

2) La stima così ottenuta è affetta da un’incertezza che è inversamente proporzionale alla radice del numero di misure:

ppNp

~1~ 1

~

Page 34: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali34

Esercizi**Supponiamo che la stima di

parole conosciute sia fatta per una lingua straniera e che su 100 termini se ne conoscano solo 12. Cosa si può dire sul numero di parole note e l’incertezza su questa valutazione?

*Cosa succede se si trovano 24 termini noti su 200?

**Scrivere le formule generali per questo problema.

Page 35: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali35

N

1ii

N

1ini

i

1n

i~

N

1i i

n

N

1i i

nN

1i i

nN

1i i

n

N

1i i

n

nN

1~0~!n

!n

~nN

d

)(Llogd

!nlogN

!nloge

!nloge

!nlog)(Llog

e!n

)(L

i

i

i

iii

i

Stima dei parametri di una distribuzione poissoniana

Page 36: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali36

Valutazione della bontà della stima della media

poissonianaLa varianza della stima è dunque:

NNN

N

i

N

ini

111

12

1

22

2~

N

iinN 1

1~

Anche se non è nota anche in questo caso si può approssimare con la sua migliore stima:

~112

~NN

Page 37: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali37

Esercizi**Ripetere l’esercizio della stima di

termini sconosciuti approssimando la distribuzione con una poissoniana.

**Nello scegliere i termini a caso nel dizionario, si deve evitare di scegliere due volte lo stesso termine?

Page 38: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali38

Stima dei parametri di una distribuzione gaussiana:

N

1ii

N

1ii

N

1ii2

~

N

1i

2i22

N

1i

2

)x(N

2

N

1i

2

)x(

2

N

1i

2

)x(

2

2N

1i

2

)x(

2

2

xN

1~0~Nx

0)1)(~x(22

1

d

)(Llogd

)x(2

1

2

1logN

elog2

1loge

2

1log

e2

1log),(Lloge

2

1),(L

2

2i

2

2i

2

2i

2

2i

Page 39: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali39

Stima dei parametri di una distribuzione gaussiana:

N

1i

2i

2

N

1i

2i222

~2

2

N

1i

2i22

2

xN

1~

0)x(~2

1~2

N

)(d

)(Llogd

)x(2

1

2

1logN),(Llog

22

Nota bene: la viene stimata supponendo di conoscere il valore aspettato , e non di stimarlo.

Page 40: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali40

Stima del parametro di una distribuzione gaussiana

senza conoscere a priori

2

1

2

1

2

1

1

1

1~ SN

Nx

Nx

N

N

i

N

jji

In questo caso la stima differisce per aver diviso per N-1 e non N come direbbe la legge dei grandi numeri. Ovviamente per N le formule coincidono.

Page 41: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali41

Valutazione della bontà della stima del valore aspettato di

una gaussiana:La varianza della stima è dunque:

2

1

22

2~

11ii x

N

ix NN

xxN

N

ii

1

1~

Anche non è nota, e anche in questo caso si può approssimare con la sua migliore stima:

2

1

2

1

2

1

22~

1

1~1

11

1

1~1S

Nx

NNx

Nx

NNN

N

ii

N

i

N

jji

Page 42: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Stima dei parametri di una distribuzione Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali42

Perché conviene fare più misure

La deviazione standard della stima è circa:

Poiché S2 tende ad è un valore che rimane all’incirca costante durante le misure. Quindi l’incertezza della media diminuisce come la radice quadrata di N.

2~

1

1S

N