of 38 /38
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni Le distribuzioni di probabilità di probabilità continue continue Giovanni Filatrella Giovanni Filatrella ( ( [email protected] [email protected] ) ) Elaborazione Statistica dei Dati Elaborazione Statistica dei Dati Sperimentali Sperimentali Facoltà di Scienze MM FF e NN, Università Sannio

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( [email protected]

Embed Size (px)

Citation preview

Page 1: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali1

Le distribuzioni di Le distribuzioni di probabilità continueprobabilità continue

Giovanni Filatrella (Giovanni Filatrella ([email protected]@unisannio.it))

Elaborazione Statistica dei Dati Elaborazione Statistica dei Dati SperimentaliSperimentali Facoltà di Scienze MM FF e NN,

Università Sannio

Page 2: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali2

Distribuzioni continue

Supponiamo di far ruotare un ago dando una spinta iniziale tale che farà molti giri prima che l’attrito lo fermerà. Qual è la probabilità che si fermi ad un angolo x?

Page 3: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali3

Distribuzioni di probabilità per variabili continue

Definiamo una variabile casuale x una variabile che può assumere diversi valori, per semplicità in un intervallo:

x: xMinx xMax

Ognuno di questi valori con probabilità f(x).

Una variabile casuale si dice continua perché i valori che può assumere, cioè le x, non sono numerabili, cioè non si possono mettere in corrispondenza biunivoca con un insieme di indici interi, ma solo con un sottoinsieme dei numeri reali.

Page 4: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali4

Attenzione a non confondere i seguenti 4 concetti:

1. x è il simbolo che denota la variabile casuale2. x denota anche i valori che la variabile può

assumere3. La f(x) è la densità di probabilità, non la

probabilità.4. La probabilità che la variabile casuale assuma

un valore all’interno di un intervallo è data dalla densità di probabilità tramite la formula:

B

A

x

x

BA dxxfxxxP )()(

Page 5: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali5

Variabili continue: limite del caso

discreto

Supponendo di misurare una variabile continua per passi discreti, si può solo definire l’appartenenza di un individuo ad una classe. La distribuzione è approssimata con un istogramma.

L’ampiezza delle classi è x

La probabilità corrispondente ai valori discreti xi è l’area del rettangolo f(x)x.

x

f(x)

xi x

Page 6: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali6

Richiamo del significato di integrale

L’integrale èl’area

sottesadalla

funzionef(x)

x

f(x)

xMIN xMAX

Page 7: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali7

Uso dell’integrale nelle distribuzioni continue

L’integrale è la probabilità che la variabile casuale assuma un valore in un intervallo e dipende dalla densità di probabilità f(x)

x

f(x)

x1 x2

Page 8: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali8

Domande

D1: Quanto vale l’area in giallo sotto la curva nella figura precedente?

D2: Se si chiedesse la probabilità che una variabile continua assuma un valore specifico quanto vale?

D3: Qual è il legame con gli istogrammiD4: Per la variabile casuale della roulette

(la trasparenza 2) com’è fatto il grafico della densità di probabilità?

Page 9: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali9

Esercizio

• Come si interpreta il picco nella figura precedente?

Page 10: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali10

La distribuzione uniforme nel caso continuo

La densità di probabilità è identica per tutto l’intervallo

L’altezza si trova dalla condizione che la probabilità totale sia 1

x

1/(2)

0 2

Page 11: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali11

Valore aspettato per variabili continue

Variabili continue

max

)(][x

xMin

dxxxfxE

max

1

][i

iii pxxE

Variabili discrete

probdi avere

x

Somma

Page 12: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali12

Varianza per variabili continue

Variabili continue

Variabili discrete

probabilità

di x

Somma

max

)()(][ 22x

xMin

dxxfxxVar

max

1

22 )(][i

iii pxxVar

Scarto quadratico

Page 13: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali13

Confronto del caso continuo e discreto

1. L’integrale è approssimato con un istogramma.

2. L’ampiezza delle classi è x (per x 0 si ottiene proprio l’integrale).

3. La probabilità corrispondente ai valori discreti xi è l’area del rettangolo f(x)dx.

x

f(x)

xi x

Page 14: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali14

Esercizi

• *In base a questa corrispondenza trovare le formule per il valore aspettato e la varianza nel caso discreto a partire da quelle del caso continuo.

• **Trovare il valore aspettato della variabile casuale con distribuzione uniforme.

Page 15: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali15

Carl Friedrick Gauss (1777 - 1855)

Gentile concessione della Deutsche Bundesbank

Page 16: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali16

Distribuzione di Gauss-Laplace

o “Normale”La distribuzione di

Gauss ha due parametri, e , che la descrivono completamente:

2

2

2

)(

2 2

1)(

x

exfCaso =0

Page 17: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali17

Altri casi di gaussiane con diversi valori aspettati

Caso =1 Caso =4

Page 18: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali18

Distribuzione normale: interpretazione grafica dei

parametri è il valore in

corrispondenza del massimo

è un flesso - è un flessoL’area fra eè 0.68

0.68

Page 19: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali19

Distribuzione normale: significato dei parametri

I parametri che appaiono nella formula della distribuzione gaussiana non a caso coincidono con i simboli di valore aspettato e varianza:

dxexxEx

2

2

2

)(

2 2

1][

dxexxVarx

2

2

2

)(

2

22

2

1)(][

Page 20: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali20

Quadro riassuntivo delle proprietà della gaussiana f(x):

1. Normalizzazione: f(x) dx = 1

2. Simmetria attorno al valore aspettato: f(x-)=f( -x)

3. Ha un massimo per x=4. Ha un flesso perxe x5. Il valore aspettato è: E[x]=6. La varianza è: Var[x]=

Page 21: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali21

Calcolo delle probabilità distribuite gaussianamente

Se una variabile ha distribuzione gaussiana è completamente individuata dai parametri e .

Supponiamo di avere e , e che ci si chieda la probabilità che x . Come si può procedere?

Page 22: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali22

Soluzione

Risolvendo l’integrale:

5

1

5.22

)2(

2

2

2

25.2

1)51( dxexP

x

Che equivale a trovare l’area:

Page 23: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali23

Calcolo della soluzione

Purtroppo l’integrale non è calcolabile esplicitamente, cioè non esiste una funzione semplice che permetta di valutarlo.

Esistono delle tavole che riportano alcuni valori di quest’integrale per e

Da questi valori si possono i corrispondenti valori per e arbitrari.

Page 24: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali24

Tavola dell’integrale

gaussianoC. Cametti, A. Di

Biasio:“Introduzione

all’elaborazione dei dati sperimentali” ,

Tabella I, p. 327

z t

dteztP 2

2

2

1)(

Page 25: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali25

Nomenclatura

La z si chiama “variabile standardizzata”.Essa rappresenta il caso particolare di

variabile gaussiana di media nulla e deviazione standard unitaria.

Per trasformare una qualsiasi variabile gaussiana in quella standardizzata occorre dunque cambiare la variabile in modo che diventi a) a valore aspettato nullo b) a varianza unitaria.

Page 26: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali26

Il cambiamento di variabile: 1) spostare il valore medio

Per trovare questo cambiamento dobbiamo dunque avere:

xx0xE atrasformat

x

Page 27: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali27

Il cambiamento di variabile: 2) cambiare la larghezza

Per trovare questo cambiamento dobbiamo dunque avere:

/xx1xVar atrasformat

x

Page 28: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali28

Sommario della procedura:

1. Conoscere valore aspettato e deviazione standard della variabile originaria x

2. Conoscere i limiti x1 e x2 entro i quali si vuole trovare la probabilità che la variabile casuale sia compresa.

3. Trasformare questi limiti nei limiti z1 e z2 della variabile standardizzata (z):

4. Trovare la probabilità che la variabile standardizzata sia compresa fra questi limiti.

x

z

Page 29: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali29

Esempio di calcolo di probabilità con una variabile

gaussiana

Supponiamo di avere e , e che ci si chieda la probabilità che x .

In formule:

5

1

5.22

22

2

25.2

1)51( dxexP

x

Page 30: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali30

1. Valore aspettato e deviazione standard della variabile originaria x: E[x]=2 Var[x]=2.5

2. I limiti x1 e x2 entro i quali si vuole trovare la probabilità che la variabile casuale sia compresa: x1=1 e x2 =5

3. I limiti z1 e z2 della variabile standardizzata (z):

4. La probabilità che la variabile standardizzata sia compresa fra questi limiti:

0.885-0.656+0.5=0.729

Applicazione del calcolo ad un caso specifico:

2.15.2

25xz 4.0

5.2

21xz 2

21

1

Page 31: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali31

Tavole come quella allegata non sono tavole per integrali con intervalli arbitrari. In particolare nella tabella si è riportata :

che è la probabilità da - a z (distribuzione cumulativa di probabilità). Come è stata calcolata la probabilità per un intervallo arbitrario?

Tavole della gaussiana standardizzata

z t

dteztP 2

2

2

1)(

Page 32: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali32

La probabilità che z sia compreso fra z1 e

z2 si può trovare dalla probabilità che sia minore di z1 e minore di z2:

Costruzione per ottenere l’area per differenza

z1 z2 x

Page 33: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali33

Un’estensione delle tavola

Come si trovano le probabilità corrispondenti a valori negativi della variabile?

Page 34: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali34

Un caso particolarmente importante

Supponiamo di chiederci quale sia la probabilità che la variabile standardizzata sia compresa fra –1 e +1. Consultando la tavola si trova:

68.02

1)11(

1

1

2

2

dtetP

t

Page 35: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali35

Proprietà delle gaussiane

Si può tradurre il risultato precedente in un fatto generale:

“per qualsiasi distribuzione gaussiana la probabilità di trovare un valore della

variabile fra ed è il 68%”

Osservazioni:1) Questa proprietà è tipica solo delle

gaussiane, non di altre distribuzioni;2) E’ un metodo per trovare dal grafico.

Page 36: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali36

Applicazione di questa proprietà

Il risultato precedente si può rappresentare matematicamente come:

ed analogamente si può dimostrare che:

, 68.02

1)(

2

2

2

dxexPx

,

9974.02

1)33(

9546.02

1)22(

3

3

2

2

2

2

2

2

2

2

dxexP

dxexP

x

x

Page 37: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali37

Esempio per e

Page 38: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità continue Giovanni Filatrella ( filatrella@unisannio.it

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali38

Domande

• Qual è la probabilità di trovare la variabile casuale fra ed per una distribuzione uniforme?

• Da un grafico di una gaussiana di cui non si conosce la deviazione standard, come la si potrebbe determinare?