Upload
faustino-ferrante
View
227
Download
0
Embed Size (px)
Citation preview
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali1
Le distribuzioni di Le distribuzioni di probabilità continueprobabilità continue
Giovanni Filatrella (Giovanni Filatrella ([email protected]@unisannio.it))
Elaborazione Statistica dei Dati Elaborazione Statistica dei Dati SperimentaliSperimentali Facoltà di Scienze MM FF e NN,
Università Sannio
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali2
Distribuzioni continue
Supponiamo di far ruotare un ago dando una spinta iniziale tale che farà molti giri prima che l’attrito lo fermerà. Qual è la probabilità che si fermi ad un angolo x?
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali3
Distribuzioni di probabilità per variabili continue
Definiamo una variabile casuale x una variabile che può assumere diversi valori, per semplicità in un intervallo:
x: xMinx xMax
Ognuno di questi valori con probabilità f(x).
Una variabile casuale si dice continua perché i valori che può assumere, cioè le x, non sono numerabili, cioè non si possono mettere in corrispondenza biunivoca con un insieme di indici interi, ma solo con un sottoinsieme dei numeri reali.
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali4
Attenzione a non confondere i seguenti 4 concetti:
1. x è il simbolo che denota la variabile casuale2. x denota anche i valori che la variabile può
assumere3. La f(x) è la densità di probabilità, non la
probabilità.4. La probabilità che la variabile casuale assuma
un valore all’interno di un intervallo è data dalla densità di probabilità tramite la formula:
B
A
x
x
BA dxxfxxxP )()(
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali5
Variabili continue: limite del caso
discreto
Supponendo di misurare una variabile continua per passi discreti, si può solo definire l’appartenenza di un individuo ad una classe. La distribuzione è approssimata con un istogramma.
L’ampiezza delle classi è x
La probabilità corrispondente ai valori discreti xi è l’area del rettangolo f(x)x.
x
f(x)
xi x
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali6
Richiamo del significato di integrale
L’integrale èl’area
sottesadalla
funzionef(x)
x
f(x)
xMIN xMAX
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali7
Uso dell’integrale nelle distribuzioni continue
L’integrale è la probabilità che la variabile casuale assuma un valore in un intervallo e dipende dalla densità di probabilità f(x)
x
f(x)
x1 x2
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali8
Domande
D1: Quanto vale l’area in giallo sotto la curva nella figura precedente?
D2: Se si chiedesse la probabilità che una variabile continua assuma un valore specifico quanto vale?
D3: Qual è il legame con gli istogrammiD4: Per la variabile casuale della roulette
(la trasparenza 2) com’è fatto il grafico della densità di probabilità?
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali9
Esercizio
• Come si interpreta il picco nella figura precedente?
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali10
La distribuzione uniforme nel caso continuo
La densità di probabilità è identica per tutto l’intervallo
L’altezza si trova dalla condizione che la probabilità totale sia 1
x
1/(2)
0 2
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali11
Valore aspettato per variabili continue
Variabili continue
max
)(][x
xMin
dxxxfxE
max
1
][i
iii pxxE
Variabili discrete
probdi avere
x
Somma
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali12
Varianza per variabili continue
Variabili continue
Variabili discrete
probabilità
di x
Somma
max
)()(][ 22x
xMin
dxxfxxVar
max
1
22 )(][i
iii pxxVar
Scarto quadratico
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali13
Confronto del caso continuo e discreto
1. L’integrale è approssimato con un istogramma.
2. L’ampiezza delle classi è x (per x 0 si ottiene proprio l’integrale).
3. La probabilità corrispondente ai valori discreti xi è l’area del rettangolo f(x)dx.
x
f(x)
xi x
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali14
Esercizi
• *In base a questa corrispondenza trovare le formule per il valore aspettato e la varianza nel caso discreto a partire da quelle del caso continuo.
• **Trovare il valore aspettato della variabile casuale con distribuzione uniforme.
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali15
Carl Friedrick Gauss (1777 - 1855)
Gentile concessione della Deutsche Bundesbank
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali16
Distribuzione di Gauss-Laplace
o “Normale”La distribuzione di
Gauss ha due parametri, e , che la descrivono completamente:
2
2
2
)(
2 2
1)(
x
exfCaso =0
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali17
Altri casi di gaussiane con diversi valori aspettati
Caso =1 Caso =4
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali18
Distribuzione normale: interpretazione grafica dei
parametri è il valore in
corrispondenza del massimo
è un flesso - è un flessoL’area fra eè 0.68
0.68
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali19
Distribuzione normale: significato dei parametri
I parametri che appaiono nella formula della distribuzione gaussiana non a caso coincidono con i simboli di valore aspettato e varianza:
dxexxEx
2
2
2
)(
2 2
1][
dxexxVarx
2
2
2
)(
2
22
2
1)(][
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali20
Quadro riassuntivo delle proprietà della gaussiana f(x):
1. Normalizzazione: f(x) dx = 1
2. Simmetria attorno al valore aspettato: f(x-)=f( -x)
3. Ha un massimo per x=4. Ha un flesso perxe x5. Il valore aspettato è: E[x]=6. La varianza è: Var[x]=
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali21
Calcolo delle probabilità distribuite gaussianamente
Se una variabile ha distribuzione gaussiana è completamente individuata dai parametri e .
Supponiamo di avere e , e che ci si chieda la probabilità che x . Come si può procedere?
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali22
Soluzione
Risolvendo l’integrale:
5
1
5.22
)2(
2
2
2
25.2
1)51( dxexP
x
Che equivale a trovare l’area:
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali23
Calcolo della soluzione
Purtroppo l’integrale non è calcolabile esplicitamente, cioè non esiste una funzione semplice che permetta di valutarlo.
Esistono delle tavole che riportano alcuni valori di quest’integrale per e
Da questi valori si possono i corrispondenti valori per e arbitrari.
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali24
Tavola dell’integrale
gaussianoC. Cametti, A. Di
Biasio:“Introduzione
all’elaborazione dei dati sperimentali” ,
Tabella I, p. 327
z t
dteztP 2
2
2
1)(
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali25
Nomenclatura
La z si chiama “variabile standardizzata”.Essa rappresenta il caso particolare di
variabile gaussiana di media nulla e deviazione standard unitaria.
Per trasformare una qualsiasi variabile gaussiana in quella standardizzata occorre dunque cambiare la variabile in modo che diventi a) a valore aspettato nullo b) a varianza unitaria.
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali26
Il cambiamento di variabile: 1) spostare il valore medio
Per trovare questo cambiamento dobbiamo dunque avere:
xx0xE atrasformat
x
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali27
Il cambiamento di variabile: 2) cambiare la larghezza
Per trovare questo cambiamento dobbiamo dunque avere:
/xx1xVar atrasformat
x
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali28
Sommario della procedura:
1. Conoscere valore aspettato e deviazione standard della variabile originaria x
2. Conoscere i limiti x1 e x2 entro i quali si vuole trovare la probabilità che la variabile casuale sia compresa.
3. Trasformare questi limiti nei limiti z1 e z2 della variabile standardizzata (z):
4. Trovare la probabilità che la variabile standardizzata sia compresa fra questi limiti.
x
z
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali29
Esempio di calcolo di probabilità con una variabile
gaussiana
Supponiamo di avere e , e che ci si chieda la probabilità che x .
In formule:
5
1
5.22
22
2
25.2
1)51( dxexP
x
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali30
1. Valore aspettato e deviazione standard della variabile originaria x: E[x]=2 Var[x]=2.5
2. I limiti x1 e x2 entro i quali si vuole trovare la probabilità che la variabile casuale sia compresa: x1=1 e x2 =5
3. I limiti z1 e z2 della variabile standardizzata (z):
4. La probabilità che la variabile standardizzata sia compresa fra questi limiti:
0.885-0.656+0.5=0.729
Applicazione del calcolo ad un caso specifico:
2.15.2
25xz 4.0
5.2
21xz 2
21
1
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali31
Tavole come quella allegata non sono tavole per integrali con intervalli arbitrari. In particolare nella tabella si è riportata :
che è la probabilità da - a z (distribuzione cumulativa di probabilità). Come è stata calcolata la probabilità per un intervallo arbitrario?
Tavole della gaussiana standardizzata
z t
dteztP 2
2
2
1)(
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali32
La probabilità che z sia compreso fra z1 e
z2 si può trovare dalla probabilità che sia minore di z1 e minore di z2:
Costruzione per ottenere l’area per differenza
z1 z2 x
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali33
Un’estensione delle tavola
Come si trovano le probabilità corrispondenti a valori negativi della variabile?
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali34
Un caso particolarmente importante
Supponiamo di chiederci quale sia la probabilità che la variabile standardizzata sia compresa fra –1 e +1. Consultando la tavola si trova:
68.02
1)11(
1
1
2
2
dtetP
t
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali35
Proprietà delle gaussiane
Si può tradurre il risultato precedente in un fatto generale:
“per qualsiasi distribuzione gaussiana la probabilità di trovare un valore della
variabile fra ed è il 68%”
Osservazioni:1) Questa proprietà è tipica solo delle
gaussiane, non di altre distribuzioni;2) E’ un metodo per trovare dal grafico.
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali36
Applicazione di questa proprietà
Il risultato precedente si può rappresentare matematicamente come:
ed analogamente si può dimostrare che:
, 68.02
1)(
2
2
2
dxexPx
,
9974.02
1)33(
9546.02
1)22(
3
3
2
2
2
2
2
2
2
2
dxexP
dxexP
x
x
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali37
Esempio per e
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali38
Domande
• Qual è la probabilità di trovare la variabile casuale fra ed per una distribuzione uniforme?
• Da un grafico di una gaussiana di cui non si conosce la deviazione standard, come la si potrebbe determinare?