Author
others
View
1
Download
0
Embed Size (px)
M. Grosso - Statistica Distribuzioni di Probabilità 1
Distribuzioni di Probabilità
• Distribuzioni discrete– Distribuzione uniforme discreta– Distribuzione di Poisson
• Distribuzioni continue– Distribuzione Uniforme– Distribuzione Gamma– Distribuzione Esponenziale– Distribuzione Chi-Quadro– Distribuzione normale o Gaussiana
• Distribuzione di tipo Standard• Distribuzione normale o Gaussiana di tipo generico
– Distribuzione T di student– Distribuzione F di Fisher
Distribuzione Uniforme Discreta
• Un variabile aleatoria è di tipo Uniforme Discreto se la funzione densità di probabilità è:
…fY(y)
( )
⎪⎪⎩
⎪⎪⎨
⎧ =
=altrove
NyN
yfY0
,...,2,11
L V i bil Al t i di d 1 2 3 N y
La Variabile Aleatoria dipende da un solo parametro: N
21+
=N
Yμ 12122 −= NYσMedia: Varianza:
M. Grosso - Statistica Distribuzioni di Probabilità 2
Distribuzione di Poisson
• La variabile aleatoria di Poisson è caratterizzata dalla funzione densità di probabilità:
( ) 00
,....2,1,0!
>
⎪⎪
⎩
⎪⎪
⎨
⎧ =
=
−
λ
λλ
altrove
yy
e
yf
x
Y
Di d d l l t λDipende dal solo parametro λ
λμ =Y λσ =2YMedia: Varianza:
Distribuzione di Poisson
• Alcuni esempi di distribuzioni di Poisson:
f Y(y
)
0.05
0.10
0.15
0.20
0.25
λ=3
f Y(y
)
0.02
0.04
0.06
0.08
0.10
0.12
0.14
λ=10
y0 2 4 6 8 100.00
y0 5 10 15 20 25
0.00
M. Grosso - Statistica Distribuzioni di Probabilità 3
Distribuzione Uniforme Continua
• Funzione di distribuzione uniforme
( ) [ ][ ]
1 ,
0 ,Y
se y a bf y b a
se y a b
⎧ ∈⎪= −⎨⎪ ∉⎩
fY(y) FY(y)
1
pdf cdf
Dipende da due parametri: a e b
ya b
1/(b-a)
ya b
1
Distribuzione Uniforme Continua
• È possibile calcolare media e varianza :
( ) 12
b
Ya
a by f y dy y dyb a
μ∞
−∞
+= = =
−∫ ∫
( ) ( ) ( )22
22 12 12
b
Y
a ba by f y dy y dyb a
σ μ∞ −+⎛ ⎞= − = − =⎜ ⎟ −⎝ ⎠∫ ∫
Questo risultato poteva essere intuitivo dato che la funzione è simmetrica rispetto al suo punto medio
2 12a b a−∞ −⎝ ⎠∫ ∫
M. Grosso - Statistica Distribuzioni di Probabilità 4
Distribuzione Gamma
( )( )( ) ( )⎪
⎪
⎨
⎧ ≥−Γ
− yyyr
ryf
r 0exp
;
1 λλλ
λ
• Variabile aleatoria a due parametri:– r > 0
λ > 0
( )
⎪⎪
⎩
⎨=altrove
ryfY0
,; λ
• La funzione Gamma di Eulero Γ(r) è definita come:
( ) ∫∞
−−=Γ0
1dxxer rx
Distribuzione Gamma
• Proprietà : • Esempi di distribuzioni Gamma:
λμ rY =
22
λσ rY =
Media:
Varianza:
f Y(y
)
0.3
0.4
0.5
r = 1r = 2
λ = 1
• La funzione assume valore massimo in corrispondenza di:
( )λ1max −= ryMax fY:
y0 5 10 150.0
0.1
0.2
M. Grosso - Statistica Distribuzioni di Probabilità 5
Distribuzione Esponenziale
• Caso particolare della Gamma (r = 1)
Un solo parametro: λ( ) ( )( ) ( )
exp0
1 expf y y
yF y y
λ λλ
= −≥
= − −
Un solo parametro: λ
λμ 1= 2
2 1λ
σ =
pdf cdf1
λ
fY(y) FY(y)
y y
Distribuzione Chi-Quadro
• Caso particolare della Gamma (λ = ½,r = ½ k)
⎧
( )( )
⎪⎪
⎩
⎪⎪
⎨
⎧≥⎟
⎠⎞
⎜⎝⎛−
Γ=
−
altrove
yyyk
kyf
k
k
Y
0
02
exp2/
121
;
12
2/ Un solo parametro k
k=μ k22 =σ
0.5
0.6
( ) ∞=1,lim yfY
y
0 2 4 6 8 10
f Y(y
)
0.0
0.1
0.2
0.3
0.4 n = 1n = 2n = 3
( )→
,lim0
yfYy
( )212,
0=
=yYyf
M. Grosso - Statistica Distribuzioni di Probabilità 6
Variabili aleatorie:Teorema limite centrale
• Esiste un teorema di statistica che afferma:
“Sia {Xi} una successione di variabili aleatorie indipendenti di media μ e varianza σ2, indipendenti ed identicamente
distribuite, allora la somma
converge asintoticamente verso una variabile aleatoria normale (o altrimenti detta Gaussiana)”
∑=
=n
iin XS
1
(o altrimenti detta Gaussiana)
Distribuzione normale di tipo standard• Una variabile aleatoria normale (detta anche di tipo Gaussiano) di
tipo standard è caratterizzata da una curva di distribuzione a forma di campanaforma di campana
px(x)0.5
Nell’esponenziale il termine z2 cresce
all’aumentare della distanza dall’origine, con
la stessa velocità sia a sinistra che a destra.
( ) ⎟⎠⎞
⎜⎝⎛−= 2
21exp
21 zzfZ π
12x-4 -2 0 2 4
0.0
0.1
0.2
0.3
0.4 L’esponenziale decresce in maniera simmetrica.
Il massimo si osserva in corrispondenza di z = 0
M. Grosso - Statistica Distribuzioni di Probabilità 7
Distribuzione normale di tipo standard
• Nota la distribuzione è possibile calcolare la probabilità di un qualunque evento per Z
• Esempio: probabilità Z < 1.05
L’area segnata in blu rappresenta la
probabilità che si verifichi un qualunque
numero Z < 1.05
13
x-4 -2 0 2 4
Z=1.05
ovvero
P(Z +1.5
A = Z < 1.5
è pari alla probabilità che si verifichi l’evento
B = Z > 1.5
M. Grosso - Statistica Distribuzioni di Probabilità 8
Distribuzione normale di tipo standard
• Il calcolo dell’area (probabilità) per il caso in esame richiede la valutazione dell’integrale:
• Purtroppo non esiste soluzione analitica per l’integrale. • Per la sua valutazione si ricorre alle tabelle
( ) ( ) ∫∫ ∞−∞− ⎟⎠⎞
⎜⎝⎛−==< 05.1 205.1
21exp
2105.1 dzzdzzfZP Z π
15
Distribuzione normale di tipo standard
• I valori dell’integrale (ovvero l’area) della distribuzione di tipo standard sono riportati in forma di tabella in (quasi) tutti i testi di statistica.
16
P(Z
M. Grosso - Statistica Distribuzioni di Probabilità 9
Distribuzione normale di tipo standard
• Altro esempio:
• Si può osservare che per gli assiomi di Kolmogoroff si ha
• Pertanto la probabilità può ancora essere ricavata facilmente dalla tabella
P(Z>1.05)
P(Z>1.05)+P(Z1.05) =1-P(Z
M. Grosso - Statistica Distribuzioni di Probabilità 10
Distribuzione normale di tipo standard
• Consultando le tabelle:
P(Z < 1.0)=0.8413
P(Z < 2 0)=0 9772
19
P(Z < 2.0)=0.9772
P(1.0 < Z < 2.0) = 0.9772-0.8413 = 0.1359
Distribuzione normale di tipo standard
• Con l’aiuto delle tabelle, calcolare
1. P(Z > 1.64)2. P(Z < -1.64)3. P(1.0 < Z < 1.5)4. P(-1 < Z < 2)5. P(-2 < Z < 2)
20
M. Grosso - Statistica Distribuzioni di Probabilità 11
Distribuzione normale generica
• Una variabile aleatoria (continua) Y si dice normale o Gaussianase la densità di probabilità è:
⎞⎛
• La funzione è definita lungo tutto l’asse reale (ovvero un qualunque numero reale può essere un esito di una VA di tipo normale)
• Il grafico di tale funzione è una curva a campana simmetrica rispetto a y=μY
( ) ( ) ⎟⎟⎠
⎞⎜⎜⎝
⎛ −−= 2
2
21exp
21
Y
Y
YY
yyfσ
μσπ
21
rispetto a y=μY• La distribuzione dipende da due parametri, μ e σ2.• Viene indicata in genere con la seguente simbologia:
( )2,~ YYNY σμ
Carl Friedrich Gauss
Gaussiana
M. Grosso - Statistica Distribuzioni di Probabilità 12
Distribuzione normale (o di tipo Gaussiano)
• La gaussiana è simmetrica rispetto al valore μY pertanto la media coincide con il valore μY
• Si può verificare matematicamente che il parametro σ2 definito nell’espressione coincide con la varianza della funzione di distribuzione.
• Importante:la distribuzione normale di tipo standard è un caso particolare
23
la d str buz one normale d t po standard è un caso part colare della formula generica con μY = 0 e σY = 1
In figura sono riportate tre gaussiane con egual media e varianza 0.25, 0.5, 1
Distribuzione normale (o di tipo Gaussiano)
0.5
0.75
1
1.25
1.5 Varianza σ2 = 0.25
Varianza σ2 = 1
24
Al diminuire della varianza, la campana si restringe sempre di più intorno al suo valore medio
-2 -1 1 2 3 4
0.25
M. Grosso - Statistica Distribuzioni di Probabilità 13
Distribuzione normale (o di tipo Gaussiano)
N.B.
Questo è vero per ogni valore di μ e σ nel caso
μ−σ μ+σ μ+2σ μ+3σμ−2σμ−3σ μ
68.26%
valore di μ e σ nel caso della Gaussiana!
La probabilità di osservare valori esterni
all’intervallo [μ−2σ, μ+2σ] è molto bassa (5%
circa)
25
95.46%
99.73%
Aree sottese dalla distribuzione normale
circa)
È praticamente nulla all’esterno
dell’intervallo [μ−3σ, μ+3σ] (meno del 3‰)
Distribuzione normale (o di tipo Gaussiano)
• Al diminuire di σ, i risultati dell’esperienza aleatoria assumono valori in intervalli sempre più piccoli
• L’incertezza diventa sempre più piccola• Non esistono delle tabelle per calcolare le probabilità per i
generici valori di μ e σ.• Vedremo nel seguito come è possibile ricondurre il calcolo della
probabilità sempre alla VA di tipo standard
26
M. Grosso - Statistica Distribuzioni di Probabilità 14
Funzioni di VA GaussianeTrasformazioni lineari
• Nel caso di una trasformazione lineare di variabili aleatorie:
• Si è visto come media e varianza di Z siano legate alla media e varianza di Y secondo la relazione
bYaZ +=
YZ ba μμ +=
222YZ b σσ =
27
• Si può inoltre verificare facilmente che, se Y è una Gaussiana, lo è anche la trasformata Z
Funzioni di VA GaussianeTrasformazioni lineari
• Data una variabile aleatoria Y (di tipo gaussiano) di media μY e i σ 2varianza σY2
• Si consideri la seguente trasformazione lineare:
• Di che tipo è la nuova variabile aleatoria?• Quale è la media e la varianza della nuova variabile?
Y
YYZσ
μ−=
28
Quale è la media e la varianza della nuova variabile?• È facile verificare che:
Gaussiana di tipo standard1
02 =
=
Z
Z
σμ
M. Grosso - Statistica Distribuzioni di Probabilità 15
Funzioni di VA GaussianeTrasformazioni lineari
• Nota la funzione di distribuzione standard è possibile ricavare le proprietà di una qualsiasi distribuzione gaussiana
• In particolare, è possibile calcolare la probabilità che si verifichi un dato evento per un generico processo, con media e varianza note.
• Questo è possibile sapendo solo i valori della distribuzione di tipo standard.
29
Calcolo probabilità per una Gaussiana generica
(y – μ)z = σ
-5 0 5 10 15
μ = 10; σ2 = 0.5
8100-5 5 15
μ = 5; σ2 = 10
10
30
-2.83 -1.58 1.58-5 0 5 10 15
Normale standard
0
M. Grosso - Statistica Distribuzioni di Probabilità 16
Calcolo probabilità per una Gaussiana generica
• Esempio: calcolare quale è la probabilità che si verifichi un evento appartenente all’intervallo [0,5] per la variabile aleatoria di media 3 e deviazione standard 2:
• Si deve calcolare quale è la probabilità che la variabile aleatoria di tipo standard assuma un valore nell’intervallo corrispondente.
31
Calcolo probabilità per una Gaussiana generica
• Dobbiamo calcolare la probabilità:
( )0 5P X< <• Gli estremi dell’intervallo corrispondente per la distribuzione di
tipo standard possono essere facilmente calcolati
( )0 5P X< <
1 0 3Xx μ− − ( )0 5P X
32
11 2
X
X
z μσ
= =
22
5 3 12
X
X
xz μσ− −
= = =
( )( )0 5
1.5 10.8413 0.0668 77.4%
P X
P Z
< < =
− < < =
− =
M. Grosso - Statistica Distribuzioni di Probabilità 17
Calcolo probabilità per una Gaussiana generica
• Esercizi• Sia Y una variabile aleatoria di tipo normale, di media μ = 16 e p , μ
varianza σ2 = 25• Calcolare:1. P(Y > 20)2. P(20 < Y < 25)3. P(Y < 10)4. P(12 < Y < 24)
33
Distribuzioni Gaussiane di tipo Vettoriale
• È possibile estendere la formulazione della Gaussiana al caso vettoriale:
• In cui ciascuna delle componenti è di natura Gaussiana.• L’attenzione si focalizzerà principalmente sul caso
bidimensionale:
NYYY ,...,, 21=Y
21,YY=Y
• Per cui è possibile osservare le marginali rispetto a Y1 e Y2:
M. Grosso - Statistica Distribuzioni di Probabilità 18
Distribuzioni Gaussiane di tipo Vettoriale
• Per le distribuzioni marginali si ha:( ) ( )
( )⎥⎤
⎢⎡ − 211
2222
2111
1e p1
,~,~
μ
σμσμ
yf
NYNY
• Se le due VA sono indipendenti allora la funzione densità di probabilità per la congiunta è data da:
( )
( )⎥⎦
⎤⎢⎣
⎡ −−=
⎥⎦
⎢⎣−=
22
222
2
21
11
1
21exp
21
2exp
2
2
1
σμ
σπ
σμ
σπ
yf
yf
Y
Y
• NB: la congiunta contiene 4 parametri
( ) ( ) ( ) ( )( ) ( )
⎥⎦
⎤⎢⎣
⎡ −−
−−==
22
222
21
211
2122211 2
121exp
21
σμ
σμ
σσπyyyfyff YYyY
35
Distribuzioni Gaussiane vettoriali Caso coppia di VA Gaussiane
• Una coppia di variabili aleatorie Y = (Y1, Y2) si dicono congiuntamente gaussiane (o normali) e si denotano con Y~N(μ,V) s l l df i t ss l s t s ssi :se lo loro pdf congiunta assume la seguente espressione:
• I parametri di tale pdf sono raccolti nel vettore μ e nella matrice V
• Il vettore μ è il vettore delle medie
( ) ( ) ( )⎥⎦
⎤⎢⎣
⎡ −−−=
−
2exp
det21 μyVμyV
y1T
Y πf
Il vettore μ è il vettore delle medie• La matrice V, simmetrica, definita positiva, è la matrice di
covarianza
2212
1221
σσσσ
=V 0xxVxT ≠∀>⋅⋅ 0
36
M. Grosso - Statistica Distribuzioni di Probabilità 19
Variabili aleatorie vettorialiCoefficiente di correlazione
• Dalla matrice di covarianza è possibile determinare la correlazione tra due variabili aleatorie.
• Siano date due variabili aleatorie Y1 e Y2. Il coefficiente di correlazione è definito come:
• Per come è definito:
( )( ) ( ) 21
12
21
2112
,covσσ
σρ ==YVYV
YY
• Per come è definito:
11 12 ≤≤− ρ
37
Distribuzioni Gaussiane vettoriali Caso Gaussiano VA Indipendenti
3
-2
0
2-2
0
2
00.0250.05
0.0750.1
-2
0
2-3
-2
-1
0
1
2
-3 -2 -1 0 1 2 33
00
2001
== μV
38
M. Grosso - Statistica Distribuzioni di Probabilità 20
Distribuzioni Gaussiane vettoriali Caso Gaussiano VA Indipendenti
• Rappresentazione distribuzioni marginali e probabilità condizionate
y1-3 -2 -1 0 1 2 3
2
3
fY2
fY1
y1-3 -2 -1 0 1 2 3
( ) 21 2 1 1| 1.5 0, 1Yf y y μ σ→ = =
μ=0σ2=1
39
-3 -2 -1 0 1 2 3-3
-2
-1
0
1
y 1-3 -2 -1 0 1 2 3( ) 21 2 1 1| 1.5 0, 1Yf y y μ σ→ − = =
La probabilità dell’evento y1 non cambia con il valore di y2
μ=0σ2=2
Distribuzioni Gaussiane Vettoriali –Caso VA non indipendenti
2
-2
-1
0
1
-2
0-2
0
2
0
0.1
0.2
-2
0
40
1 02 0α
α= =V μ
-2 -1 0 1 2
-222
M. Grosso - Statistica Distribuzioni di Probabilità 21
Distribuzioni Gaussiane Vettoriali –Caso VA non indipendenti
• Rappresentazione distribuzioni marginali e probabilità condizionate
-3 -2 -1 0 1 2 3
y1-3 -2 -1 0 1 2 3
fY1 μ=0σ2=1
fY2
( ) 21 2 1 1| 1.5 1.2, 0.36Yf y y μ σ→ = =
41
μ=0σ2=1
-3 -2 -1 0 1 2 3
( ) 21 2 1 1| 1.5 1.2, 0.36Yf y y μ σ→ − = − =
Distribuzioni Gaussiane Vettoriali –Caso VA non indipendenti
• Nel caso di correlazione |ρ| = 1 la distribuzione degenera in una retta.
0
2
0
0.2
0.4
-1
0
1
2
3
42
-2
0
2
-2
0-2
0
2
-3 -2 -1 0 1 2 3-3
-2
Domanda: in questo caso come si comportano le marginali e le probabilità condizionate?
M. Grosso - Statistica Distribuzioni di Probabilità 22
• Nel caso generico di n componenti la variabile aleatoria vettoriale assume la forma:
Variabili Aleatorie di tipo Normale Vettoriali – Caso Generico
• I parametri di tale pdf sono raccolti nel vettore μ e nella matrice V:
• μ = (μ1, μ2, ... , μn);• V matrice (n × n) definita positiva è la matrice di covarianza
( )( )
( ) ( )( )⎥⎦⎤
⎢⎣⎡ −−−= − μyVμy
Vy 1TY 2
1expdet2
12/nf π
• V, matrice (n × n) definita positiva, è la matrice di covarianza.
• Ancora, se le VA componenti sono indipendenti, la matrice V è diagonale perché tutte le covarianze sono nulle.
43
Distribuzione T di student
• Utilizzata nei test statistici
1 ⎟⎞⎜⎛+
Γ1ν
• Essendo K una costante di normalizzazione.• Proprietà:
( ) Ryy
Kyf ∈
⎟⎠⎞
⎜⎝⎛ +
= + ,
1
12
12
νν
ν ⎟⎠⎞
⎜⎝⎛Γ
⎟⎠⎞
⎜⎝⎛Γ
=
2
2νπν
K
• Dipende da un solo parametro il numero intero ν (detto anchegrado di libertà della T di student)
0=Yμ ( )222 >
−= ν
ννσYMedia: Varianza:
M. Grosso - Statistica Distribuzioni di Probabilità 23
Distribuzione T di student
• In figura sono mostrate le funzioni densità per 1,3,6 gradi di libertà.
W. Gossett“creatore”
della T-student
f Y(y
)
0.1
0.2
0.3
0.4 n =2n = 4Distribuzione Standard
n
45
• La T è simmetrica rispetto a 0: μ=0, σ2=r/(r-2) r≥3• Per r → ∞ la T di student tende ad una gaussiana di tipo
standard.
y-4 -2 0 2 40.0
Distribuzione F di Fisher
yymn
nm
nm
nm
mn
⎪⎪⎪⎧
≥⎞⎛ ⎞⎛
⎟⎠⎞
⎜⎝⎛
⎞⎛⎞⎛
⎟⎠⎞
⎜⎝⎛ +Γ
+
−
022
22/
( ) Nnmaltrove
ynmmnm
nmyfY ∈
⎪⎪⎪⎪⎪⎪
⎩
⎪⎪⎪⎪
⎨
⎟⎠
⎞⎜⎝
⎛⎟⎠⎞
⎜⎝⎛+
⎠⎝⎟⎠⎞
⎜⎝⎛Γ⎟
⎠⎞
⎜⎝⎛Γ
= ,0
122
,;
2
⎪⎩
( )2,2
>−
= nn
nYμ
( )( )( )2
22
2422−−
−+=
nnmnnm
YσMedia: Varianza:
M. Grosso - Statistica Distribuzioni di Probabilità 24
La distribuzione F di Fisher
• Grafici della F di Fisher al variare dei gradi di libertà
12
f Y(y
)
0.4
0.6
0.8
1.0
1.2(10, 4) g.d.l.(10, 10) g.d.l(10, 50) g.d.l.(10, Infinity) g.d.l.
47
y0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0
0.0
0.2
Sir Ronald Aymer Fisher1890 - 1962