G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di...
of 35/35
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni Le distribuzioni di probabilità di probabilità discrete discrete Giovanni Filatrella Giovanni Filatrella ( ( [email protected][email protected]) ) Elaborazione Statistica dei Dati Elaborazione Statistica dei Dati Sperimentali Sperimentali Facoltà di Scienze MM FF e NN, Università Sannio
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità discrete Giovanni Filatrella ( [email protected]
Text of G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di...
Slide 1
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 1 Le distribuzioni di probabilit discrete Giovanni
Filatrella ( [email protected] ) Elaborazione Statistica dei
Dati Sperimentali Elaborazione Statistica dei Dati Sperimentali
Facolt di Scienze MM FF e NN, Universit Sannio
Slide 2
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 2 Cos una distribuzione di probabilit discreta Abbiamo
definito una variabile casuale X una variabile che pu assumere
diversi valori: {x 1, x 2, , x N } Ognuno di questi con probabilit:
{p 1, p 2, , p N } La funzione che associa una probabilit p i al
valore i- esimo della variabile casuale x i la distribuzione di
probabilit.
Slide 3
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 3 Attenzione a non confondere i seguenti 4 concetti:
1.X il simbolo che denota la variabile casuale che pu assumere i
valori { x i } 2.Lindice i serve solo a numerare i possibili
risultati 3.Le x i sono i valori numerici che si ottengono per l i
-esimo risultato 4.Le p i sono il rapporto fra i casi favorevoli
alli- esimo risultato e tutti i risultati possibili
Slide 4
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 4 Attenzione a non confondere i seguenti 4 concetti:
1.X il simbolo che denota la variabile casuale che pu assumere i
valori { x i } 2.Lindice i serve solo a numerare i possibili
risultati 3.Le x i sono i valori numerici che si ottengono per l i
-esimo risultato 4.Le p i sono il rapporto fra i casi favorevoli
alli- esimo risultato e tutti i risultati possibili
Slide 5
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 5 1.0 1.2 1.4 1.6 1.8 2.0 2.2 2.4 Probabilit 0.15 xixi
La funzione distribuzione la legge che regola le probabilit (le
altezze dei rettangoli). Rappresentazione grafica: Variabile
casuale 0.10 0.05 0.20 0.25
Slide 6
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 6 Unimportante distinzione Il concetto di
distribuzione discreta vuol dire che solo un numero intero di
differenti valori possibile, e si riferisce allindice i ; Il valore
della variabile x i non necessariamente un intero.
Slide 7
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 7 Esempio: la distribuzione di probabilit uniforme: Se
supponiamo che tutti valori della variabile casuale siano
equiprobabili: Allora la distribuzione detta uniforme. D.: Quanto
vale p ?
Slide 8
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 8 Valore aspettato e varianza Per le variabili
discrete possibile definire un valore aspettato E[x] ed una
varianza Var[x] che sono analoghe alle misure di posizione e
dispersione valore medio e scarto quadratico medio:
Slide 9
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 9 Valore aspettato e varianza non coincidono con media
e scarto quadratico medio Per un numero di tentativi molto elevato
ragionevole che si identifichino le f i e le p i.
Slide 10
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 10 Esercizio: *Quanto vale il valore aspettato per la
distribuzione uniforme? ***Quanto vale la varianza per la
distribuzione uniforme? Si provi prima con un intervallo specifico
(ex, 4 ) e poi con un N generico.
Slide 11
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 11 Definizione formale di processo binomiale o
bernoulliano 1)Ciascuna prova ha solo due esiti, che chiameremo
successo e insuccesso 2)La probabilit p di un successo in ciascuna
prova resta costante per tutte le prove e non influenzata dagli
esiti precedenti (le prove sono indipendenti). La probabilit di un
insuccesso q = 1 - p.
Slide 12
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 12 Diagramma ad albero per la distribuzione binomiale
Si pu derivare la distribuzione binomiale immaginando che il
processo avvenga in sequenza, e che ad ogni scelta sia associata
una probabilit elementare
Slide 13
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 13 Calcolo esplicito delle probabilit per lalbero
binomiale La probabilit degli eventi pu essere trovata osservando
che ognuno dei risultati la combinazione di eventi indipendenti non
necessariamente equiprobabili, ovvero p q S : un cliente sceglie
soup, F : sceglie fish. Prob. di avere: 3S 2S 1S 2S 1S 0S
Slide 14
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 14 Probabilit non identiche fra le pi scelte Notare: i
diagrammi ad albero possono essere utilizzati per il calcolo di
probabilit di sequenze generiche, ma non sono distribuzioni
binomiali!
Slide 15
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 15 Distribuzione binomiale in formule Dato un
esperimento che si pu verificare solo in due modi (successo ed
insuccesso) mutuamente esclusivi e complementari, quindi con
probabilit p e 1- p. Qual la probabilit di avere n successi su N
misure?
Slide 16
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 16 Definizione di fattoriale Il fattoriale di un
numero intero n si indica con n! ed definito come:
Slide 17
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 17 Esempi di distribuzione binomiale 1.Quante teste si
ottengono lanciando 10 monete? 2.Se il 23% della popolazione della
provincia di Benevento risiede nel capoluogo, su 4 persone quante
risiederanno nel capoluogo? 3.Se una fabbrica produce l 1% di pezzi
difettosi, in un lotto di 20 quanti sono difettosi? D1.: Sono
distribuzioni binomiali? Perch? D2.: Trovare per ognuno degli
esempi i parametri della distribuzione binomiale.
Slide 18
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 18 Propriet della distribuzione binomiale: il valore
aspettato Coincide, come intuibile, con il prodotto del numero di
tentativi per la probabilit di successo.
Slide 19
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 19 Propriet della distribuzione binomiale: la varianza
E proporzionale al numero di tentativi, moltiplicata per la
probabilit di successo e per la probabilit di insuccesso.
Slide 20
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 20 Esempi di distribuzioni binomiali Ci che conta e il
prodotto Np Infatti: 0.5X160 = 80 0.3X270 = 80 p=0.5 p=0.3
Slide 21
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 21 Un esempio numerico Se si lanciano dieci monete
supposte perfettamente simmetriche (o non truccate), cosa si pu
dire dei possibili esiti? 1)La probabilit di successo p=1/2 2)Il
numero di tentativi N=10 3)Il valore aspettato Np=5 4)La varianza
Np(1-p)=2.5 5)La deviazione standard (Np(1-p))=1.58
Slide 22
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 22 Risultati del calcolo della formula binomiale per
N=10, p=0.5 SuccessiB 0.5,10 (n) n 00.0010 10.0098 20.0439 30.1172
40.2051 50.2461 60.2051 70.1172 80.0439 90.0098 100.0010 Il valore
aspettato (5) il pi probabile Attorno al valore aspettato in un
intervallo di semiampiezza la deviazione standard (1.5) si trovano
circa il 70% dei casi.
Slide 23
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 23 Unapplicazione Le finali di alcuni tornei di calcio
si decidono calciando 6 rigori. D.: il pareggio dopo sei rigori
succeder pi spesso se: a)La probabilit di segnare per entrambe le
squadre alta (ex, p=0.8) b)La probabilit di segnare per entrambe le
squadre media (ex, p=0.5) c)La probabilit di segnare per entrambe
le squadre bassa (ex, p=0.2)
Slide 24
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 24 Distribuzione di Poisson Supponiamo di avere una
variabile binomiale dove 1.Il numero molto elevato di tentativi ( N
) 2.La probabilit molto bassa ( p 0 ), ma in modo tale che il
valore aspettato sia finito: Np=. Qual la distribuzione di
probabilit? In principio si potrebbe sempre calcolare la Binomiale,
ma i fattoriali rendono il calcolo estremamente laborioso. La
distribuzione di Poisson il limite della Binomiale nelle ipotesi 1)
e 2).
Slide 25
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 25 Esempi di distribuzione di Poisson 1.Quanti
studenti iscritti in questa Facolt hanno un altezza superiore al 95
mo percentile? 2.Una malattia rara colpisce l 1% della popolazione.
Quante persone sono colpite in una citt come Benevento? 3.Quanti
dei residenti in Benevento sono nati il 29 febbraio?
Slide 26
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 26 Distribuzione di Poisson: formulazione matematica
La distribuzione di Poisson ha un solo parametro:. Ovviamente se il
valore aspettato : Np=. D.: Trovare le distribuzioni di probabilit
per gli esempi precedenti.
Slide 27
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 27 Distribuzione di Poisson: formulazione matematica
La distribuzione di Poisson ha un solo parametro: Ovviamente se il
valore aspettato : Np= : La varianza anche vale :
Slide 28
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 28 Confronto con la distribuzione di Bernoulli
Bernoulli = Np si ricava da due parametri indipendenti = Np(1-p) si
potrebbe anche scrivere come: = (1-p) Per p molto piccola Poisson
lunico parametro che caratterizza la distribuzione si trova che la
varianza dipende dal parametro e =
Slide 29
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 29 Osservazioni (1) Un processo per essere poissoniano
dovrebbe ammettere un numero infinito di tentativi e quindi
ammettere un numero infinito di successi. In pratica si applica a
casi in cui questo solo approssimativamente vero. D: negli esempi
di distribuzione di Poisson precedente c un limite al numero di
successi? Quale?
Slide 30
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 30 Osservazioni (2) Anche se tutti i processi reali
sono solo approssimativamente poissoniani assai comodo utilizzare
questa distribuzione perch pi semplice da valutare. Di fatto per N
molto grande i fattoriale della distribuzione di Bernoulli sono
enormi. D: qual lintero pi grande di cui potete calcolare il
fattoriale con la calcolatrice da tasca?
Slide 31
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 31 Estensione della distribuzione di Poisson Supponete
che per un evento non si conosca davvero il numero di tentativi:
Es.: Supponiamo che una persona guardi mezzora di una qualsiasi
partita di un turno di serie A. Se sono state segnate 22 reti nelle
9 partite, qual la probabilit che questa persona assista a 2
reti?
Slide 32
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 32 Perch si pu usare la distribuzione di Poisson Si pu
immaginare che nellintervallo di tempo considerato vi siano N
tentativi di fare goal. La probabilit p di fare goal per ogni
tentativo sconosciuta, ma bassa perch in tutto si sono segnate solo
22 reti in 9 partite. Se supponiamo che i tentativi siano molti (al
limite, infiniti) in principio possiamo usare la distribuzione di
Poisson, e per farlo basterebbe conoscere il suo valore medio Np.
D.: Come si pu stimare Np ?
Slide 33
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 33 Soluzione In tutte le 9 partite vi sono 27 periodi
di mezzora. Se sono stati segnati 22 goal in tutto, in media in
ogni periodo sono stati segnati: D.: ** Come verifichereste che il
metodo funziona? Provare a casa con i risultati di un qualsiasi
turno di serie A.
Slide 34
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 34 Descrizione formale dei processi di Poisson Un
processo di Poisson si pu quindi definire come un processo
caratterizzato da n eventi che in un intervallo di tempo t : 1.Si
possono verificare nellintervallo di tempo indipendentemente da
quanto avvenuto negli intervalli precedenti; 2.La probabilit che si
verifichi un evento proporzionale alla durata dellintervallo t, con
costante di proporzionalit ; Allora si avr un processo di Poisson
con valore aspettato t :
Slide 35
G. Filatrella: Corso di Elaborazione Statistica dei Dati
Sperimentali 35 Esercizi 1.* Nellesempio precedente dei goal
segnati in mezzora, identificare le varie quantit n, t, 2.**
Supponiamo che in un lago artificiale senza altro cibo vengono
immesse trote, una ogni 10 minuti. Se ci sono 10 pescatori:
a)Quante trote prenderanno ogni ora? b)Trovare i parametri del
processo di Poisson.