of 35 /35
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni Le distribuzioni di probabilità di probabilità discrete discrete Giovanni Filatrella Giovanni Filatrella ( ( [email protected] [email protected] ) ) Elaborazione Statistica dei Dati Elaborazione Statistica dei Dati Sperimentali Sperimentali Facoltà di Scienze MM FF e NN, Università Sannio

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilità discrete Giovanni Filatrella ( [email protected]

Embed Size (px)

Text of G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di...

  • Slide 1
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Le distribuzioni di probabilit discrete Giovanni Filatrella ( [email protected] ) Elaborazione Statistica dei Dati Sperimentali Elaborazione Statistica dei Dati Sperimentali Facolt di Scienze MM FF e NN, Universit Sannio
  • Slide 2
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 2 Cos una distribuzione di probabilit discreta Abbiamo definito una variabile casuale X una variabile che pu assumere diversi valori: {x 1, x 2, , x N } Ognuno di questi con probabilit: {p 1, p 2, , p N } La funzione che associa una probabilit p i al valore i- esimo della variabile casuale x i la distribuzione di probabilit.
  • Slide 3
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 3 Attenzione a non confondere i seguenti 4 concetti: 1.X il simbolo che denota la variabile casuale che pu assumere i valori { x i } 2.Lindice i serve solo a numerare i possibili risultati 3.Le x i sono i valori numerici che si ottengono per l i -esimo risultato 4.Le p i sono il rapporto fra i casi favorevoli alli- esimo risultato e tutti i risultati possibili
  • Slide 4
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 4 Attenzione a non confondere i seguenti 4 concetti: 1.X il simbolo che denota la variabile casuale che pu assumere i valori { x i } 2.Lindice i serve solo a numerare i possibili risultati 3.Le x i sono i valori numerici che si ottengono per l i -esimo risultato 4.Le p i sono il rapporto fra i casi favorevoli alli- esimo risultato e tutti i risultati possibili
  • Slide 5
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 5 1.0 1.2 1.4 1.6 1.8 2.0 2.2 2.4 Probabilit 0.15 xixi La funzione distribuzione la legge che regola le probabilit (le altezze dei rettangoli). Rappresentazione grafica: Variabile casuale 0.10 0.05 0.20 0.25
  • Slide 6
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 6 Unimportante distinzione Il concetto di distribuzione discreta vuol dire che solo un numero intero di differenti valori possibile, e si riferisce allindice i ; Il valore della variabile x i non necessariamente un intero.
  • Slide 7
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 7 Esempio: la distribuzione di probabilit uniforme: Se supponiamo che tutti valori della variabile casuale siano equiprobabili: Allora la distribuzione detta uniforme. D.: Quanto vale p ?
  • Slide 8
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 8 Valore aspettato e varianza Per le variabili discrete possibile definire un valore aspettato E[x] ed una varianza Var[x] che sono analoghe alle misure di posizione e dispersione valore medio e scarto quadratico medio:
  • Slide 9
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 9 Valore aspettato e varianza non coincidono con media e scarto quadratico medio Per un numero di tentativi molto elevato ragionevole che si identifichino le f i e le p i.
  • Slide 10
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 10 Esercizio: *Quanto vale il valore aspettato per la distribuzione uniforme? ***Quanto vale la varianza per la distribuzione uniforme? Si provi prima con un intervallo specifico (ex, 4 ) e poi con un N generico.
  • Slide 11
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 11 Definizione formale di processo binomiale o bernoulliano 1)Ciascuna prova ha solo due esiti, che chiameremo successo e insuccesso 2)La probabilit p di un successo in ciascuna prova resta costante per tutte le prove e non influenzata dagli esiti precedenti (le prove sono indipendenti). La probabilit di un insuccesso q = 1 - p.
  • Slide 12
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 12 Diagramma ad albero per la distribuzione binomiale Si pu derivare la distribuzione binomiale immaginando che il processo avvenga in sequenza, e che ad ogni scelta sia associata una probabilit elementare
  • Slide 13
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 13 Calcolo esplicito delle probabilit per lalbero binomiale La probabilit degli eventi pu essere trovata osservando che ognuno dei risultati la combinazione di eventi indipendenti non necessariamente equiprobabili, ovvero p q S : un cliente sceglie soup, F : sceglie fish. Prob. di avere: 3S 2S 1S 2S 1S 0S
  • Slide 14
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 14 Probabilit non identiche fra le pi scelte Notare: i diagrammi ad albero possono essere utilizzati per il calcolo di probabilit di sequenze generiche, ma non sono distribuzioni binomiali!
  • Slide 15
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 15 Distribuzione binomiale in formule Dato un esperimento che si pu verificare solo in due modi (successo ed insuccesso) mutuamente esclusivi e complementari, quindi con probabilit p e 1- p. Qual la probabilit di avere n successi su N misure?
  • Slide 16
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 16 Definizione di fattoriale Il fattoriale di un numero intero n si indica con n! ed definito come:
  • Slide 17
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 17 Esempi di distribuzione binomiale 1.Quante teste si ottengono lanciando 10 monete? 2.Se il 23% della popolazione della provincia di Benevento risiede nel capoluogo, su 4 persone quante risiederanno nel capoluogo? 3.Se una fabbrica produce l 1% di pezzi difettosi, in un lotto di 20 quanti sono difettosi? D1.: Sono distribuzioni binomiali? Perch? D2.: Trovare per ognuno degli esempi i parametri della distribuzione binomiale.
  • Slide 18
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 18 Propriet della distribuzione binomiale: il valore aspettato Coincide, come intuibile, con il prodotto del numero di tentativi per la probabilit di successo.
  • Slide 19
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 19 Propriet della distribuzione binomiale: la varianza E proporzionale al numero di tentativi, moltiplicata per la probabilit di successo e per la probabilit di insuccesso.
  • Slide 20
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 20 Esempi di distribuzioni binomiali Ci che conta e il prodotto Np Infatti: 0.5X160 = 80 0.3X270 = 80 p=0.5 p=0.3
  • Slide 21
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 21 Un esempio numerico Se si lanciano dieci monete supposte perfettamente simmetriche (o non truccate), cosa si pu dire dei possibili esiti? 1)La probabilit di successo p=1/2 2)Il numero di tentativi N=10 3)Il valore aspettato Np=5 4)La varianza Np(1-p)=2.5 5)La deviazione standard (Np(1-p))=1.58
  • Slide 22
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 22 Risultati del calcolo della formula binomiale per N=10, p=0.5 SuccessiB 0.5,10 (n) n 00.0010 10.0098 20.0439 30.1172 40.2051 50.2461 60.2051 70.1172 80.0439 90.0098 100.0010 Il valore aspettato (5) il pi probabile Attorno al valore aspettato in un intervallo di semiampiezza la deviazione standard (1.5) si trovano circa il 70% dei casi.
  • Slide 23
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 23 Unapplicazione Le finali di alcuni tornei di calcio si decidono calciando 6 rigori. D.: il pareggio dopo sei rigori succeder pi spesso se: a)La probabilit di segnare per entrambe le squadre alta (ex, p=0.8) b)La probabilit di segnare per entrambe le squadre media (ex, p=0.5) c)La probabilit di segnare per entrambe le squadre bassa (ex, p=0.2)
  • Slide 24
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 24 Distribuzione di Poisson Supponiamo di avere una variabile binomiale dove 1.Il numero molto elevato di tentativi ( N ) 2.La probabilit molto bassa ( p 0 ), ma in modo tale che il valore aspettato sia finito: Np=. Qual la distribuzione di probabilit? In principio si potrebbe sempre calcolare la Binomiale, ma i fattoriali rendono il calcolo estremamente laborioso. La distribuzione di Poisson il limite della Binomiale nelle ipotesi 1) e 2).
  • Slide 25
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 25 Esempi di distribuzione di Poisson 1.Quanti studenti iscritti in questa Facolt hanno un altezza superiore al 95 mo percentile? 2.Una malattia rara colpisce l 1% della popolazione. Quante persone sono colpite in una citt come Benevento? 3.Quanti dei residenti in Benevento sono nati il 29 febbraio?
  • Slide 26
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 26 Distribuzione di Poisson: formulazione matematica La distribuzione di Poisson ha un solo parametro:. Ovviamente se il valore aspettato : Np=. D.: Trovare le distribuzioni di probabilit per gli esempi precedenti.
  • Slide 27
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 27 Distribuzione di Poisson: formulazione matematica La distribuzione di Poisson ha un solo parametro: Ovviamente se il valore aspettato : Np= : La varianza anche vale :
  • Slide 28
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 28 Confronto con la distribuzione di Bernoulli Bernoulli = Np si ricava da due parametri indipendenti = Np(1-p) si potrebbe anche scrivere come: = (1-p) Per p molto piccola Poisson lunico parametro che caratterizza la distribuzione si trova che la varianza dipende dal parametro e =
  • Slide 29
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 29 Osservazioni (1) Un processo per essere poissoniano dovrebbe ammettere un numero infinito di tentativi e quindi ammettere un numero infinito di successi. In pratica si applica a casi in cui questo solo approssimativamente vero. D: negli esempi di distribuzione di Poisson precedente c un limite al numero di successi? Quale?
  • Slide 30
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 30 Osservazioni (2) Anche se tutti i processi reali sono solo approssimativamente poissoniani assai comodo utilizzare questa distribuzione perch pi semplice da valutare. Di fatto per N molto grande i fattoriale della distribuzione di Bernoulli sono enormi. D: qual lintero pi grande di cui potete calcolare il fattoriale con la calcolatrice da tasca?
  • Slide 31
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 31 Estensione della distribuzione di Poisson Supponete che per un evento non si conosca davvero il numero di tentativi: Es.: Supponiamo che una persona guardi mezzora di una qualsiasi partita di un turno di serie A. Se sono state segnate 22 reti nelle 9 partite, qual la probabilit che questa persona assista a 2 reti?
  • Slide 32
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 32 Perch si pu usare la distribuzione di Poisson Si pu immaginare che nellintervallo di tempo considerato vi siano N tentativi di fare goal. La probabilit p di fare goal per ogni tentativo sconosciuta, ma bassa perch in tutto si sono segnate solo 22 reti in 9 partite. Se supponiamo che i tentativi siano molti (al limite, infiniti) in principio possiamo usare la distribuzione di Poisson, e per farlo basterebbe conoscere il suo valore medio Np. D.: Come si pu stimare Np ?
  • Slide 33
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 33 Soluzione In tutte le 9 partite vi sono 27 periodi di mezzora. Se sono stati segnati 22 goal in tutto, in media in ogni periodo sono stati segnati: D.: ** Come verifichereste che il metodo funziona? Provare a casa con i risultati di un qualsiasi turno di serie A.
  • Slide 34
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 34 Descrizione formale dei processi di Poisson Un processo di Poisson si pu quindi definire come un processo caratterizzato da n eventi che in un intervallo di tempo t : 1.Si possono verificare nellintervallo di tempo indipendentemente da quanto avvenuto negli intervalli precedenti; 2.La probabilit che si verifichi un evento proporzionale alla durata dellintervallo t, con costante di proporzionalit ; Allora si avr un processo di Poisson con valore aspettato t :
  • Slide 35
  • G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 35 Esercizi 1.* Nellesempio precedente dei goal segnati in mezzora, identificare le varie quantit n, t, 2.** Supponiamo che in un lago artificiale senza altro cibo vengono immesse trote, una ogni 10 minuti. Se ci sono 10 pescatori: a)Quante trote prenderanno ogni ora? b)Trovare i parametri del processo di Poisson.