46
1 DISTRIBUZIONI DI PROBABILITÁ

05distribuzioni di probabilit[1]

  • Upload
    a-t

  • View
    44

  • Download
    0

Embed Size (px)

Citation preview

1

DISTRIBUZIONI DI PROBABILITÁ

2

A tutte le variabili casuali, discrete e continue, è associata una distribudistribu--zione che permette di calcolare le zione che permette di calcolare le probabilitprobabilitàà degli eventi possibilidegli eventi possibili.Nel caso discretodiscreto, tale distribuzione soddisfa le due condizioni:

( ) 10 ≤≤ ixp

( ) 1=∑ ixp

1.

2.

Nel caso continuocontinuo, si tratta di una funzione che soddisfa le due condizioni:

1. ( ) 0≥xf

( ) 1=∫+∞

∞−

dxxf2.

3

distribuzione binomialedistribuzione binomiale

Si indichi con pp la probabilità che si presenti un determinato evento in una prova, e con q = 1q = 1--pp la probabilità che l’evento non si presenti;

allora, la probabilità che in nn prove l’evento si presenti esattamente kk volte èdata da:

knkk qp

kn

P −⎟⎟⎠

⎞⎜⎜⎝

⎛=

Si utilizza per eventi che possono assumere solo due valori, tipo “giusto-sbagliato”, “testa-croce”, “vero-falso”.

4

distribuzione binomialedistribuzione binomiale

knkk qp

kn

P −⎟⎟⎠

⎞⎜⎜⎝

⎛=

La formula permette di calcolare la probabilità che in nn prove l’evento con probabilità pp si verifichi kk volte:

dove:

kPnkp

pq −=1

probabilità di kk successi in nn prove

numero delle prove

numero dei successi

probabilità del successo

probabilità dell’insuccesso

5

knk qp −La quantità calcola la probabilitàdi ottenere in maniera ordinata k successi (eventi con probabilità p) e n-k insuccessi (eventi con probabilità q).

Ovviamente non siamo interessati all’ordine con cui questi successi appaiono, quindi è necessario moltiplicare questa probabilità per il numero di successioni ordinate di n eventi in cui il numero di successi è k (ogni successione di k successi su n tentativi/eventi ha uguale probabilità). Questo numero è facilmente calcolabile con la formula per calcolare le combinazioni di n su k:

)!(!!

knkn

kn

−=⎟⎟

⎞⎜⎜⎝

6

esempio 1esempio 1(1)(1)

Calcolare la probabilità di ottenere 4 teste lanciando una moneta non truccata 10 volte.L’evento che consideriamo, “esito del lancio di una moneta”, ha due risultati possibili, pertanto utilizziamo la distribuzione binomiale con:

nkp

pq −=1

numero delle prove = 10

numero dei successi (teste) = 4

probabilità del successo (testa) = 0,5

probabilità dell’insuccesso = 0,5

7

esempio 1esempio 1(2)(2)

Calcolare la probabilità di ottenere 4 volte testa lanciando una moneta non truccata.

( ) ( ) 205,05,05,0410 4104

4 =⎟⎟⎠

⎞⎜⎜⎝

⎛= −P

Allo stesso modo possiamo calcolare le probabilità di ottenere un qualunque numero di teste (compreso tra 0 e 10) in 10 prove.

8

esempio 1esempio 1(3)(3)

Rappresentazione grafica della distribuzione di probabilità della v.c.

X = numero di teste in 10 lanci di una monetaX = numero di teste in 10 lanci di una moneta

0

0,05

0,1

0,15

0,2

0,25

0 1 2 3 4 5 6 7 8 9 10

numero di teste in 10 lanci

prob

abili

9

proprietproprietàà (1) (1)

La distribuzione binomialedistribuzione binomiale gode delle seguenti proprietà:

1. È una distribuzione discretadistribuzione discreta in quanto kkassume solo valori interi (compresi tra 00 e nn);

2. Pk ≥ 0 per qualunque valore di k;

3. 10

=∑=

n

kkP

Queste proprietà, in particolare la 2 e la 3 consentono di dire che la distribuzione binomiale è una distribuzione di probabilità.

10

proprietproprietàà (2) (2)

4. se p = q = 0,5 si tratta di una distribuzione simmetricadistribuzione simmetrica, in tutti gli altri casi è asimmetricaasimmetrica (basti pensare che se la moneta è sbilanciata ed ha un’alta probabilità di produrre testa ad ogni tiro, un numero alto di teste nel totale dei tiri èpiù probabile di un numero basso di teste)

np=μ5. la mediala media della distribuzione è data da

npq=2σ

6. la varianzala varianza della distribuzione è data da

npq=σ

7. la deviazione standardla deviazione standard è data da

11

distribuzione ipergeometricadistribuzione ipergeometrica

Si utilizza quando si eseguono estrazioni senza reinserimento. In generale, volendo estrarre, da un insieme di NN elementi, NN11dei quali aventi una certa caratteristica ed NN22 un’altra caratteristica (con NN1 1 + N+ N2 2 = = NN), un campione di nn elementi distinti me-diante un’estrazione senza reinserimento; ci si chiede quale sia la probabilità che, di questi nn elementi, kk siano di un tipo e gli altri (n (n -- k)k) dell’altro tipo.

Per determinare tale probabilità ènecessario individuare quali siano i casi possibili nello spazio campionario relativo all’esperimento: “numero di campioni di n elementi che si possono ottenere dall’insieme”.

12

distribuzione ipergeometricadistribuzione ipergeometrica

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

⎛−⎟⎟

⎞⎜⎜⎝

=

nN

knN

kN

Pk

21

Alla fine, si giunge alla formula:

dove:

n

k

numero di elementi del campione

numero di elementi del campione con la prima caratteristica

N numero di elementi dell’insieme

2N numero di elementi dell’insieme con la seconda caratteristica

1N numero di elementi dell’insieme con la prima caratteristica

13

esempio 2esempio 2(1)(1)Un’urna contiene 10 palline di cui 4 sono rosse e 6 bianche. Si estraggono in blocco (senza reinserimento) 3 palline; calcolare la probabilità di estrarre 2 palline rosse.

La variabile casuale che consideriamo èX = numero di palline rosse estratte, in particolare ci interessa determinare la probabilità che [X =2] con:

n

k

numero di elementi del campione = 3

numero di elementi del campione con la prima caratteristica = 2

N numero di elementi dell’insieme = 10

2N numero di elementi dell’insieme con la seconda caratteristica = 6 (bianco)

1N numero di elementi dell’insieme con la prima caratteristica = 4 (rosso)

14

esempio 2esempio 2(2)(2)

Applicando la formula avremo:

3,012036

310

16

24

2 ==

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

⎛⎟⎟⎠

⎞⎜⎜⎝

=P

Allo stesso modo possiamo calcolare le probabilità di ottenere un qualunque numero di palline rosse (compreso tra 0 e 3) in un campione di 3 palline estratte senza reinserimento.

15

esempio 2esempio 2(3)(3)

Rappresentazione grafica della distribuzione di probabilità della v.c.

X = numero di palline rosse estratte X = numero di palline rosse estratte

0

0,1

0,2

0,3

0,4

0,5

0,6

0 1 2 3

numero di palline rosse estratte

prob

abili

16

proprietproprietàà

1. la distribuzione ipergeometricadistribuzione ipergeometrica è una distribuzione discreta;

( ) npNNn

== 1μ

2. la mediala media della distribuzione è data da

( )( )

( )( )11

212

−−

=−−

=N

nNnpqN

nNNN

NNnσ

3. la varianzala varianza della distribuzione è data da

17

distribuzione normaledistribuzione normale

Si tratta della più importante distribuzione di variabili continue, in quanto:

1.1. si può assumere come comportamento di molti fenomeni casuali, tra cui gli errori accidentali;

2.2. è la forma limite di molte altre distri-buzioni di probabilità;

3.3. trasformando opportunamente delle v.c.non normali, si possono ottenere nuove variabili distribuite normalmente;

4.4. sotto determinate condizioni, delle somme di v.c. possono essere approssimate da una distribuzione normale (teorema del limite centrale).

18

distribuzione normaledistribuzione normale

Una v.c. con media μ e varianza σ2

(parametri della distribuzione) ha una distribuzione normale se la sua densità èdata da

( )2

21

21 ⎟

⎠⎞

⎜⎝⎛ −

−= σ

μ

πσ

x

exf

dove:

π costante = 3,146...

σ deviazione standard

( )2μ−x scarto dalla media elevato al quadrato

e base di logaritmi naturali = 2,183...

19

Rappresentazione grafica della distribuzione normale con media μ = 3 e varianza σ2 = 4

distribuzione normaledistribuzione normale

20

proprietproprietàà

1. la distribuzione normaledistribuzione normale è una distribuzione continua, con valori compresi tra -∞ e +∞;2. la curva da essa descritta è simmetrica rispetto alla media (punto di ordinata massima): ( )μf3. per valori di X che vanno a -∞ oppure a +∞ la curva tende a zero senza mai toccare l’asse delle ascisse (la probabilità di ottenere valori “molto” lontani dalla media è “molto bassa”);

5. presenta due punti di flesso in corrispon-denza a μ -σ e μ+σ, punti in cui la curva da convessa diventa concava.

4. è crescente per valori di X che vanno da -∞ a μ, decrescente per i valori da μ a +∞

21

ruolo dei parametri μ e σ(1/2)

• μ è la media della normale (la punta della campana) è un indicatore di posizione. Il suo variare “sposta” la campana sulla retta dei valori

• σ2 è la varianza è un indicatore di dispersione, è legata all’”apertura” della campana (valori più alti indicano distribuzioni più disperse).

22

ruolo dei parametri μ e σ(2/2)

Variazioni di μ

Variazioni di σ

μ=0, σ2=1

μ=0, σ2=9

μ=2, σ2=1

μ=2, σ2=9-10 -8 -6 -4 -2 0 2 4 6 8 100

0.05

0.1

0.15

0.2

-10 -8 -6 -4 -2 0 2 4 6 8 100

0.1

0.2

0.3

0.4

-10 -8 -6 -4 -2 0 2 4 6 8 100

0.1

0.2

0.3

0.4

-10 -8 -6 -4 -2 0 2 4 6 8 100

0.05

0.1

0.15

0.2

23

distribuzione normale distribuzione normale standardizzatastandardizzata

Si tratta di una distribuzione semplificata, e che consente di tabulare i valori di probabi-lità in apposite tavole;

si ottiene mediante una trasformazione dei dati con la formula

( )σ

μ−=

Xz

di conseguenza la funzione di densitàdiventa:

( )2

21

21 z

exf−

con μ = 0 e σ = 1.

24

proprietproprietàà

1. la distribuzione normale standardizdistribuzione normale standardiz--zatazata è una distribuzione continua, con valori compresi tra -∞ e +∞, con media zero e deviazione standard 1;

2. la curva da essa descritta è perfettamente simmetrica rispetto al punto di ordinata massima: 3. per valori di X che vanno a -∞ oppure a +∞ la curva tende a zero senza mai toccare l’asse delle ascisse;

5. presenta due punti di flesso in corrispon-denza a -1 e +1, punti in cui la curva da convessa diventa concava.

4. è crescente per valori di X che vanno da -∞ a 0, decrescente per i valori da 0 a +∞

25

tavole della normaletavole della normale

I valori delle aree della distribuzione normale standardizzata sono tabulati in apposite tavole;

tali tavole vengono utilizzate per due scopi:

a) per calcolare l’area compresa tra due determinati valori della variabile studiata;

b) per determinare la proporzione di punteggi compresi tra due valori di una variabile casuale (distribuita normalmente)

26

la tavola della normalela tavola della normale

27

esempio 3esempio 3Supponiamo di voler calcolare l’area compre-sa tra le ordinate z = 0z = 0 e z = 1,96z = 1,96.

28

la tavola della normalela tavola della normale

L’area compresa tra z = 0 e z = 1,96è 0,475

29

esempio 4esempio 4Supponiamo di voler calcolare l’area compre-sa tra le ordinate z = z = --11 e z = +1z = +1

30

esempio 4esempio 4(2)(2)Dalla lettura della tavola rileviamo che l’area compresa tra z = 0z = 0 e z = +1z = +1 è pari a 0,3413;

dal momento che la curva è simmetrica e centrata sullo zero, l’area compresa tra z = z = --11e z = 0 z = 0 sarà identica e pari anch’essa a 0,3413;

per ottenere l’area cercata sarà sufficiente sommare le due aree:

0,3413 + 0,3413 = 0,6826

0,6826

31

esempio 5esempio 5Data una serie di 500 punteggi distribuiti normalmente con media 100 e deviazione standard 15, si stimi quanti possano essere i punteggi compresi tra 88 e 130.

• calcoliamo i punti zeta corrispondenti a 88 e 130, che saranno:

( ) 8,015

1008888 −=−

=z

( ) 215

100130130 +=−

=z

32

esempio 5esempio 5(2)(2)

• dalla lettura delle tavole ricaviamo che l’area compresa tra z = z = --0,80,8 e z = 0z = 0 è pari a 0,2881;

• l’area compresa tra z = 0z = 0 e z = +2z = +2 è 0,4772;

• l’area complessiva tra z = z = --0,80,8 e z = +2z = +2 sarà0,2881 + 0,4772 = 0,7653;

• tale valore 0,7653 può essere letto sia come proporzione dei casi compresi tra i valori 88 e 130, sia come la probabilità che il punteggio di un soggetto cada all’interno di tale intervallo;

• in conclusione, per ottenere il numero di punteggi che ci si attende nell’intervallo com-preso tra 88 e 130 si calcola:

38365,3825007653,0 ≅=×

33

distribuzione chidistribuzione chi--quadratoquadrato

Si tratta di una distribuzione continua con densità data dalla relazione:

( ) ( ) ( ) ⎟⎟⎠

⎞⎜⎜⎝

⎛−

⎟⎠⎞

⎜⎝⎛

= 2222

21 χν

ν χχ eCf

dove:

( )νC costante tale da assicurare che l’area delimitata sotto la curva sia pari a 1

ν gradi di libertà della distribuzione

34

distribuzione chidistribuzione chi--quadratoquadrato

Quando νν = 1= 1 il grafico della curva è

35

distribuzione chidistribuzione chi--quadratoquadrato

Quando νν = 2= 2 il grafico della curva è

36

distribuzione chidistribuzione chi--quadratoquadrato

Quando νν = 3 = 3 il grafico della curva è

37

proprietproprietàà

1.1. la distribuzione distribuzione χχ2 2 è una distribuzione continua, con valori compresi tra 0 e +∞;

2.2. al crescere dei gradi di libertà la curva tende ad assumere la forma della normale;

3.3. dato che la v.c. χ2 è generata da una somma dei quadrati di n valori indipen-denti di una v.c. normale standardizzata, quando tali valori non sono indipendenti ènecessario stabilire le condizioni che li vincolano; sottraendo ad n tali vincoli, si ottiene il numero di gradi di libertà, cioèil numero di valori, tra loro indipendenti, della v.c. normale standardizzata.

38

distribuzione t di Studentdistribuzione t di Student

Si tratta di una distribuzione continua con densità data dalla relazione:

( )⎟⎠⎞

⎜⎝⎛ +

⎟⎟⎠

⎞⎜⎜⎝

⎛+=

21

2

1

ν

νtCtf

dove:

C costante tale da assicurare che l’area delimitata sotto la curva sia pari a 1

ν gradi di libertà della distribuzione

39

distribuzione t di Studentdistribuzione t di Student

Quando νν = 1= 1 il grafico della curva è

40

distribuzione t di Studentdistribuzione t di Student

Quando νν = 10 = 10 il grafico della curva è

41

proprietproprietàà

1.1. la distribuzione tdistribuzione t è una distribuzione continua, con valori compresi tra -∞ e +∞;

2.2. si rivela particolarmente utile nello studio di fenomeni casuali relativi a campioni piccoli (n < 30);

3.3. il valore dei gradi di libertà è dato da νν = n = n -- 11

4.4. con νν →→ ∞∞ la distribuzione tende alla distribuzione normale

42

distribuzione F di distribuzione F di SnedecorSnedecor

Si tratta di una distribuzione continua con densità data dalla relazione:

( ) ( )2

2

1

2

,21

11

21

1

νν

ν

νν

νν

+

⎟⎠⎞

⎜⎝⎛

⎟⎟⎠

⎞⎜⎜⎝

⎛+

=

F

FCFf

dove:

( )21 ,ννC costante tale da assicurare che l’area delimitata sotto la curva sia pari a 1

21,νν gradi di libertà della distribuzione

43

distribuzione F di distribuzione F di SnedecorSnedecor

Quando νν11 = 2 = 2 e νν22 = 4= 4 il grafico della curva è

44

distribuzione F di distribuzione F di SnedecorSnedecor

Quando νν11 = 4 = 4 e νν22 = 4= 4 il grafico della curva è

45

distribuzione F di distribuzione F di SnedecorSnedecor

Quando νν11 = 12 = 12 e νν22 = 12= 12 il grafico della curva è

46

proprietproprietàà

1.1. la distribuzione Fdistribuzione F è una distribuzione continua, con valori compresi tra 0 e +∞;

2.2. si dimostra che il rapporto tra due varianze campionarie si distribuisce con questa forma;

3.3. con νν11 = 1 = 1 e νν2 2 →→ ∞∞ la distribuzionetende alla normale standardizzata

4.4. con νν11 = 1 = 1 e νν2 2 = = νν la distribuzione èuguale alla distribuzione t di Student

5.5. con νν11 = = νν e νν2 2 →→ ∞∞ la distribuzionetende a quella del χ2