30
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Introduzione alla Introduzione alla probabilità probabilità Giovanni Filatrella Giovanni Filatrella ( ( [email protected] [email protected] ) ) Elaborazione Statistica dei Dati Elaborazione Statistica dei Dati Sperimentali Sperimentali Facoltà di Scienze MM FF e NN, Università Sannio

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Introduzione alla probabilità Giovanni Filatrella ( [email protected] ) Elaborazione

Embed Size (px)

Citation preview

Page 1: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Introduzione alla probabilità Giovanni Filatrella ( filatrella@unisannio.it ) Elaborazione

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali1

Introduzione alla Introduzione alla probabilitàprobabilità

Giovanni Filatrella (Giovanni Filatrella ([email protected]@unisannio.it))

Elaborazione Statistica dei Dati Elaborazione Statistica dei Dati SperimentaliSperimentali Facoltà di Scienze MM FF e NN,

Università Sannio

Page 2: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Introduzione alla probabilità Giovanni Filatrella ( filatrella@unisannio.it ) Elaborazione

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali2

Saper calcolare bene una probabilità può tornare utile

Abbiamo novanta probabilità su cento.

Napoleone, Waterloo, 1815

Page 3: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Introduzione alla probabilità Giovanni Filatrella ( filatrella@unisannio.it ) Elaborazione

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali3

Legame fra probabilità e statistica

L’obiettivo: costruire una tecnica che permetta di “prevedere” i risultati di esperimenti quando questi

danno risultati che comunque non si ripetono sempre uguali.

Es.: se consideriamo l’esperimento “lanciare un dado e leggere la faccia superiore”, questo è un evento casuale. E’ possibile prevedere cosa ragionevolmente succede?

Page 4: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Introduzione alla probabilità Giovanni Filatrella ( filatrella@unisannio.it ) Elaborazione

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali4

Introduzione storica alla formulazione di probabilità

(1)Origine della teoria della probabilità: come dividere

equamente la posta se il gioco viene interrotto prima della fine.

Ex.: Fra Luca Paccioli's “summa de Arithmetica, Geometria, Proportioni et Proportionalità”, 1494:

“una squadra gioca in un torneo nel quale sono necessari 60 punti per vincere. Ogni risultato positivo si ottengono 10 punti. La posta è 10 ducati. Il gioco si interrompe quando una squadra ha 50 punti, l’altra 20. Come dividere il premio di 10 ducati?”

Page 5: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Introduzione alla probabilità Giovanni Filatrella ( filatrella@unisannio.it ) Elaborazione

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali5

Una soluzione che (oggi) riteniamo corretta

La prima sistematica formulazione del problema viene riportata nella corrispondenza fra Pascal (1623-1662) e Fermat (1601- 1665). In una lettera di Mercoledì 29Luglio 1654, Pascal scrive a Fermat:

“This is your procedure when there are two players: If two players, playing several games, find themselves in that position when the first man needs two games and second needs three, then to find the fair division of stakes, you say that one must know in how many games the play will be absolutely decided.”

(in Florence David: Games, Gods and Gambling)

Page 6: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Introduzione alla probabilità Giovanni Filatrella ( filatrella@unisannio.it ) Elaborazione

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali6

Definizioni di probabilità (1)

• Approccio “classico” (Laplace):“Il rapporto fra il numero di casi favorevoli ed il numero di casi possibili, supposti equiprobabili”

Questo approccio suppone che sia possibile decidere che due eventi sono equiprobabili, e quindi contiene un ragionamento circolare

Approccio “frequentistico” (MonteCarlo)“La probabilità di un evento, ritenuto ripetibile, è

uguale al numero di eventi favorevoli che i sono verificati diviso il numero totale di eventi”

Page 7: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Introduzione alla probabilità Giovanni Filatrella ( filatrella@unisannio.it ) Elaborazione

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali7

Come si calcola una probabilità

Es.: una moneta ha due facce. Se :1) costruisco il dado in modo che sia completamente

simmetrico;2) il lancio non favorisce nessuna delle due facce.Allora è ragionevole che i due eventi T(esta) e C(roce)

siamo equiprobabili. La probabilità dell’evento T è:

2

1

possibili casi di#

T a favorevoli casi di# P(T)

Page 8: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Introduzione alla probabilità Giovanni Filatrella ( filatrella@unisannio.it ) Elaborazione

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali8

Metodo di calcolo

In base alla definizione “classica” il calcolo di una probabilità dipende dalla nostra capacità di valutare gli eventi elementari equiprobabili e poi di contarli.

Es.: qual è la probabilità che lanciando due dadi a sei facce si ottenga 4?

Sono possibili (almeno) due schemi logici:

Page 9: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Introduzione alla probabilità Giovanni Filatrella ( filatrella@unisannio.it ) Elaborazione

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali9

I ragionamento possibile

I possibili esiti dell’esperimento sono un qualsiasi numero fra 2 e 12, quindi sono 11 casi possibili. La probabilità di ottenere 4 risulta dunque:

091.011

1

possibili casi di#

4 a favorevoli casi di# P(4)

Page 10: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Introduzione alla probabilità Giovanni Filatrella ( filatrella@unisannio.it ) Elaborazione

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali10

II ragionamento possibile

I possibili esiti dell’esperimento sono 36, infatti: +

1

23456

1=22=33=44=55=66=7

1=32=43=54=65=76=8

.

.

.

.

.

.

E fra questi 36 occorre contare quanti danno

come esito “4”

D.: quanti sono?

Page 11: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Introduzione alla probabilità Giovanni Filatrella ( filatrella@unisannio.it ) Elaborazione

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali11

Tecnica di base da conoscere per il calcolo delle probabilità

CONTAREe sapere cosa contare

Page 12: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Introduzione alla probabilità Giovanni Filatrella ( filatrella@unisannio.it ) Elaborazione

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali12

Cosa significa questo numero?

Aver trovato il modo di calcolare una probabilità non significa avere un collegamento con gli esperimenti. Il legame è dato dalla legge empirica:

La frequenza osservata di un evento tende a coincidere con la probabilità.

Maggiore è il numero osservazioni, minore è la differenza aspettata fra frequenza e probabilità.

Page 13: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Introduzione alla probabilità Giovanni Filatrella ( filatrella@unisannio.it ) Elaborazione

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali13

Sul significato di frequenza e probabilità

Probabilità Frequenza

Osservazioni

Osservazionia posteriori

Calcolia priori

Page 14: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Introduzione alla probabilità Giovanni Filatrella ( filatrella@unisannio.it ) Elaborazione

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali14

Le osservazio

ni (frequenze)

sono diverse dalle

possibilità teoriche

(probabilità)

"Fair is fair, Larry. We're out of food, we drew straws-you lost:'

GaryLarson

Page 15: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Introduzione alla probabilità Giovanni Filatrella ( filatrella@unisannio.it ) Elaborazione

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali15

Osservazione di (#T-#C)

1) Il numero di teste tende ad essere uguale a quello delle croci solo in termini relativi.

2) L’andamento non è uniforme, vi sono zone in cui aumentando gli esperimenti la differenza diminuisce.

Page 16: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Introduzione alla probabilità Giovanni Filatrella ( filatrella@unisannio.it ) Elaborazione

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali16

Definizione alternativa

Es.: Il numero di nati in Campania nel 2001:

M: 34320F : 32355Totale: 66675se ne deduce che presumibilmente la

probabilità che in Campania nasca un maschio (M) o una femmina (F) sono:

485.0)( 515.066675

34320

possibili casi di#

M a favorevoli casi di# P(M) FP

Page 17: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Introduzione alla probabilità Giovanni Filatrella ( filatrella@unisannio.it ) Elaborazione

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali17

Interpretazione della probabilità “frequentistica”

L’interpretazione del numero che esprime la probabilità non dipende dal metodo con cui è stata calcolata.

Anche nel caso della probabilità calcolato con il metodo frequentistico il legame con gli esperimenti è dato dall’aspettativa che che la frequenza osservata deve tendere alla probabilità.

Page 18: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Introduzione alla probabilità Giovanni Filatrella ( filatrella@unisannio.it ) Elaborazione

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali18

L’approccio assiomatico: definizioni

• Spazio degli eventi : un insieme U i cui elementi sono tutti i possibili esiti degli esperimenti

• Eventi E: un qualsiasi sottoinsieme di U: U• Probabilità: una qualsiasi funzione P tale che:

– P(U) = 1– P(ø) = 0

– E1,E2: E1E2= ø => P(E1E2)=P(E1PE2)

• Eventi complementari: due eventi disgiunti la cui unione è lo spazio degli eventi:A, A tali che: A ø, A = U

Page 19: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Introduzione alla probabilità Giovanni Filatrella ( filatrella@unisannio.it ) Elaborazione

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali19

Un importante definizione per il calcolo:

Base: un insieme di eventi tali che:

UB

BBN

ii

ji

1

,ø Gli eventi sono disgiunti

Gli eventi ricoprono tutti i possibili eventi

Se si conosce la probabilità degli eventi elementari della base si possono trovare le probabilità di eventi arbitrari.

Page 20: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Introduzione alla probabilità Giovanni Filatrella ( filatrella@unisannio.it ) Elaborazione

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali20

Interpretazione graficaSe questo è lo spazio di tutti gli eventi, e se si conoscono le

probabilità di tutti gli eventi elementari (i ), allora per trovare la probabilità di un evento basta contare il numero di eventi

elementari che lo compongono.

UA

Page 21: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Introduzione alla probabilità Giovanni Filatrella ( filatrella@unisannio.it ) Elaborazione

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali21

In formule

iii iABBPAP

BPABAPB

),()( :altrimenti

)(#)( :iliequiprobab sono i tuttise

Page 22: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Introduzione alla probabilità Giovanni Filatrella ( filatrella@unisannio.it ) Elaborazione

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali22

Conseguenze dell’approccio:

Da questa definizione di probabilità è possibile dedurre dei teoremi del tipo:

• P(A-B)=P(A)-P(A B)

• Se AB => P(A)P(B)

Questi teoremi sono facilmente visualizzabili grazie alla teoria degli insiemi e ai diagrammi di Venn

Page 23: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Introduzione alla probabilità Giovanni Filatrella ( filatrella@unisannio.it ) Elaborazione

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali23

Operazioni sugli insiemi utili per la teoria della probabilità

E’ possibile tradurre alcune operazioni sugli eventi in operazioni sugli insiemi che rappresentano la probabilità degli eventi stessi

Page 24: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Introduzione alla probabilità Giovanni Filatrella ( filatrella@unisannio.it ) Elaborazione

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali24

Interpretazione con i diagrammi di Venn

BAPBPAPBAP BAPBPAPBAP

U

Page 25: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Introduzione alla probabilità Giovanni Filatrella ( filatrella@unisannio.it ) Elaborazione

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali25

Teorema delle probabilità condizionate

Un evento A si dice condizionato da un altro B, nel senso che assumiamo che B si sia verificato. In simboli: A | B

Poiché si assume che B si sia verificato, si può anche dire che B è divenuto lo spazio degli eventi.

)(

)(

B a favorevoli casi di#

possibili casi di#

possibili casi di#

B eA ad favorevoli casi di#B a favorevoli casi di#

B eA ad favorevoli casi di# B)|P(A

BP

BAP

Page 26: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Introduzione alla probabilità Giovanni Filatrella ( filatrella@unisannio.it ) Elaborazione

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali26

Probabilità condizionata con diagrammi di Venn

A B

)(

)( B)|P(A

BP

BAP

U

Page 27: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Introduzione alla probabilità Giovanni Filatrella ( filatrella@unisannio.it ) Elaborazione

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali27

Una possibile confusione fra individui ed esiti dell’esperimento

Una possibile applicazione è chegli eventi “A” e “B” siano del tipo “Soffrire di una malattia X” e “Essere fumatori”. In questo caso l’insieme dei possibili risultati è composto da 4 casi:

Page 28: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Introduzione alla probabilità Giovanni Filatrella ( filatrella@unisannio.it ) Elaborazione

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali28

I possibili esiti risulterebbero:

1. Non si soffre della malattia X e non si è fumatori (area bianca);

2. Si soffre della malattia X e non si è fumatori (area gialla);

3. Non si soffre della malattia X e si è fumatori(area verde);

4. Si soffre della malattia X e si è fumatori (area tratteggiata rossa).

Però gli esiti non sono equiprobabili!

Page 29: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Introduzione alla probabilità Giovanni Filatrella ( filatrella@unisannio.it ) Elaborazione

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali29

Per calcolare le probabilità usare invece:

Un individuo soffre (/non soffre) della malattia X ed è (/non è) fumatore.

La determinazione su ogni individuo dell’essere affetto dalla malattia X e di fuamre è un possibile esito dell’esperiemento.

In questo caso vi è il pericolo di confondere gli esiti con gli individui – fare attenzione alla distinzione concettuale!

Page 30: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Introduzione alla probabilità Giovanni Filatrella ( filatrella@unisannio.it ) Elaborazione

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali30

Eventi indipendenti e regola del prodotto

Chiamiamo eventi indipendenti A, B se P(A|B) = P(A).Per eventi indipendenti, la probabilità che si

verifichino entrambi è data dal prodotto delle probabilità dei singoli eventi:

)()()()(

)()()|( BPAPBAP

BP

BAPAPBAP

Es. La probabilità di estrarre due carte d’oro (rimescolando) o di due numeri pari consecutivi sulla ruota di Napoli.