Upload
leonora-martino
View
222
Download
0
Embed Size (px)
Citation preview
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali1
Introduzione alla Introduzione alla probabilitàprobabilità
Giovanni Filatrella (Giovanni Filatrella ([email protected]@unisannio.it))
Elaborazione Statistica dei Dati Elaborazione Statistica dei Dati SperimentaliSperimentali Facoltà di Scienze MM FF e NN,
Università Sannio
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali2
Saper calcolare bene una probabilità può tornare utile
Abbiamo novanta probabilità su cento.
Napoleone, Waterloo, 1815
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali3
Legame fra probabilità e statistica
L’obiettivo: costruire una tecnica che permetta di “prevedere” i risultati di esperimenti quando questi
danno risultati che comunque non si ripetono sempre uguali.
Es.: se consideriamo l’esperimento “lanciare un dado e leggere la faccia superiore”, questo è un evento casuale. E’ possibile prevedere cosa ragionevolmente succede?
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali4
Introduzione storica alla formulazione di probabilità
(1)Origine della teoria della probabilità: come dividere
equamente la posta se il gioco viene interrotto prima della fine.
Ex.: Fra Luca Paccioli's “summa de Arithmetica, Geometria, Proportioni et Proportionalità”, 1494:
“una squadra gioca in un torneo nel quale sono necessari 60 punti per vincere. Ogni risultato positivo si ottengono 10 punti. La posta è 10 ducati. Il gioco si interrompe quando una squadra ha 50 punti, l’altra 20. Come dividere il premio di 10 ducati?”
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali5
Una soluzione che (oggi) riteniamo corretta
La prima sistematica formulazione del problema viene riportata nella corrispondenza fra Pascal (1623-1662) e Fermat (1601- 1665). In una lettera di Mercoledì 29Luglio 1654, Pascal scrive a Fermat:
“This is your procedure when there are two players: If two players, playing several games, find themselves in that position when the first man needs two games and second needs three, then to find the fair division of stakes, you say that one must know in how many games the play will be absolutely decided.”
(in Florence David: Games, Gods and Gambling)
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali6
Definizioni di probabilità (1)
• Approccio “classico” (Laplace):“Il rapporto fra il numero di casi favorevoli ed il numero di casi possibili, supposti equiprobabili”
Questo approccio suppone che sia possibile decidere che due eventi sono equiprobabili, e quindi contiene un ragionamento circolare
Approccio “frequentistico” (MonteCarlo)“La probabilità di un evento, ritenuto ripetibile, è
uguale al numero di eventi favorevoli che i sono verificati diviso il numero totale di eventi”
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali7
Come si calcola una probabilità
Es.: una moneta ha due facce. Se :1) costruisco il dado in modo che sia completamente
simmetrico;2) il lancio non favorisce nessuna delle due facce.Allora è ragionevole che i due eventi T(esta) e C(roce)
siamo equiprobabili. La probabilità dell’evento T è:
2
1
possibili casi di#
T a favorevoli casi di# P(T)
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali8
Metodo di calcolo
In base alla definizione “classica” il calcolo di una probabilità dipende dalla nostra capacità di valutare gli eventi elementari equiprobabili e poi di contarli.
Es.: qual è la probabilità che lanciando due dadi a sei facce si ottenga 4?
Sono possibili (almeno) due schemi logici:
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali9
I ragionamento possibile
I possibili esiti dell’esperimento sono un qualsiasi numero fra 2 e 12, quindi sono 11 casi possibili. La probabilità di ottenere 4 risulta dunque:
091.011
1
possibili casi di#
4 a favorevoli casi di# P(4)
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali10
II ragionamento possibile
I possibili esiti dell’esperimento sono 36, infatti: +
1
23456
1=22=33=44=55=66=7
1=32=43=54=65=76=8
.
.
.
.
.
.
E fra questi 36 occorre contare quanti danno
come esito “4”
D.: quanti sono?
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali11
Tecnica di base da conoscere per il calcolo delle probabilità
CONTAREe sapere cosa contare
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali12
Cosa significa questo numero?
Aver trovato il modo di calcolare una probabilità non significa avere un collegamento con gli esperimenti. Il legame è dato dalla legge empirica:
La frequenza osservata di un evento tende a coincidere con la probabilità.
Maggiore è il numero osservazioni, minore è la differenza aspettata fra frequenza e probabilità.
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali13
Sul significato di frequenza e probabilità
Probabilità Frequenza
Osservazioni
Osservazionia posteriori
Calcolia priori
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali14
Le osservazio
ni (frequenze)
sono diverse dalle
possibilità teoriche
(probabilità)
"Fair is fair, Larry. We're out of food, we drew straws-you lost:'
GaryLarson
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali15
Osservazione di (#T-#C)
1) Il numero di teste tende ad essere uguale a quello delle croci solo in termini relativi.
2) L’andamento non è uniforme, vi sono zone in cui aumentando gli esperimenti la differenza diminuisce.
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali16
Definizione alternativa
Es.: Il numero di nati in Campania nel 2001:
M: 34320F : 32355Totale: 66675se ne deduce che presumibilmente la
probabilità che in Campania nasca un maschio (M) o una femmina (F) sono:
485.0)( 515.066675
34320
possibili casi di#
M a favorevoli casi di# P(M) FP
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali17
Interpretazione della probabilità “frequentistica”
L’interpretazione del numero che esprime la probabilità non dipende dal metodo con cui è stata calcolata.
Anche nel caso della probabilità calcolato con il metodo frequentistico il legame con gli esperimenti è dato dall’aspettativa che che la frequenza osservata deve tendere alla probabilità.
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali18
L’approccio assiomatico: definizioni
• Spazio degli eventi : un insieme U i cui elementi sono tutti i possibili esiti degli esperimenti
• Eventi E: un qualsiasi sottoinsieme di U: U• Probabilità: una qualsiasi funzione P tale che:
– P(U) = 1– P(ø) = 0
– E1,E2: E1E2= ø => P(E1E2)=P(E1PE2)
• Eventi complementari: due eventi disgiunti la cui unione è lo spazio degli eventi:A, A tali che: A ø, A = U
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali19
Un importante definizione per il calcolo:
Base: un insieme di eventi tali che:
UB
BBN
ii
ji
1
,ø Gli eventi sono disgiunti
Gli eventi ricoprono tutti i possibili eventi
Se si conosce la probabilità degli eventi elementari della base si possono trovare le probabilità di eventi arbitrari.
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali20
Interpretazione graficaSe questo è lo spazio di tutti gli eventi, e se si conoscono le
probabilità di tutti gli eventi elementari (i ), allora per trovare la probabilità di un evento basta contare il numero di eventi
elementari che lo compongono.
UA
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali21
In formule
iii iABBPAP
BPABAPB
),()( :altrimenti
)(#)( :iliequiprobab sono i tuttise
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali22
Conseguenze dell’approccio:
Da questa definizione di probabilità è possibile dedurre dei teoremi del tipo:
• P(A-B)=P(A)-P(A B)
• Se AB => P(A)P(B)
Questi teoremi sono facilmente visualizzabili grazie alla teoria degli insiemi e ai diagrammi di Venn
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali23
Operazioni sugli insiemi utili per la teoria della probabilità
E’ possibile tradurre alcune operazioni sugli eventi in operazioni sugli insiemi che rappresentano la probabilità degli eventi stessi
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali24
Interpretazione con i diagrammi di Venn
BAPBPAPBAP BAPBPAPBAP
U
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali25
Teorema delle probabilità condizionate
Un evento A si dice condizionato da un altro B, nel senso che assumiamo che B si sia verificato. In simboli: A | B
Poiché si assume che B si sia verificato, si può anche dire che B è divenuto lo spazio degli eventi.
)(
)(
B a favorevoli casi di#
possibili casi di#
possibili casi di#
B eA ad favorevoli casi di#B a favorevoli casi di#
B eA ad favorevoli casi di# B)|P(A
BP
BAP
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali26
Probabilità condizionata con diagrammi di Venn
A B
)(
)( B)|P(A
BP
BAP
U
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali27
Una possibile confusione fra individui ed esiti dell’esperimento
Una possibile applicazione è chegli eventi “A” e “B” siano del tipo “Soffrire di una malattia X” e “Essere fumatori”. In questo caso l’insieme dei possibili risultati è composto da 4 casi:
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali28
I possibili esiti risulterebbero:
1. Non si soffre della malattia X e non si è fumatori (area bianca);
2. Si soffre della malattia X e non si è fumatori (area gialla);
3. Non si soffre della malattia X e si è fumatori(area verde);
4. Si soffre della malattia X e si è fumatori (area tratteggiata rossa).
Però gli esiti non sono equiprobabili!
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali29
Per calcolare le probabilità usare invece:
Un individuo soffre (/non soffre) della malattia X ed è (/non è) fumatore.
La determinazione su ogni individuo dell’essere affetto dalla malattia X e di fuamre è un possibile esito dell’esperiemento.
In questo caso vi è il pericolo di confondere gli esiti con gli individui – fare attenzione alla distinzione concettuale!
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali30
Eventi indipendenti e regola del prodotto
Chiamiamo eventi indipendenti A, B se P(A|B) = P(A).Per eventi indipendenti, la probabilità che si
verifichino entrambi è data dal prodotto delle probabilità dei singoli eventi:
)()()()(
)()()|( BPAPBAP
BP
BAPAPBAP
Es. La probabilità di estrarre due carte d’oro (rimescolando) o di due numeri pari consecutivi sulla ruota di Napoli.