Upload
tessy-psibar
View
238
Download
0
Embed Size (px)
Probabilità: teoremi e distribuzioni
La teoria della probabilità è applicabile a tutti quelle situazioni in cui l’esito/evento di una prova/esperimento aleatorio non è certo o determinabile con sicurezza in anticipo, ma si verifica con una certa probabilità.
Non si è sicuri dell’esito dell’esperimento
L’evento può verificarsi con una certa probabilità
Incertezza su quale evento si verificherà
Esempio LOTTERIA
Evento, Prova e Probabilità
• EVENTO: È uno dei possibili risultati di una PROVA
• PROVA: Ogni esperimento soggetto ad incertezza che genera risultati e produce conoscenza. Consiste nella descrizione di una serie di azioni da compiere o di fatti da osservare
• PROBABILITA’: è un numero associato al verificarsi di un evento
L’insieme di tutti i possibili eventi costituisce lo SPAZIO CAMPIONARIO.
EVENTI SEMPLICI EVENTI COMPLESSI
Singoli risultati di un
esperimento/evento casuale
Insieme di due o più eventi
semplici
Probabilità che da un mazzo di carte esca
l’asso di fiori
Probabilità che da un mazzo di carte esca una carta di cuori
Probabilità come un indice di quanto è avverabile un certo evento
• Probabilità di successo = il verificarsi di un evento favorevole; P(A)
• Probabilità di insuccesso = il verificarsi di un evento non favorevole; P(nonA)
L’evento A è uno dei possibili risultati di un evento
Faccia 5 di un dado
Se si verifica un evento diverso da quello da noi scelto parliamo di EVENTO CONTRARIO o nonA
Faccia 6 dello stesso dado
P(A)
P(nonA)
P(A) P(nonA)
Il loro insieme costituisce tutti i possibili esiti della prova
1 La somma delle probabilità di
tutti gli eventi possibili è 1
PROBABILITA’
DELL’EVENTO CERTO
ASSIOMI FONDAMENTALI
• LA PROBABILITA’ CHE UN EVENTO CASUALE SI VERIFICHI E’ SEMPRE COMPRESA TRA 0 E 1
• P(A) + P(nonA) = 1: ciò significa che i due eventi sono COMPLEMENTARI ed esauriscono l’intero spazio campionario
EVENTI INDIPENDENTI vs DIPENDENTI
• Due eventi A e B si dicono indipendenti se il verificarsi dell’uno non influenza il verificarsi dell’altro
• Due eventi A e B si dicono mutualmente escludentisi se il verificarsi dell’uno non consente il verificarsi dell’altro
EVENTI MUTUALMENTE ESCLUDENTISI
Definizioni del concetto di probabilità
Ipotesi frequentista
Ipotesi classica
Ipotesi soggettiva
IPOTESI CLASSICA
- Dato un esperimento ben specificato - Dato un evento E, - detto m il numero dei possibili risultati che danno
luogo all’evento E - Detto n il numero di tutti i possibili risultati
dell’esperimento, purchè tutti gli n risultati siano ugualmente possibili
LA PROBABILITA’ DELL’EVENTO E E’ DATA DAL
RAPPORTO TRA m/n
LANCIO MONETA
Uscita della TESTA
TESTA o CROCE
TESTA o CROCE
IPOTESI CLASSICA
• La probabilità che si verifichi un evento è data dal rapporto tra i casi favorevoli e quelli ugualmente possibili
La probabilità di ottenere il numero 5 dal lancio di un dado è
1 (caso/evento favorevole) 6 (casi/eventi possibili)
Per definire la probabilità è necessario presupporre che gli esiti siano tutti
UGUALMENTE POSSIBILI!!!!!!!
IPOTESI FREQUENTISTA
La probabilità che si verifichi un certo evento è uguale alla frequenza relativa con cui l’evento si verifica in un numero di prove sufficientemente grande, ripetute nelle medesime condizioni.
Probabilità del
verificarsi
dell’evento A
Numero di
prove molto
grande
prove
Frequenza con
cui si verifica
l’evento A nelle
n prove
CARATTERISTICA PRINCIPALE
• Permette di conoscere la probabilità di un evento solo dopo aver effettuato un numero di prove (A Posteriori)
GLI EVENTI DEVONO ESSERE RIPETIBILI, cioè ripetuti nelle stesse condizioni
• Un evento favorevole può essere definito da più eventi distinti A e B all’interno dello spazio campionario.
• Il verificarsi di quello evento presuppone il verificarsi di ognuno dei singoli eventi (A o B)
EVENTI DISGIUNTI
SIGNIFICA ANDARE A SOMMARE LA PROBABILITA’
CHE OGNUNO DEI SINGOLI EVENTI DISGIUNTI SI
VERIFICHINO
PRINCIPIO DELLA SOMMA o principio delle probabilità totali
• La probabilità che si verifichino due eventi mutualmente escludentisi è data dalla SOMMA delle probabilità del verificarsi dei singoli eventi
Prova: lanciare due volte una moneta
Evento : ottenere TESTA al primo lancio
Testa - Testa
Testa - Croce
1/4 1/4
P(A o B) = ¼ + ¼ = ½
A B
Croce - Testa
Croce - Croce
prova: lanciare due volte una moneta
Evento : ottenere almeno una CROCE nei due lanci
Testa - Testa
Testa - Croce
A
B
C
D
1/4
1/4
1/4
1/4
P(A o B o C o D)
= ¼ + ¼ + ¼ =
¾
…e quando i due eventi sono NON mutualmente escludentisi?
• Quando due eventi Indipendente si verificano congiuntamente ed il verificarsi dell’uno NON MODIFICA la probabilità del verificarsi dell’altro
REGOLA DEL PRODOTTO PER EVENTI CONGIUNTI
PRINCIPIO DEL PRODOTTO o delle probabilità composte
• La probabilità del verificarsi degli eventi indipendenti A e B, ordinatamente in s prove, è data dal prodotto delle probabilità relative al verificarsi dei singoli eventi considerati:
Numero 4 sul dado rosso A 1/6
prova: lanciare due dadi: uno rosso ed uno nero
Numero 5 sul dado nero B 1/6
P(A e B) = 1/6 x
1/6 = 1/36
…e cosa accade quando gli eventi sono dipendenti?
• Gli eventi si definiscono DIPENDENTI quando il verificarsi dell’uno MODIFICA la probabilità del verificarsi dell’altro evento
SI RIDUCE LO SPAZIO CAMPIONARIO
È una situazione tipica delle estrazioni senza reinserimento
Cosa accade quando gli eventi sono dipendenti?
• La probabilità del verificarsi di una certa successione di eventi semplici dipendenti E1, E2, En, … è data dal prodotto della probabilità del verificarsi di E1, per la probabilità di E2 subordinata al verificarsi di E1 e così via
prova: gioco del poker con mazzo di 32 carte
Evento: fare poker d’assi in una mano di cinque carte
Asso di quadri
Asso di fiori
Asso di picche Asso di cuori E4 E1
E2
E3
1/29 1/32
1/31
1/30
Una delle restanti carte
E5 28/28
Esempi
• Eventi: somma delle facce di due dadi è 2 Eventi indipendenti
Faccia 1 sul dado 1 E1
E2
1/6
Faccia 1 sul dado 2 1/6
APPLICAZIONE DEL PRINCIPIO DEL PRODOTTO
• Eventi: somma delle facce di due dadi è 3
Eventi mutualmente escludentisi
Faccia 1 sul dado 1 E1
Faccia 2 sul dado1
E2
1/6
Faccia 2 sul dado 2 1/6
E3 1/6
Faccia 1 sul dado2 E4 1/6
APPLICAZIONE DEL PRINCIPIO DEL PRODOTTO E DELLA SOMMA
Cenni dell’Analisi combinatoria
• Si dicono COMBINAZIONI di n oggetti a r a r tutte le possibili r-ple che si costruiscono con gli n oggetti senza tener conto dell’ordine degli oggetti.
• Le r-ple differiscono tra loro per almeno un elemento
COMBINAZIONI
Immaginiamo di avere 4 stimoli A, B, C e D Ampiezza r=2
Gruppi: AB AC AD BC BD CD
Numero degli stimoli
Ampiezza dei gruppi
n Fattoriale: Prodotto di tutti i
numeri interi della serie
naturale fino ad n
(n-r) Fattoriale: Prodotto di tutti
i numeri interi della serie
naturale fino ad n - r
n=4 n! = 4! = 4 x 3 x 2 x 1 = 24
Immaginiamo di avere 4 stimoli A, B, C e D Ampiezza r=2
Gruppi: AB AC AD BC BD CD
• Dato un insieme di n oggetti, si dice PERMUTAZIONE ogni serie ordinata/sottoinsieme degli n oggetti presi n a n.
PERMUTAZIONI
Immaginiamo di avere 4 stimoli A, B, C e D
CI DICE IN QUANTI MODI POSSIAMO DISPORRE
IN ORDINE n OGGETTI
Numero degli elementi
che dobbiamo
moltiplicare
• Si dicono DISPOSIZIONI di n oggetti a r a r tutte le possibili r-ple che si possono formare con gli n oggetti in modo tale che differiscano per l’ordine in cui sono gli oggetti
DISPOSIZIONI
Immaginiamo di avere 4 stimoli A, B, C, D e E Ampiezza r=2
Ogni disposizione è distinta dalle altre sia per gli elementi presenti sia per l’ordine degli elementi all’interno
Le distribuzioni di probabilità
E-mail: [email protected]
Ricevimento: Lunedì 11:00 – 12:00
Materiale didattico su: http://www.psicometria.unich.it
Che cosa è una VARIABILE CASUALE?
Qualsiasi caratteristica misurabile è denominata variabile. Se una variabile può assumere numerosi valori tali che qualsiasi risultato è determinato dal caso, essa è nota come variabile casuale
• Una VARIABILE CASUALE/UNIVARIATA è definita come una regola che associa ad ogni evento un unico numero reale
Variabile casuale discreta è quella che può assumere tutti i possibili
valori in un dato intervallo di numeri reali, in un insieme finito e
numerabile
Variabile casuale continua è quella che può assumere tutti i
possibili valori in un dato intervallo di numeri reali
• Ad ogni evento è possibile associare una probabilità la cui distribuzione è definita in base proprio a questo evento.
• Una distribuzione di probabilità è una funzione che sintetizza la relazione tra i valori di una variabile casuale e la probabilità che questi si presentino
Evento = x Distribuzione della probabilità dell’evento x = f(x)
Numero di prove eseguibili = n
DISTRIBUZIONE BINOMIALE
È la distribuzione di probabilità di una variabile casuale discreta tale che il valore della variabile casuale sia il “numero di successi in una serie di esperimenti identici ed indipendenti”
DALLA DISTRIBUZIONE BERNOULLIANA ALLA DISTRIBUZIONE BINOMIALE
ESPERIMENTO lancio di una moneta
EVENTO X numero di teste che deriva da un lancio
Un tale esperimento è denominato una “prova di Bernoulli” e la
variabile casuale che corrisponde al numero di successi è
denominata una variabile di Bernoulli.
• Se l'esperimento (o prova) è ripetuto più volte e le ripetizioni sono indipendenti tra loro, allora la distribuzione di probabilità della variabile casuale X in n prove indipendenti di Bernoulli è denominata “distribuzione binomiale”.
DISTRIBUZIONE BINOMIALE
Numero di prove
Combinazioni
possibili
Probabilità che si
verifichi l’evento
desiderato
Probabilità che l’evento desiderato non si verifichi
ESEMPIO Un’urna contiene 10 palline di cui 3 bianche. Si eseguono 4
successive estrazioni rimettendo ogni volta la pallina estratta
nell’urna.
Probabilità di estrarre 1 pallina
bianca
1/10
Probabilità di estrarre 3 palline
bianche
3/10
ESEMPIO Un soggetto è stato sottoposto ad un test di 20 item, in cui doveva
scegliere tra 2 risposte (una corretta ed una sbagliata). Alla risposta corretta viene assegnata un punteggio di 1 mentre a quella errata un punteggio di 0. Il soggetto potrà rispondere in maniera corretta alle 20 domande (punteggio di 20) oppure in modo errato (punteggio di 0). Vogliamo sapere qual è la probabilità che il soggetto ottenga un punteggio di 17.
Probabilità di dare una risposta corretta ½ = 0,5
Probabilità di dare una risposta errata ½ = 0,5
n =20
Evento X Punteggio di 17
PROPRIETA’ DELLA DISTRIBUZIONE BINOMIALE
Il valore medio è il risultato più
probabile.
Man mano che ci si allontana
dalla media il risultato diviene
meno probabile fino ad una
probabilità tendente allo zero
È simmetrica se la probabilità
di verificarsi dell’evento
favorevole è p=0,50
È asimmetrica positiva se
p<0,50
È asimmetrica negativa se
p>0,50
L’asimmetria diminuisce
all’aumentare di n per
qualunque valore di p≠0,50
PROPRIETA’ DELLA DISTRIBUZIONE BINOMIALE
• Le probabilità di più eventi favorevoli:
– Se in un test di 20 item dicotomici si vuole sapere la probabilità di ottenere un punteggio massimo di 8 si può applicare il principio della SOMMA
Tutti i
possibili valori
interi da 0 a 8
Per ogni punteggio da 0 a 8 calcoliamo le singole
probabilità e poi le sommiamo
La probabilità di avere un punteggio di 8 sarà dato dalla somma di tutte queste probabilità
0,252
…e quando le variabili sono continue…
• Le distribuzioni normali sono una famiglia di curve simmetriche a forma di campana e unimodali (moda ,media e mediana coincidono).
• Hanno tutte la stessa forma ma sono caratterizzate dai due valori: media e varianza N(μ,σ2).
DISTRIBUZIONE NORMALE O GAUSSIANA
• La curva Normale è Unimodale e simmetrica rispetto alla sua media (μ)
La curva è ASINTOTICA rispetto all’asse delle ascisse La funzione f(x) tende ad annullarsi senza mai raggiungere lo 0 se non ai
valori di ascissa -∞ e +∞
• La media, la mediana e la moda della distribuzione coincidono
• La Deviazione Standard, indica la quantità di dispersione delle osservazioni intorno alla media • I parametri μ e σ definiscono in modo completo la curva
Caratteristiche di una distribuzione Normale
• Se invece μ rimane costante e σ varia, tutte le infinite curve hanno lo stesso asse di simmetria; ma hanno forma più o meno appiattita, secondo il valore di σ.
• Se μ varia e σ rimane costante, si hanno infinite curve normali con la stessa forma e la stessa dimensione, ma con l'asse di simmetria in un punto diverso. Quando due distribuzioni hanno media differente, è possibile ottenere l'una dall'altra mediante traslazione o trasformazione lineare dei dati.
2 distribuzioni normali che differiscono sia per la media sia per la dispersione dei dati
Caratteristiche di una distribuzione Normale
Come per le distribuzioni discrete la somma di tutte le probabilità
è uguale a 1, anche per la distribuzione normale si applica questo
concetto
La funzione della distribuzione sarà:
Rappresenta l’area racchiusa dalla curva
Sono la media e la
varianza della
popolazione
La probabilità che un valore estratto a caso da una N(μ,σ2) sia compreso nell’intervallo (μ -σ , μ+σ) è pari a 0.683 e che sia compreso tra (μ -2σ , μ+2σ) è pari a 0,954 Il 95% dei valori centrali di una distribuzione Normale cadono nell’intervallo (μ - 1.96σ , μ+1.96σ) ed il 99% nell’intervallo (μ – 2.58σ , μ+2.58σ)
Non ci sono tavole di probabilità per tutti i possibili valori di μ e σ , esiste una tavola unica che può essere usata per tutte le variabili Normali.
Tale tavola si riferisce ad una particolare distribuzione: la distribuzione Normale Standardizzata.
La distribuzione normale standardizzata o normale ridotta, si ottiene mediante il cambiamento di variabile X in un punto z secondo la formula:
La standardizzazione è una trasformazione che consiste nel:
rendere la media nulla (μ = 0), poiché ad ogni valore viene sottratta la media; prendere la deviazione standard σ come unità di misura (σ = 1) della nuova variabile.
La distribuzione normale ridotta viene indicata con N(0,1), che indica appunto una distribuzione normale con media 0 e varianza uguale a 1. In ogni distribuzione Normale con media μ e σ, la probabilità tra x1 e x2 è la stessa che tra z1 e z2 nella distribuzione Normale Standardizzata, dove z1=(x1- μ)/ σ z2=(x2- μ)/ σ
Probabilità della curva normale
standardizzata e relative tavole
Le tavole di probabilità della distribuzione normale vengono utilizzate per due scopi:
1. Per calcolare l’area compresa tra due determinati valori della variabile oggetto di studio;
2. Per conoscere la quantità dei punteggi compresi tra due valori di una variabile casuale.
Probabilità della curva normale standardizzata e relative tavole
• Osservando la tavola si troveranno i punti z nella colonna di sinistra con una cifra decimale; la seconda cifra decimale è posta nella prima riga in alto della stessa tavola.
49
In termini pratici…
Supponiamo di voler conoscere l’area compresa tra le ordinate corrispondenti a z=0 e z=1,96.
50
• Osservando la colonna dei punti z, si deve scendere fino a trovare z=1,9 e, rimanendo nella stessa riga fino a trovarsi in quella indicata con 6.
• Il punteggio che
troverete in quel
punto indica la
porzione di area
compresa tra le
due ordinate:
52
Poiché l’area totale sotto la curva alla destra dell’ordinata corrispondente a z=0,00 è
0,5000, l’area alla destra dell’ordinata di z =1,96 sarà:
0,5000-0,4750= 0,0250.
• Supponiamo di voler conoscere la porzione di area sotto la curva tra le ordinate corrispondenti a z=-1,00 e z=+1,00.
Cercando nella tabella troverete che la porzione di area sotto la curva compresa z=0,00 e z=1,00 è 0,3413. Dalla porzione opposta della curva si troverà ovviamente lo stesso valore
• quindi la proporzione di area si otterrà sommando i due valori: 0.3413+0,3413=0,6826.
• Supponiamo ora di voler trovare l’area sotto la curva compresa tra z=0,50 e z=2,50.
56
• Poiché le tavole danno solo le aree a partire dal punto z=0,00, il calcolo richiede il seguente passaggio: – Calcolare l’area tra le ordinate corrispondenti a z=0,00 e
z=0,50
Calcolare l’area tra z=0,00 e z=2,50
Sottrarre la porzione di area che va da z=0,00 a z=0,50 a quella
che va da z=0,00 a z=2,50
,4938 - ,1915 = ,3023
Esercizio
Si consideri una popolazione con altezza distribuita in maniera Gaussiana con media (µ) =172,5 cm e deviazione standard (σ) = 6,25 cm. Qual è la probabilità di incontrare un individuo estratto da tale popolazione e di altezza superiore a cm 190?
X = 190
µ =172,5
σ = 6,25
Si consideri una popolazione con altezza distribuita in maniera Gaussiana con media (µ) =172,5 cm e deviazione standard (σ) = 6,25 cm.
Qual è la probabilità di incontrare un individuo estratto da tale popolazione con un’altezza compresa tra cm 165 e175?
X1 = 165
µ =172,5
σ = 6,25
X2 = 175
P(X1)=P( 0<X1<Z1)= 0,3849
P(X2)= P(0<X2<Z2)= 0,1554
0,3849 0,1554
…derivazioni della curva normale…
• Date n variabili casuali indipendenti x1, x2, …, xn, normalmente distribuite con μ = 0 e σ = 1, il χ2 è una variabile casuale data dalla somma dei loro quadrati.
• È un metodo di inferenza statistica che non richiede delle ipotesi a priori sul tipo o sulle caratteristiche della distribuzione.
• È molto utile nella fase iniziale dell’analisi statistica quando si cercano le variabili più significative e le relazioni tra esse.
DISTRIBUZIONE DEL CHI QUADRATO
DISTRIBUZIONE DEL CHI QUADRATO
• Si basa sul confronto fra FREQUENZE OSSERVATE NEL CAMPIONE e FREQUENZE ATTESE
• La funzione di densità del χ2 è determinata solo dal parametro “numero di gradi di libertà”, pertanto viene scritta come χ2
(ν). • La distribuzione χ2 parte da GDL=1 e
al suo aumentare assume forme sempre diverse, fino ad una forma approssimativamente normale per GDL = 30
Caratteristiche della distribuzione del χ2
• È una somma di quadrati e per questo motivo i suoi valori sono sempre positivi e compresi nell’intervallo (0; +∞)
• È asimmetrica
• Tende alla simmetria quando i gdl tendono ad infinito
• È asintotica
Caratteristiche della distribuzione del χ2
• Il test statistico perde di attendibilità quando il numero di osservazioni è inferiore a 30
– Con pochi dati le variazioni casuali divengono molto ampie tanto da non poter rifiutare mai l’Ipotesi nulla con una probabilità ragionevolmente bassa.
• Per campioni di dimensioni inferiori a 200 (o 100) ma comunque superiori a 30 si deve apportare la CORREZIONE DI YATES
…derivazioni della curva normale…
• Considera le relazioni tra media e varianza, in campioni di piccole dimensioni, quando si utilizza la varianza del campione.
DISTRIBUZIONE DELLA t DI STUDENT
Quando non si conosce la varianza della popolazione usiamo la VARIANZA CAMPIONARIA s2
Gdl= N-1
• Rispetto alla curva normale è più bassa
• È simmetrica
• Le frequenze sono maggiori agli e quando il numero dei GDl è molto piccolo
• Quando i Gdl tendono all’infinito la curva si approssima a quella normale
…derivazioni della curva normale…
• Corrisponde al rapporto di 2 variabili casuali χ2 indipendenti, divise per i rispettivi gradi di libertà
• Questo rapporto varia tra 0 e +∞
• La curva dipende dai Gdl e dal livello di probabilità α
DISTRIBUZIONE F di FISHER