18
Probabilità e Statistica Non faremo una trattazione sistematica di probabilità e statistica (si veda in proposito il corso di Esperimentazioni III) Richiameremo alcuni argomenti che avete già visto quando necessario Libri: G. Cowan, Statistical Data Analysis, Clarendon, Oxford, 1998 S. Brandt, Statistical and Computational Methods in Data Analysis, Springer, New York, 1998

Probabilità e Statistica - Gruppo1-2 INFN FIRENZEhep.fi.infn.it/ciulli/Site/Analisi_Dati_09_10_files/statistics1.pdf · Probabilità e Statistica Non faremo una trattazione sistematica

Embed Size (px)

Citation preview

Page 1: Probabilità e Statistica - Gruppo1-2 INFN FIRENZEhep.fi.infn.it/ciulli/Site/Analisi_Dati_09_10_files/statistics1.pdf · Probabilità e Statistica Non faremo una trattazione sistematica

Probabilità e StatisticaNon faremo una trattazione sistematica di probabilità e statistica(si veda in proposito il corso di Esperimentazioni III)

Richiameremo alcuni argomenti che avete già visto quando necessario

Libri:

G. Cowan, Statistical Data Analysis, Clarendon, Oxford, 1998

S. Brandt, Statistical and Computational Methods in Data Analysis, Springer, New York, 1998

Page 2: Probabilità e Statistica - Gruppo1-2 INFN FIRENZEhep.fi.infn.it/ciulli/Site/Analisi_Dati_09_10_files/statistics1.pdf · Probabilità e Statistica Non faremo una trattazione sistematica

Variabili aleatorie e densità di probabilitàUna variabile aleatoria è un numero assegnato agli elementi di un campione statistico; può essere discreta o continua.Supponiamo che il risultato di un esperimento assuma un valore continuo x

→ f(x) = densità di probabilità - probability density function (pdf)

O nel caso di variabili discrete:

x deve assumere un valore tra ±∞

probability mass function

Page 3: Probabilità e Statistica - Gruppo1-2 INFN FIRENZEhep.fi.infn.it/ciulli/Site/Analisi_Dati_09_10_files/statistics1.pdf · Probabilità e Statistica Non faremo una trattazione sistematica

Istogrammipdf = istrogramma con un campione infinito, canali con larghezza zero e area unitaria

Page 4: Probabilità e Statistica - Gruppo1-2 INFN FIRENZEhep.fi.infn.it/ciulli/Site/Analisi_Dati_09_10_files/statistics1.pdf · Probabilità e Statistica Non faremo una trattazione sistematica

Distribuzioni di più variabili

Risultato dell’esperimento caratterizzato da un vettore con n componenti (x1, ... xn)

pdf congiunta

Normalizzazione:

Page 5: Probabilità e Statistica - Gruppo1-2 INFN FIRENZEhep.fi.infn.it/ciulli/Site/Analisi_Dati_09_10_files/statistics1.pdf · Probabilità e Statistica Non faremo una trattazione sistematica

pdf marginalepdf di alcuni (o di uno solo) dei componenti:

→ pdf marginale

x1, x2 independenti se

i

Page 6: Probabilità e Statistica - Gruppo1-2 INFN FIRENZEhep.fi.infn.it/ciulli/Site/Analisi_Dati_09_10_files/statistics1.pdf · Probabilità e Statistica Non faremo una trattazione sistematica

pdf marginale (2)

pdf marginale ~ proiezione della pdf congiunta sugli assi

Page 7: Probabilità e Statistica - Gruppo1-2 INFN FIRENZEhep.fi.infn.it/ciulli/Site/Analisi_Dati_09_10_files/statistics1.pdf · Probabilità e Statistica Non faremo una trattazione sistematica

Funzione di una variabile aleatoriaUna funzione di una variabile aleatoria è una variabile aleatoriaA function of a random variable is itself a random variable.Se x ha una pdf f(x), consideriamo la funzione a(x).Qual’è la pdf g(a)?

dS = regione del dominio x per cui a è in [a, a+da].Per il caso di una variabile con funzione a(x) invertibile:

Page 8: Probabilità e Statistica - Gruppo1-2 INFN FIRENZEhep.fi.infn.it/ciulli/Site/Analisi_Dati_09_10_files/statistics1.pdf · Probabilità e Statistica Non faremo una trattazione sistematica

Funzioni con inversa non unica

Se l’inversa non è unica bisogna includere tutti gli intervalli dx in dS che corrispondono a da:

Esempio:

Page 9: Probabilità e Statistica - Gruppo1-2 INFN FIRENZEhep.fi.infn.it/ciulli/Site/Analisi_Dati_09_10_files/statistics1.pdf · Probabilità e Statistica Non faremo una trattazione sistematica

Funzioni con più di una variabile aleatoria

Consideriamo e una funzione

dS = regione di x compresa tra le (iper)superfici definite da

Page 10: Probabilità e Statistica - Gruppo1-2 INFN FIRENZEhep.fi.infn.it/ciulli/Site/Analisi_Dati_09_10_files/statistics1.pdf · Probabilità e Statistica Non faremo una trattazione sistematica

Trasformazione di variabili

Consideriamo il vettore e la pdf congiunta

Siano n funzioni linearmente indipendetenti

per cui le funzioni inverse esistono.

La pdf congiunta del vettore di funzioni è

dove J è il determinante Jacobiano

Per si deve poi integrare sulle variabili non volute

Page 11: Probabilità e Statistica - Gruppo1-2 INFN FIRENZEhep.fi.infn.it/ciulli/Site/Analisi_Dati_09_10_files/statistics1.pdf · Probabilità e Statistica Non faremo una trattazione sistematica

È una tecnica numerica per calcolare probabilità e altre quantità correlate usando delle sequenze di numeri aleatori (o casuali).Si divide di solito in tre passi:(1) Si genera una sequenza r1, r2, ..., rm uniforme in [0, 1].

(2) Si usa questa sequenza per ottenerne un’altra x1, x2, ..., xn distribuita secondo una qualche pdf f (x) alla quale siamo interessati.(3) Si usano i valori di x per stimare le proprietà di f (x), e.g., la frazione di valori x tali che a < x < b è → calcolo MC = integrazione (almeno formalmente)valori generati dal MC = ‘dati simulati’ → si possono usare per provare dei metodi statistici

Il metodo Monte Carlo

Page 12: Probabilità e Statistica - Gruppo1-2 INFN FIRENZEhep.fi.infn.it/ciulli/Site/Analisi_Dati_09_10_files/statistics1.pdf · Probabilità e Statistica Non faremo una trattazione sistematica

Generatori di numeri aleatoriObiettivo: generare dei valori uniformemente distribuiti in [0, 1].

tiriamo una moneta per tutti i 32 bit di un long integer... troppo faticoso!→ usiamo un generatore di numeri aleatori (random number generator) = algoritmo che genera una sequenza r1, r2, ..., rn semi-aleatoria

Esempio: generatore multiplicativo lineare congruente (MLCG) ni+1 = (a ni) mod m , dove ni = intero a = multiplicatore m = modulo n0 = seme (valore iniziale)

Produce una sequenza di numeri n0, n1, ...

Page 13: Probabilità e Statistica - Gruppo1-2 INFN FIRENZEhep.fi.infn.it/ciulli/Site/Analisi_Dati_09_10_files/statistics1.pdf · Probabilità e Statistica Non faremo una trattazione sistematica

Generatori di numeri aleatori (2)La sequenza è (sfortunatamente) periodica Esempio (Brandt cap. 4): a = 3, m = 7, n0 = 1

← la sequenza si ripete

Si sceglie a, m in modo da ottenere un periodo lungo (max = m − 1); m di solito prossimo al massimo intero che si può rappresentare

Si usa solo un sottinsieme di un singolo periodo della sequenza.

Page 14: Probabilità e Statistica - Gruppo1-2 INFN FIRENZEhep.fi.infn.it/ciulli/Site/Analisi_Dati_09_10_files/statistics1.pdf · Probabilità e Statistica Non faremo una trattazione sistematica

Generatori di numeri aleatori (3)sono in [0, 1] ma quanto sono ‘aleatori’?

Si scelgono a, m in modo che gli ri passino vari test: distribuzione uniforme in [0, 1], i valori sono indipendenti (non ci sono correlazioni tra coppie),e.g. L’Ecuyer, Commun. ACM 31 (1988) 742 suggerisce

a = 40692 m = 2147483399

Esistono algoritmi molto migliori, e.g. TRandom3, periodo

F. James, Comp. Phys. Comm. 60 (1990) 111; Brandt cap 4

Page 15: Probabilità e Statistica - Gruppo1-2 INFN FIRENZEhep.fi.infn.it/ciulli/Site/Analisi_Dati_09_10_files/statistics1.pdf · Probabilità e Statistica Non faremo una trattazione sistematica

Il metodo della trasformataDati r1, r2,..., rn uniformi in [0, 1], si trova la transformazione x (r) tale che x1, x2,..., xn abbiano una pdf f (x) .

Si richiede:

i.e.

Ovvero si pone e si ricava x (r).

Page 16: Probabilità e Statistica - Gruppo1-2 INFN FIRENZEhep.fi.infn.it/ciulli/Site/Analisi_Dati_09_10_files/statistics1.pdf · Probabilità e Statistica Non faremo una trattazione sistematica

Esempio del metodo della trasformataEsponenziale:

Si pone e si trova x (r).

→ pure funziona.)

Page 17: Probabilità e Statistica - Gruppo1-2 INFN FIRENZEhep.fi.infn.it/ciulli/Site/Analisi_Dati_09_10_files/statistics1.pdf · Probabilità e Statistica Non faremo una trattazione sistematica

Metodo di accettazione-reiezione

Racchiudiamo la pdf in un box

(1) Si genera una variabile aleatoria x, uniforme in [xmin, xmax], i.e.r1 è uniforme in [0,1].

(2) Si genera una 2a variabile indipendente u uniformemente distribuita tra 0 e fmax, i.e.

(3) Se u < f (x), si accetta x. Se no, si rigetta x e si ripete.

Page 18: Probabilità e Statistica - Gruppo1-2 INFN FIRENZEhep.fi.infn.it/ciulli/Site/Analisi_Dati_09_10_files/statistics1.pdf · Probabilità e Statistica Non faremo una trattazione sistematica

Esempio con accettazione-reiezione

Se il punto è sotto la curva, si usa x nell’istogramma.

Esempio di fisica: e+e− → µ+µ−