18
Distinguere un segnale da un rumore di fondo. Prima puntata: lanciare i dadi Mi sono messo in testa di insegnarvi un po' di statistica. O meglio, di fare finta di insegnarvi un po' di statistica: in realtà farò solo degli esempietti approssimati, senza darvi nessuna dimostrazione, e senza pretesa di rigore matematico alcuno. L'idea sarebbe quella di tentare di spiegarvi come si isola un segnale da un rumore di fondo, quando lo si può fare, e perché avere pochi dati può non permette di esprimersi in modo certo rispetto alla presenza di un nuovo fenomeno, mentre invece aumentarne la quantità migliora questa capacità fino a un livello che può essere considerato sufficientemente attendibile. Siete pronti? Mi ci vorranno almeno un paio di articoli, se non di più. E, se mi impegno, magari ce la facciamo entro il 13 dicembre . Useremo uno scenario di fisica delle particelle estremamente semplificato. Stiamo facendo un esperimento per la ricerca del puzzone di Piggs: questa fantomatica particella, nel caso in effetti esista in natura, si manifesterebbe nel nostro sofisticato rivelatore con l'accensione di una lucina rossa. Il nostro collega teorico ci ha informati che la produzione del puzzone di Piggs è un evento molto raro: se le previsioni sono corrette si manifesterà in media una volta ogni 10000 interazioni. Segnatevi sui vostri quadernetti che questo ritmo di produzione e apparizione nel rivelatore è un valore medio, soggetto a fluttuazioni statistiche: torneremo su questo punto tra un momento. Il principale problema del nostro esperimento è quello del rumore di fondo. La natura, notoriamente burlona, ha previsto l'esistenza di un altro processo, che per l'occasione chiameremo bruglione di Yan, che si manifesta nel nostro rivelatore anch'esso con l'accensione della stessa lucina rossa, in modo assolutamente indistinguibile dalla (possibile) manifestazione del puzzone di Piggs. Il fenomeno del bruglione di Yan è stato scoperto parecchi anni fa e da allora misurato in lungo e in largo, e rappresenta uno dei tanti aspetti della natura di cui conosciamo tutti i dettagli. Sappiamo per esempio che è un fenomeno raro, ma più frequente dell'apparizione presunta del puzzone: in 10000 interazioni si manifesta infatti in media 10 volte. Facciamo ora una digressione sulla questione dei valori medi e delle fluttuazioni statistiche. Immaginate di lanciare due dadi a 6 facce, di quelli normali e comuni (per i giocatori di D&D prima o poi faremo un serie dedicata) e di sommare le cifre sulle facce superiori. Il valore più probabile che potete ottenere è 7, perché si tratta della cifra che potete ottenere con il maggior numero di combinazioni (nello specifico: 1+6, 2+5, 3+4, 4+3, 5+2, 6+1). Ottenere 6 o 8 è ancora abbastanza probabile, ma meno che ottenere 7 (vi lascio calcolare da soli le combinazioni possibili), mentre ottenere 2 o 12 è molto meno probabile (potete ottenerli rispettivamente solo facendo 1+1 o 6+6). Prendete un pezzo di carta, e provate a disegnare un grafico, mettendo sull'asse orizzontale il valore che ottenete lanciando due dadi, e sull'asse verticale il numero di combinazioni che permettono di realizzare quel particolare valore. Otterrete qualcosa del genere:

Distinguere un segnale dal rumore di fondo

Embed Size (px)

DESCRIPTION

Appunti sull'analisi statistica dei dati nel programma LHC del CERN

Citation preview

Page 1: Distinguere un segnale dal rumore di fondo

Distinguere un segnale da un rumore di fondo.

Prima puntata: lanciare i dadi Mi sono messo in testa di insegnarvi un po' di statistica. O meglio, di fare finta di insegnarvi un po' di statistica: in realtà farò solo degli esempietti approssimati, senza darvi nessuna dimostrazione, e senza pretesa di rigore matematico alcuno. L'idea sarebbe quella di tentare di spiegarvi come si isola un segnale da un rumore di fondo, quando lo si può fare, e perché avere pochi dati può non permette di esprimersi in modo certo rispetto alla presenza di un nuovo fenomeno, mentre invece aumentarne la quantità migliora questa capacità fino a un livello che può essere considerato sufficientemente attendibile. Siete pronti? Mi ci vorranno almeno un paio di articoli, se non di più. E, se mi impegno, magari ce la facciamo entro il 13 dicembre.

Useremo uno scenario di fisica delle particelle estremamente semplificato. Stiamo facendo un esperimento per la ricerca del puzzone di Piggs: questa fantomatica particella, nel caso in effetti esista in natura, si manifesterebbe nel nostro sofisticato rivelatore con l'accensione di una lucina rossa. Il nostro collega teorico ci ha informati che la produzione del puzzone di Piggs è un evento molto raro: se le previsioni sono corrette si manifesterà in media una volta ogni 10000 interazioni. Segnatevi sui vostri quadernetti che questo ritmo di produzione e apparizione nel rivelatore è un valore medio, soggetto a fluttuazioni statistiche: torneremo su questo punto tra un momento.

Il principale problema del nostro esperimento è quello del rumore di fondo. La natura, notoriamente burlona, ha previsto l'esistenza di un altro processo, che per l'occasione chiameremo bruglione di Yan, che si manifesta nel nostro rivelatore anch'esso con l'accensione della stessa lucina rossa, in modo assolutamente indistinguibile dalla (possibile) manifestazione del puzzone di Piggs. Il fenomeno del bruglione di Yan è stato scoperto parecchi anni fa e da allora misurato in lungo e in largo, e rappresenta uno dei tanti aspetti della natura di cui conosciamo tutti i dettagli. Sappiamo per esempio che è un fenomeno raro, ma più frequente dell'apparizione presunta del puzzone: in 10000 interazioni si manifesta infatti in media 10 volte.

Facciamo ora una digressione sulla questione dei valori medi e delle fluttuazioni statistiche. Immaginate di lanciare due dadi a 6 facce, di quelli normali e comuni (per i giocatori di D&D prima o poi faremo un serie dedicata) e di sommare le cifre sulle facce superiori. Il valore più probabile che potete ottenere è 7, perché si tratta della cifra che potete ottenere con il maggior numero di combinazioni (nello specifico: 1+6, 2+5, 3+4, 4+3, 5+2, 6+1). Ottenere 6 o 8 è ancora abbastanza probabile, ma meno che ottenere 7 (vi lascio calcolare da soli le combinazioni possibili), mentre ottenere 2 o 12 è molto meno probabile (potete ottenerli rispettivamente solo facendo 1+1 o 6+6). Prendete un pezzo di carta, e provate a disegnare un grafico, mettendo sull'asse orizzontale il valore che ottenete lanciando due dadi, e sull'asse verticale il numero di combinazioni che permettono di realizzare quel particolare valore. Otterrete qualcosa del genere:

Page 2: Distinguere un segnale dal rumore di fondo

Adesso fate un passaggio ulteriore, e trasformate i valori sull'asse verticale in percentuali. Per farlo, dovete contare tutte le combinazioni possibili (sono 36), e poi dividere ognuno dei valori che avevate sul grafico precedente per questo valore. Ecco qui:

Complimenti! Avete disegnato la vostra prima distribuzione di probabilità, una funzione che vi indica quanto è probabile che un certo fenomeno (il lancio di due dadi, per esempio) produca un certo risultato (un certo valore della somma delle facce superiori). A seconda del fenomeno che state studiando (il lancio di due dadi, la produzione del puzzone di Piggs), questa distribuzione avrà forme e caratteristiche diverse che si possono studiare matematicamente. Quando studiate una distribuzione di probabilità, ci sono alcune informazioni (matematiche) che vi aiutano a capirne le proprietà. La principale è il suo valore medio, che, perlomeno nel caso di distribuzioni simmetriche, vi dice qual è il risultato più probabile che potete ottenere se osservate un certo fenomeno. Immediatamente dopo viene un numerello che si chiama deviazione standard o anche scarto

Page 3: Distinguere un segnale dal rumore di fondo

quadratico medio, che vi da una misura di quanto i possibili risultati del vostro esperimento possono assumere dei valori diversi e lontani dal valore medio. Nel caso del lancio di due dati, il valore medio della distribuzione di probabilità dei valori attesi è 7, mentre la deviazione standard è circa 2.4 (come si calcola non ve lo spiego, se siete curiosi è un'informazione facile da trovare):

La media viene solitamente indicata con il simbolo "mu" ( ), e la deviazione standard con

"sigma" ( ). Quello che la media e la sigma di questa distribuzione vi dicono è per esempio che, quando lanciate due dadi, in poco meno di 67% dei casi il risultato che otterrete sarà compleso tra 7-2.4 e 7+2.4, ovvero tra il valore medio della distribuzione più o meno una sigma (e vi prego di sorvolare sul fatto che il valore della deviazione standard di una distribuzione che può assumere solo valori interi possa essere un numero reale, di quelli con la virgola, altrimenti non ne usciamo!). L'intervallo tra la media e più o meno due sigma, conterrà in questo caso più del 95% delle combinazioni possibili. Questi valori dipendono ovviamente dalla forma della distribuzione di probabilità, ma vi danno un'idea di dove voglio andare a parare: l'intervallo compreso tra la media più o meno un certo numero di sigma comprende una frazione di risultati possibili che è sempre più grande (e tende al 100%) tanto più grande è il numero di sigma che prendete in conto. Per esempio (ma ci torniamo meglio alla prossima puntata), se considerate la distribuzione di probabilità più frequente in natura, la distribuzione a campana detta "normale" o di Gauss, un intervallo compreso tra la media più o meno 3 sigma comprende più del 99% dei risultati possibili per un fenomeno descritto da quella distribuzione.

Conoscere il valore medio e la sigma della distribuzione di probabilità di un certo fenomeno, e la forma della distribuzione di probabilità, permette di stimare quali risultati ci si può attendere, quanto questi siano probabili quando si esegue un esperimento, e soprattutto di valutare quanto un certo risultato sia compatibile con l'ipotesi di un certo fenomeno. Per esempio, se conoscete la distribuzione di probabilità del risultato del lancio di due dadi, potrete scegliere in modo intelligente dove piazzare i vostri insediamenti quando giocate ai Coloni di Catan, in modo da massimizzare la probabilità di produrre risorse e vincere il gioco. Oppure, lanciando due dadi un certo numero di volte e confrontando la distribuzione dei risultati sperimentali con la distribuzione attesa, potete provare a stabilire se i dadi che state usando sono stati truccati.

Nel caso della ricerca del puzzone di Piggs, vista la necessità di distinguere la sua apparizione in mezzo al rumore di fondo generato dal fenomeno del bruglione di Yan, siete in una situazione simile. Se riuscite a farvi un'idea di quale sia la distribuzione di probabilità del manifestarsi dell'uno

Page 4: Distinguere un segnale dal rumore di fondo

e dell'altro fenomeno, potete tentare di valutare quanto il risultato del vostro esperimento supporti l'ipotesi dell'esistenza del puzzone, o piuttosto il solo manifestarsi del già noto bruglione. Per rendere più concreto l'esempio, ci servirà sapere quali siano le caratteristiche delle distribuzioni di probabilità dei due fenomeni in questione (puzzone e bruglione), cosa che vedremo alla prossima puntata.

Compito a casa. Mentre aspettate la prossima puntata, provate a costruire la distribuzione di probabilità della somma della facce di tre dadi. Qual è il valore più probabile? E se invece ne lancio quattro?

Page 5: Distinguere un segnale dal rumore di fondo

Distinguere un segnale da un rumore di fondo.

Seconda puntata: il significato di un eccesso Riprendiamo dal nostro segnale, il puzzone di Piggs, e il suo fastidioso rumore di fondo, il bruglione di Yan, che lo imita in tutto e per tutto, e per di più avviene più spesso. In entrambi i casi, come dicevamo, si tratta di fenomeni relativamente rari: il bruglione di Yan si manifesta in media 10 volte ogni 10000 collisioni, il puzzone di Piggs, se esiste, in media soltanto 1 volta.

I fenomeni che avvengono raramente, e su questo dovrete credermi sulla parola, seguono nel loro apparire una distribuzione di probabilità detta di Poisson. Questa distribuzione ha diverse proprietà matematiche interessanti, che vi lascio andare a scoprire da soli se volete approfondire. Per quello che vogliamo fare qui, ci interessa conoscere soltanto un paio di caratteristiche di base. La prima proprietà, come potete immagine se avete letto la puntata precedente, è il suo valore medio. Se studiate un fenomeno poissoniano, che ha la proprietà di manifestarsi 1 volta ogni N misure (per esempio, ogni N collisioni), nel caso voi facciate M misure potete aspettarvi di osservare in media M/N volte il fenomeno. Se il bruglione di Yan si manifesta in media 1 volta ogni 1000 collisioni, se ne misurate 10000 vi aspettate di osservarlo in media 10 volte. Semplice, vero?

La seconda proprietà è la deviazione standard, la "sigma", della distribuzione, anch'essa incontrata nella puntata precedente. La distribuzione di Poisson è particolarmente comoda per i calcoli, perché se il suo valore medio è K, la sua sigma è la radice quadrata di K. Se in 10000 interazioni vi aspettate di osservare in media 10 volte il bruglione di Yan, la sigma della corrispondete distribuzione di probabilità è la radice quadrata di 10, ovvero un po' più di 3. Come ricorderete, la "sigma" di una distribuzione misura quanto è probabile che osserviate un valore diverso da quello medio della distribuzione. Nel caso della distribuzione di Poisson (che in certi regimi non si comporta in modo troppo diverso dalla distribuzione normale), l'intervallo compreso tra il valor medio atteso più o meno una sigma contiene approssimativamente il 68% delle osservazioni possibili. Se osservate l'apparire del brugliore di Yan in 10000 collisioni, in circa 68% dei casi potete aspettarvi che apparirà un numero di volte compreso tra poco meno di 7 e poco più di 13. L'intervallo compreso tra il valor medio e 3 sigma comprende circa il 99.7% di valori possibile, quello tra il valor medio più o meno 5 sigma il 99.9999%.

Page 6: Distinguere un segnale dal rumore di fondo

Veniamo dunque alle nostre prime 10000 interazioni. Ci aspettiamo (ce l'ha detto il nostro amico teorico) in media 10 accensioni di lampadina causate dal bruglione di Yan, con una sigma di più o meno 3 accensioni, e 1 accensione potenzialmente dovuta al puzzone di Piggs, la particella ignota di cui siamo alla ricerca, con una sigma di... 1 accensione! Immaginate dunque di osservare 13 accensioni: state forse vedendo l'apparire di puzzone di Piggs, o state semplicemente visionando il bruglione di Yan, che conoscete bene e che vi interessa poco? Purtroppo per voi, non potete dire (ancora) molto. 13 accensioni sono in effetti più delle 10 che vi aspettereste in media per il solo bruglione, ma l'eccesso che osservate non è (ancora) significativo. Siccome la statistica di Poisson governa la frequenza delle apparizioni di bruglione e puzzone, sapete bene che 13 accensioni dovute al solo bruglione, invece che le 10 medie, sono un'eventualità piuttosto probabile. In effetti, un'eventualità possibile circa un terzo delle volte: se doveste rifare l'acquisizione dei vostri 10000 eventi altre 2 volte, potete stare quasi sicuri che l'eccesso sparirà. Mentre il numero eventuale di puzzoni di Piggs (1 in media, ma troppo facilmente anche 2 o nessuno) è ancora troppo piccolo per poterlo distinguere.

Che fate allora? Aspettate, e continuate a misurare, a raccogliere dati, a collezionare collisioni. Vediamo come la situazione evolve se invece di 10000 collisioni ne abbiamo raccolte 1000000. In un milione di collisioni ci aspettiamo di osservare in media 1000 accensioni di lampadina dovute al brugliore di Yan, con una sigma di circa 31 (la radice quadrata di 1000), mentre le accensioni potenzialmente dovute al puzzone di Piggs sarebbero 100, con una sigma di 10. Se in un milione di collisioni osservate 1103 accensioni, questa volta l'eccesso diventa intrigante. Potrebbe trattarsi ancora di una fluttuazione del rumore di fondo? Certamente, ma questa volta si tratterebbe di un eccesso che supera il valor medio atteso (1000) di più di 3 volte la sigma della distribuzione (3 per 31 fa 93, e voi avete un eccesso di 103 accensioni). Una simile fluttuazione del bruglione di Yan ha una probabilità di avvenire solo 1 volta ogni 370 esperimenti che raccolgano un milioni di eventi, cosa non impossibile ma molto più rara. In questo caso, normalmente vi permettereste di parlare di "evidenza" di un fenomeno, e di "osservazione di un eccesso". Molto probabilmente pubblichereste qualcosa, ma ovviamente con molta cautela.

Per essere sicuri che il vostro eccesso sia genuino volete che le probabilità di una fluttuazione del rumore di fondo siano veramente minuscole, praticamente trascurabili. Se raccogliete un altro milione di interazioni fino ad averne 2 milioni, vi attendete 2000 accensioni dovute al bruglione, con una sigma di circa 41. Se osservate 2215 accensioni, il vostro eccesso (215 accensioni in più delle 2000 attese in media) rappresenta più di 5 volte la sigma del rumore di fondo: in questo caso, si tratterebbe di una fluttuazione del rumore di fondo che ha una probabilità di accadere ogni 1700000! D'altra parte, vi attendereste in media 200 accensioni potenzialmente dovute al puzzone, con una sigma di 14 accensioni: l'eccesso è infinitamente più probabilmente dovuto alla presenza di un secondo fenomeno oltre al bruglione, e certamente compatibile con l'esistenza del puzzone ("infinitamente" è un eufemismo: quanto questo secondo scenario sia più probabile è qualcosa che si può calcolare con precisione, ma in questa sede non ci proveremo nemmeno!). Se ve la sentite, in questo caso potete finalmente parlare di "scoperta", perché l'eccesso che osservate è statisticamente significativo.

Page 7: Distinguere un segnale dal rumore di fondo

Tutto a posto? Nella maggio parte dei casi, si. Champagne, applausi, seminario pubblico, magari premio Nobel. A meno che (perché c'è sempre un "a meno che")... Tutto il ragionamento fatto sino ad adesso si basa sull'ipotesi che le proprietà del rumore di fondo, quello che abbiamo chiamato il bruglione di Yan, siano ben note. Questo è spesso vero, ma quando si sperimenta in regimi energetici nuovi (per esempio a LHC!), potrebbe non essere così certo. Il bruglione di Yan potrebbe essere stato studiato con cura con un acceleratore che ha lavorato a 2 TeV, e le previsioni di come dovrebbe manifestarsi a 7 TeV potrebbero essere state estrapolate sulla base di calcoli teorici. Come fare a fidarsi? Che succederebbe se il bruglione di Yan si presentasse in realtà in media 11 volte in 10000 eventi, invece delle 10 inizialmente previste? Il ragionamento fatto prima sarebbe ancora valido? Vediamo un po'. In 2 milioni di eventi mi dovrei aspettare 2200 eventi (e non i 2000 che erroneamente credevo) con una sigma di circa 46. La mia osservazione di 2215 accensioni di lampadina assume immediatamente un significato diverso, non trovate?

Page 8: Distinguere un segnale dal rumore di fondo

Sbagliare a stimare il "rumore di fondo" è uno degli errori sistematici più comuni nella fisica delle alte energie. Per evitarlo, esiste una sola strategia: invece di affidarsi a predizioni teoriche, mettersi in condizione di misurare il ritmo di produzione del rumore di fondo direttamente dai dati. Per farlo, occorre trovare una zona di osservazione dove siate sicuri che si manifesti solo il bruglione di Yan, e misurarne le proprietà in questa regione. È quello di cui parleremo alla prossima puntata.

Page 9: Distinguere un segnale dal rumore di fondo

Distinguere un segnale da un rumore di fondo.

Terza puntata: zone di rumore di fondo controllato Come dicevamo alla fine della scorsa puntata, se si conoscono alla perfezione le proprietà del fenomeno (o dei fenomeni) che imita il manifestarsi dell'oggetto di cui siamo alla ricerca, insomma del nostro rumore di fondo, un'analisi statistica delle nostre osservazioni permetterà di capire se un eventuale eccesso osservato sia compatibile con la presenza di un segnale genuino sovrapposto al rumore, oppure al solo rumore. Nel caso invece che le proprietà del rumore di fondo non siano note con sufficiente precisione, le probabilità di sbagliare aumentano. Nel caso in cui si sottostimi il rumore di fondo, si penserà di vedere un segnale quando invece non ce n'è traccia. Per evitare di cadere in questa trappola, i fisici cercano sempre di misurare le proprietà dei rumori di fondo dagli stessi dati, per non doversi fidare troppo delle predizioni teoriche.

Riprendiamo l'esempio del puzzone di Piggs e del suo fastidioso rumore di fondo, il bruglione di Yan. Quello che sappiamo è che entrambi si manifestano nel rivelatore con l'accensione di una lampadina rossa. Se la storia fosse tutta qui, non ci sarebbe molto altro da aggiungere. Ma immaginate invece di essere talmente furbi da riuscire a isolare uno o più modi di manifestarsi del solo bruglione di Yan: immaginiamo per esempio che abbiate scoperto che il bruglione di Yan si manifesta anche con l'accensione di una lampadina verde e di una lampadina blu, supponendo per semplicità con lo stesso ritmo con cui accende quella rossa. E immaginiamo invece che il fenomeno di cui siete alla ricerca, il puzzone di Piggs, per nessuna ragione possa far accendere né la lampadina verde né quella blu. In questo caso siete a cavallo: invece di fidarvi delle predizioni del vostro amico teorico, che vi ha garantito che il bruglione di Yan si manifesta con 10 accensioni ogni 10000 collisioni, andate direttamente a misurare questo valore con le lampadine verdi e blu.

Inizialmente, avendo pochi dati, non avrete una grande precisione. Immaginiamo infatti che la previsione del vostro amico teorico sia corretta, e che in 10000 collisioni le tre lampadine si accendano in media 10 volte a causa del bruglione. Come abbiamo visto la volta scorsa, esiste una probabilità importante che invece di vedere 10 accensioni ne vediate invece 13, oppure 7, oppure 11.

In questo caso, facendo l'ipotesi che il ritmo di accensione sia costante nelle varie lampadine

Page 10: Distinguere un segnale dal rumore di fondo

(non è necessariamente il caso, ma facciamola semplice), potete per esempio fare una media delle misure delle due lampadine che sapete non saranno accese dal puzzone di Piggs. Meglio ancora, se masticate di analisi dati, farete una media pesata o una regressione, considerando come errore sulle misure la radice quadrata della misura stessa (in sostanza, facendo l'ipotesi che la vostra misura sia poissoniana, e che la misura stessa sia una buona stima della media stessa: ecco il senso delle barre di errore nel grafico precedente). Nel nostro caso semplificato, il risultato della stima del rumore del fondo usando le due lampadine verdi e blu è circa 9 (la linea tratteggiata nera), con una precisione di circa 2 conteggi (la banda gialla): meglio della sola lampadina verde e della sola lampadina blu da sole, come ci si aspetterebbe dalla combinazione di due misure. 9 conteggi in 10000 eventi più o meno 2 è una buona stima dei 10 conteggi teorici, e potete certo usare questo numero per valutare quanto l'eccesso di conteggi della lampadina rossa sia significativo. Purtroppo ancora non molto! 13 meno 9 fa 4, che è poco più di 3, la radice quadrata di 9. Si tratta sempre di un eccesso si poco superiore a una sigma. Continuate dunque a raccogliere dati, e ripetete l'operazione di media delle lampadine di controllo. In un milione di eventi la lampadina verde si sarà accesa 981 volte, quella blu 1014, e quella rossa (come già nella puntata precedente) 1103 volte.

Il rumore di fondo stimato con la lampadina verde e blu è di 997 (più o meno 22 accensioni), un'ottima stima del 1000 teorico. L'eccesso che osservate (1103 - 997 = 106) è maggiore di più di 5 sigma del livello del rumore di fondo misurato dai dati (essendo adesso la sigma da considerare l'errore sul livello medio del fondo, cioè 22): avete una bella evidenza sperimentale della presenza di un nuovo fenomeno. E vi prego di notare che, quando avevamo considerato solo la lampadina rossa, lo stesso eccesso corrispondeva solo a 3 sigma: dove abbiamo guadagnato? In questo caso avete due misure del fondo, non una sola (o una sola predizione teorica), e il fatto che siano due ne migliora di molto la precisione, e rende lo stesso eccesso più significativo. Immaginate dunque che cosa potreste fare se aveste a disposizione 30 lampadine invece di 3, e 29 di queste potessero essere usate per misurare il livello di produzione del bruglione di Yan. Qualcosa del genere:

Page 11: Distinguere un segnale dal rumore di fondo

Come vedete, il livello di precisione sulla misura del rumore di fondo (la banda gialla) migliora notevolmente, e il vostro eccesso (la lampadina rossa ha indice 15). D'altra parte, ingrandendo la regione in cui andate a misurare le proprietà del rumore di fondo, aumentate anche le possibilità di osservare una fluttuazione larga a sufficienza da essere confusa con un eccesso. Cosa direste se il quadro fosse piuttosto questo qui sotto?

L'eccesso alla lampadina rossa è sempre lo stesso, gli altri punti sono generati esattamente come nel grafico precedente: numeri causali distribuiti poissonianamente con media 1000. Questa volta però c'è un punto corrispondente alla seconda lampadina che mostra un eccesso assolutamente casuale, che è una fluttuazione del fondo. Se non sapeste che il puzzone di Piggs deve manifestarsi con l'accensione della lampadina rossa, ma soltanto che potrebbe manifestarsi in una delle 30 lampadine, come fate a distinguere quale dei due eccessi sia significativo? In due parole: non potete. Dovete (come sempre!) raccogliere più dati, e verificare se - aumentando la statistica -

Page 12: Distinguere un segnale dal rumore di fondo

l'eccesso resta tale o si rivela soltanto una fluttuazione.

Nell'attesa, dovete anche essere cauti nel dichiarare al mondo quale è la significatività statistica del vostro eccesso. Se localmente la lampadina rossa mostra un eccesso di 3 sigma, il fatto che non sapete quale lampadina possa accendersi vi obbliga a correggere questo "3 sigma" per quello che si chiama in gergo il "Look Elsewhere Effect" (Effetto del Guardare Altrove) - per gli amici LEE -ovvero per la probabilità che una tale fluttuazione appaia in un'altra qualsiasi delle tante lampadine che state monitorando. Più sono le lampadine in cui il puzzone di Piggs potrebbe manifestarsi, maggiore sarà la correzioni, minore il valore globale del vostro effetto locale. Per stappare lo champagne dovrete aspettare ancora un po'.

Page 13: Distinguere un segnale dal rumore di fondo

Lo stato della ricerca del bosone di Higgs, dopo il seminario al CERN

14 dicembre 2011

La giornata di ieri è stata delirante.

Mica tanto per gli annunci sullo stato si salute della ricerca del bosone di Higgs: in buona sostanza, conoscevo già i risultati, e, sebbene sia vero che potrebbero esserci buone ragioni per eccitarsi forse per la prima volta dalla partenza di LHC, la cautela resta comunque d'obbligo, ed è decisamente troppo presto per stappare lo champagne. No, il delirio è associato piuttosto al baraccone mediatico che si è creato intorno a questo evento, baraccone che secondo me ha persino intaccato la qualità scientifica di una parte del seminario stesso (e ve lo dico senza peli sulla lingua: sto pensando alla presentazione di CMS), probabilmente a danno di una comprensione completa dello stato delle cose. Ma andiamo con ordine, e lasciamo folklore e sociologia per un altro articolo.

Come penso di aver scritto probabilmente già un migliaio di volte, non abbiamo nessuna predizione teorica della la massa del bosone di Higgs, per cui o cerchiamo in un intervallo di massa ampio, tra il limite inferiore messo dalle ricerche dirette di LEP (115 GeV), e un limite superiore di circa 1 TeV oltre il quale è ben difficile che questa particella esista, perlomeno nel modo in cui lo predice il Modello Standard. Quello che invece i teorici sono in grado di calcolare, in funzione della massa presunta del bosone di Higgs, è quanto spesso verrebbe prodotto nelle collisioni di LHC, e quanto facilmente potrebbe decadere in diversi tipi di particelle. Le modalità di decadimento cambiano a seconda della massa del bosone per ragioni diverse, ma la principale rimane questa: perché il bosone di Higgs possa decadere in una serie di particelle dotate di una certa massa, bisogna che la massa del bosone stesso sia sufficiente a generarle. O quasi, perché poi la meccanica quantistica si mette di mezzo, ed esiste una probabilità di creare una particella in modo virtuale per un tempo sufficientemente breve anche se non c'è abbastanza energia, ma in sostanza il quadro è questo.

Il grafico qui sopra riporta la probabilità che il bosone di Higgs decada in un certo modo, in funzione del valore della sua massa. Come vedete, a bassa massa, diciamo tra 50 e 150 GeV, il

Page 14: Distinguere un segnale dal rumore di fondo

decadimento preferito è in una coppia di quark-antiquark b, mentre appena la massa diventa sufficiente, sopra i 150 GeV, il decadimento in coppie di bosoni W e Z diventa predominante. Per masse molto alte, appena l'energia è sufficiente, anche il decadimento in coppie di quark-antiquark t diventa possibile. Queste informazioni guidano le strategie di ricerca di ATLAS e CMS, che di fatto cercano di vedere qualche segno del passaggio del bosone di Higgs negli stessi canali di decadimento.

Per piccoli valori di massa del bosone di Higgs, tra i 110 e i 150 GeV, lo si cerca principalmente nel suo decadimento in due fotoni ( ), nonostante la probabilità di questo decadimento sia veramente bassina (circa 2 vollte ogni 1000 decadimenti): gli altri modi di

decadimento ( e ), sebbene molto più probabili, sono veramente difficili da vedere a LHC a causa dei grandissimi rumori di fondo. Sia ATLAS che CMS studiano questi modi, e ieri CMS ha presentato gli ultimi risultati anche su questi canali, ma di fatto la sensibilità ultima è completamente dominata dal modo , per cui vi parlerò solo di questo.

Nelle regioni di massa intermedia si usano i decadimenti coppie di bosoni W o Z. Siccome a loro volta i bosoni W e Z hanno diversi modi di decadere, alla fine ci ritroviamo con diversi stati finali possibili, anch'essi con una sensibilità diversa a seconda della massa dell'Higgs: tra 110 e 140 GeV possiamo dire parecchio con il decadimento , dove la sta per leptone, che può essere un elettrone o un muone; tra 200 e 600 GeV ci dice di più il decadimento

, dove la coppia di quark da origine a due spray di adroni che chiamiamo jet; analogamente, sempre tra 200 e 600 GeV c'è parecchio da scoprire guardando i decadimenti

e ; il decadimento più sensibile per la scoperta resta però (in varie combinazioni di leptoni: 4 elettroni, o 2 elettroni e 2 muoni, o 4 muoni),

che può dire molto per masse del bosone di Higgs variabili su tutto il range tra i 110 e i 600 GeV.

Le ricerche fatte fino ad oggi hanno già escluso una buona porzione dei valori di masse possibili, per cui di fatto siamo rimasti con una zone piuttosto ristretta dove andare a cercare, o da escludere definitivamente. Se ricordate, la combinazione dei risultati di ATLAS e CMS presentati quest'estate ha già escluso la regione di massa tra 141 a 476 GeV, riducendo di fatto la zone interessane in cui andare a scavare tra i 115 GeV del limite superiore di LEP e 141 GeV. In questa finestra di bassa massa i canali di decadimento che possono dare informazioni veramente utili sono si fatto solo , e , che sono quelli che ATLAS ha presentato ieri, e che dominano anche i risultati di CMS.

Nel caso della ricerca di , i segnale è rappresentato dall'apparizione di due fotoni nei rivelatori, le cui energie e posizioni siano compatibili con il decadimento di una particelle. La collisioni di due protoni però genera a sua volta un mucchio di coppie di fotoni, che rappresentano il rumore di fondo. Siccome in questo caso i fotoni non sono prodotti dal decadimento di una particella, se calcolo a partire dalle loro energie e posizioni la massa della particella dal cui decadimento sarebbero originati, non ottengo un valore univoco, ma uno spettro continuo di valori. Con i fotoni che proverrebbero dal decadimento del bosone di Higgs dovrei invece vedere un accumulo di eventi per un valore di massa definito. La massa invariante delle coppie di fotoni osservate è in questo caso la lampadina che mi segnalerebbe l'apparire del bosone di Higgs, e siccome ho un continuo di lampadine dove invece il bosone non si manifesta (il continuo di massa dovuto alle coppie di fotoni generate direttamente nello scontro tra i protoni), posso usarlo per valutare il rumore di fondo. Ecco il risultato di ATLAS (o meglio, una parte):

Page 15: Distinguere un segnale dal rumore di fondo

e l'equivalente per CMS:

Nel caso di ATLAS potete vedere, persino a occhio nudo, un certo eccesso in corrispondenza di 126 GeV. Nel caso di CMS le cose sono meno chiare, c'è forse un eccesso più debole intorno a 124 GeV,

Page 16: Distinguere un segnale dal rumore di fondo

e forse un'altro intorno a 135 GeV. Usando le tecniche statistiche di cui abbiamo discusso nei giorni scorsi, questi eccessi possono essere quantificati: localmente ATLAS vede nel canale un eccesso di 2.8 sigma, che però scende a 1.5 sigma se si tiene in conto il Look Elsewhere Effect (LEE). CMS vede un eccesso locale di 2.3 sigma a 124 GeV, la cui significatività scende a 0.8 sigma se si tiene conto del LEE.

Per il canale la situazione è simile: anche qui posso usare le energie e le posizioni dei 4 leptoni ($eeee$, $ee\mu\mu$ o $\mu\mu\mu\mu$) per ricostruire quale sarebbe la massa della particella originale da cui i leptoni proverrebbero se fossero i suoi prodotti di decadimenti. Qui le cose con il rumore di fondo sono un dito più complesse, perché si tratta sia per il segnale che per il fondo di eventi molto rati, e per la misura del livello di fondo devo spesso affidarmi a un'estrapolazione dai dati più complessa. Ecco cosa vede ATLAS:

e quello che vede CMS:

Page 17: Distinguere un segnale dal rumore di fondo

ATLAS ha un'accumulazione di 3 eventi intorno a 125 GeV, in un posto in cui se ne aspetterebbe praticamente solo 1 dovuto al rumore di fondo. La situazione in CMS è più confusa: globalmente anche CMS ha un eccesso di eventi rispetto al totale atteso, ma meno localizzato che quello di ATLAS, con eccessi sia poco sotto 1 120 GeV che intorno a 126 GeV. Vi prego poi di notare che ATLAS ha anche un eccesso di eventi intorno a 240 GeV, più o meno altrettanto significativo che quello a 125 GeV, mentre CMS non vede nulla di simile in quella zona. Questo è un classivo esempio del motivo per cui bisogna essere cauti in questo tipo di ricerche: forse che ATLAS sta vedendo due bosoni di Higgs, uno a 125GeV e uno a 240? O sono entrambe fluttuazioni? E CMS?

Finalmente, il canale .Se possibile, qui le cose sono ancora più complicate: siccome nello stato finale ci sono dei neutrini, che di fatto ATLAS e CMS non vedono, il giochino di ricostruire la massa della particella da cui gli oggetti finali verrebbero partendo alle loro energie e posizioni non è più possibile, e dunque la ricerca si fa meno precisa. Posso sempre costruire della variabile analoghe, ma la capacità di dire qualcosa di preciso rispetto a una massa precisa sarà comunque inferiore. In questo canale sia ATLAS che CMS vedono un accesso globale, che potenzialmente rinforza l'ipotesi di un possibile fenomeno a bassa massa, ma non aiuta a chiarire per quale valore di massa possa stare spuntando fuori qualcosa.

Se si mettono insieme tutti i risultati, ovvero i 3 canali che ho discusso per ATLAS, e questi 3 più tutti gli altri per CMS, si ottengono questi risultai globali

Page 18: Distinguere un segnale dal rumore di fondo

ATLAS è oggi in grado di escludere tutto il range di bassa massa possibile per il bosone di Higgs tranne l'intervallo tra 115 e 131 GeV, mentre l'eccesso a 240 GeV impedisce un'esclusione completa della regione delle masse intermedie. CMS ha ha bassa massa un'esclusione analoga, che lascia libero l'intervallo tra il limite di LEP e 127 GeV. ATLAS vede un eccesso apparentante coerente intorno a 126 GeV che, combinando tutti i canali, ha una significanza statistica locale di 3.6 sigma, da ridimensionare a 2.5 sigma tenendo in conto il LEE. CMS ha di fatto due eccessi con significanze simili, uno intorno a 120 e l'altro intorno a 124 GeV, non necessariamente coerenti tra di loro (sopratutto tenendo conto dell'ottima risoluzione del calorimetro di CMS che viene usato per misurare tanto i fotoni che gli elettroni). Globalmente questo fa sì che CMS abbia un eccesso sparpagliato su tutta la regione di bassa massa, globalmente non più significativo di 1.9 sigma.

Che cosa possiamo concludere da questo quadro? È molto difficile dirlo. Come diceva ieri pomeriggio Fabiola Gianotti alla fine della presentazione di ATLAS, sarebbe molto bello da parte del bosone di Higgs aver scelto di esistere tra 115 e 130 GeV: in questa regioni abbiamo mezzi e capacità per stanarlo, e forse qualche primo indizio della sua presenza. Ma tentare di far dire ai dati di più di quello che possano dire, che mi è sembrato un po' quello che Guido Tonelli abbia tentato di fare alla fine della sua presentazione, tirando un po' troppo per i capelli una coerenza tra i risultati di CMS che non è necessariamente presente, è certamente eccessivo. Gli eccessi osservati sono intriganti, ma tutti ancora troppo limitati per poter escludere che siano delle fluttuazioni del rumore di fondo. Il fatto poi che, oltre agli "eccessi gradevoli", ce ne siano altri meno apprezzati (pensate all'eccesso a 240 GeV nel canale a 4 leptoni di ATLAS, ma anche al doppio eccesso di CMS) dovrebbe ricordare a tutti che la Natura è spesso infida, che la statistica è una bestia difficile da domare, e che solo più dati potranno chiarire uno scenario che resta intrigante e eccitante, ma troppo vago per potersi permettere di più.

E che sia chiaro, prima che me lo chiediate: io spero che il bosone di Higgs esista, e che abbia una massa di 125 GeV, e che, magari già per l'estate 2012, siamo in grado di poterne annunciare la scoperta, grazie ai nuovi dati, ad analisi migliorate di quelli presi nel 2011, e della combinazione delle analisi di ATLAS e CMS. Ma tra quello che nutre le mie speranze (e quelle di molti), e quello che si può veramente affermare oggi con i risultati che abbiamo, c'è veramente una bella differenza.