A
Percentil al 68.3% , : P(x) dx = 0.683
Si la distribución es continua,
la media viene dada por
y el resto de los momentos por
3
Si el número de eventos esperados, , en un intervalo de extensión h es = h ( da la tasa de eventos por unidad de h),
Distribución gaussiana multidimensional
En 2 dimensiones, la distribución centrada en (0,0) tiene la forma:
donde es el coeficiente de correlación, definido por
Sus momentos característicos son:
En general, para p dimensiones, la distribución gaussiana centrada en viene dada por:
donde x es el vector de la muestra (de p dimensiones), es su valor medio, y es la matriz de correlación entre las variables x
Ejemplo: calculo de las probabilidades de propiedades intrínsecas atribuibles a galaxias (u otros objetos) a través de mapas color-color
Distribución de redshifts derivado del diagrama color-color:
1996, MNRAS, 281,945
Inferencia Bayesiana (Loredo T. 1992, en `Statistical Challenges in Modern Astronomy, ed. Feigelson & Babu, Springer, http://www.astro.cornell.edu/staff/loredo/bayes/tjl.html)
Dos diferentes intepretaciones del término probabilidad:
• frecuentista: frecuencia con que un cierto resultado se obtiene como resultado de la repetición infinita de un proceso.
• bayesiana: plausibilidad de que una proposición (modelo) pueda dar cuenta de un conjunto de datos.
En muchas situaciones se obtiene el mismo resultado utilizando las dos técnicas, pero existen excepciones notables (ejem. Kraft et al. 1991, ApJ, 374, 344). Los dos métodos son fundamentalmente diferentes. Parten de concepciones opuestas sobre cúal es la información fidedigna y por evaluar (modelo o datos). Los cálculos bayesianos discriminan entre hipótesis plausibles, los cálculos frecuentistas evaluan la validez del conjunto de datos.
Teorema de Bayes:
Pasos a seguir en la inferencia Bayesiana:
• Especificar el modelo, o hipótesis a evaluar: en general tendremos varios Hi a comparar• Asignar las probabilidades: anterior P(Hi) anterior predictiva P(D) de muestreo P(D|Hi)• Calcular la probabilida posterior mediante la fórmula de Bayes .• Comparar los resultados entre los diferentes modelos, mediante el cociente de probabilidades posteriores P(Hi|D)/H(Hj|D) por ejemplo
Ejemplo: estimación de una media poissoniana
Supongamos que hemos obtenido una medida de n eventos en un intervalo de tiempo T, y que deseamos inferir la frecuencia de eventos, r .
1.- Especificamos la hipótesis H, que el proceso es Poissoniano con una frecuencia de eventos 0 r rmax.
2.- Asignamos probabilidades:
de muestreo:
a priori (anterior):
anterior predictiva:
3.- Aplicamos el teorema de Bayes para calcular la probabilidad
posterior:
Si Trmax>> n, entonces la función incompleta gamma se puede
aproximar
y la probabilidad posterior resulta
Para el caso particular de detectar 7 eventos en 1 segundo, la
probabilidad de que el proceso tenga una media de 10 eventos por
segundo es del 9%:
P(10 | 7)
(nota: compárese con la probabilidad frecuentista)
Ejemplo: estimación de una media poissoniana sobre un fondo
Supongamos que hemos obtenido una medida de Non eventos en un intervalo de tiempo Ton, y que deseamos inferir la frecuencia de eventos de la señal, s , sobre el fondo, b. Se pretende estimar el fondo de una medida independiente de Noff eventos en un intervalo Toff.
Como en el caso anterior p(bNoff) =
Para la medida con señal y fondo conjuntamente:
p(sb|Non) = p(sb) = p(s|b) p(b)
donde
es la prob. de muestreo
p(s|b) = 1/smax
p(b) = p(b | Noff)
p(Non) = 1/Tonsmax prob. anterior predictiva
Para calcular la probabilidad posterior de la señal, hay que marginalizar el parámetro b, calculando p(s|Non) = db p(sb|Non). Realizando la expansión del término (s+b)Non se encuentra
Toff(bToff)Noff ebToff
Noff!
p(Non| sb)
p(Non)
p(Non| sb)
p(Non)
dan la probabilidad a priori }
Se debe resaltar que éste es un cálculo ambiguo bajo la inferencia frecuentista, aunque hay algunas publicaciones con aproximaciones no libres de inconsistencias (O’Morgain, 1973, Nature, 241, 376; Cherry et al. 1980, ApJ, 242, 1257)