Inferencia bayesiana [5mm]...

Inferencia bayesiana

Mike Wiper

Departamento de Estadística

Universidad Carlos III de Madrid

Grado en Estadística y Empresa

Mike Wiper Métodos bayesianos Estadística y Empresa 1 / 22

Objetivo

Introducir las ideas básicas de la inferencia bayesiana y las diferencias y similitudescon la inferencia clásica.

Probabilidad subjetiva

La inferencia bayesiana se basa en la probabilidad subjetiva. Cada individuo puedetener su propia probabilidad para cualquier suceso, basada en sus propiosconocimientos, experiencias, ...

¾Cuál es la probabilidad de que naciera en el año 1962?

El único requerimiento es que seamos coherentes.

Probabilidad subjetiva

La inferencia bayesiana se basa en la probabilidad subjetiva. Cada individuo puedetener su propia probabilidad para cualquier suceso, basada en sus propiosconocimientos, experiencias, ...

¾Cuál es la probabilidad de que naciera en el año 1962?

El único requerimiento es que seamos coherentes.

Ejemplo

�Pedro es un hombre soltero de mediana edad. Hizo la carrera de matemáticas enla universidad y le gustan los sudokus. Viste traje en su trabajo y sus amigos leconsideran inteligente pero algo aburrido y demasiado serio.�

Ordenar los siguientes sucesos en orden du su probabilidad:

Toca jazz

Es contable

Lee un periodico deportivo

Es contable y toca jazz

Juega al padel

Tiene cuenta en Facebook

Juega al padel y tiene cuenta en Facebook

Ejemplo

¾El porcentaje de paises africanos en la ONU es por arriba o por debajo de 10%?

Estimar el porcentaje.

¾El porcentaje de paises de la UE que utilizan el euro es por arriba o por debajode 30%?

Ejemplo

Elicitación de probabilidades

Normalmente, los expertos a quienes queremos consultar no son estadísticos.

No saben casi nada sobre probabilidad, parámetros ...

Tenemos que preguntarles sobre cosas reales.

¾Qué apuesta pre�eres?Ganas 1000¿ si gana Real Madrid la ligaoGanas 1000¿ si sale amarillo

Elicitación de probabilidades

Normalmente, los expertos a quienes queremos consultar no son estadísticos.

No saben casi nada sobre probabilidad, parámetros ...

Tenemos que preguntarles sobre cosas reales.

Ajustando las áreas, la probabilidad esproporcional al área cuando seasindiferente entre las dos apuestas.

La distribución a priori

En contraste a la inferencia clásica, para un bayesiano, el parámetro, θ siempre esuna variable.

Se supone que (antes de hacer cualquier experimento) una persona puederepresentar los conocimientos sobre θ con una distribución f (θ).

Esta distribución es la distribución a priori.

Una distribución a priori para θ = P(cruz)

Supongamos que queremos pedir una distribución a priori de un experto paraθ = P(cruz).

¾Qué sabemos sobre la probabilidad?

0 ≤ θ ≤ 1.

En la mayoría de experimentos, aproximadamente 50% de los resultados soncruces.

Buscamos una distribución a priori con soporte [0, 1] y centrado en 0,5.

La distribución beta

Una variable continua Y tiene una distribución beta con parámetros α, β > 0 si

fY (y) =1

B(α, β)yα−1(1− y)β−1 para 0 < y < 1.

B(·, ·) es el coe�ciente beta

B(α, β) =

yα−1(1− y)β−1 dy =Γ(α)Γ(β)

Γ(α + β).

Se tiene E [Y ] = αα+β y V [Y ] = αβ

(α+β)2(α+β+1) .

Distribuciones beta

Beta(1

)Beta(1, 1)

Beta(5, 5)

Beta(1, 3)

Beta(2, 1)

Cambiando los parámetros, la distribución beta toma formas muy distintas.

En nuestro caso, podemos utilizar la distribución Beta(5, 5).

La distribución a posteriori

Dada una muestra de datos, modi�camos nuestros creencias sobre θ mediante elteorema de Bayes:

f (θ|datos) =f (θ)f (datos|θ)

f (datos).

En esta expresión:

f (θ|datos) es la distribución a posteriori,

f (θ) es la distribución a priori,

f (datos|θ) = l(θ|datos) es la función de verosimilitud,

f (datos) =∫f (datos|θ)f (θ) dθ es la verosimilitud marginal.

Simpli�cando el cálculo

En la fórmula anterior, observamos que el denominador no es una función de θ.Luego, tenemos:

f (θ|datos) ∝ f (θ)f (datos|θ)

a posteriori ∝ a priori× verosimilitud

Ejemplo

Supongamos que tiramos la moneda 12 veces y que observamos 9 cruces y 3caras. Luego,

f (θ|datos) ∝ 1

B(5, 5)θ5−1(1− θ)5−1

)θ9(1− θ)3

∝ θ14−1(1− θ)8−1

¾Qué distribución es?

f (θ|datos) =1

B(14, 8)θ14−1(1− θ)8−1.

Tenemos θ|datos ∼ Beta(14, 8).

¾Sería diferente si el diseño del experimento fuese binomial negativa?

Ejemplo

f (θ|datos) ∝ 1

B(5, 5)θ5−1(1− θ)5−1

)θ9(1− θ)3

∝ θ14−1(1− θ)8−1

f (θ|datos) =1

B(14, 8)θ14−1(1− θ)8−1.

Ejemplo

f (θ|datos) ∝ 1

B(5, 5)θ5−1(1− θ)5−1

)θ9(1− θ)3

∝ θ14−1(1− θ)8−1

f (θ|datos) =1

B(14, 8)θ14−1(1− θ)8−1.

Estimación puntual

Cuando hemos calculado la distribución a posteriori, podemos utilizar la media aposteriori, la mediana a posteriori o la moda a posteriori como estimadorespuntuales de θ.

Este último caso es conocido como el estimador máximo a posteriori o MAP.

En nuestro ejemplo:

E [θ|datos] = 0,636 Med[θ|datos] = 0,641 Mo[θ|datos] = 0,650

Estimación por intervalos

Un intervalo de 100(1− α) % de credibilidad es cualquier intervalo (a, b) tal queP (a < θ < b|datos) = 1− α.En nuestro ejemplo, un intervalo de 95% de credibilidad para θ es (0,430, 0,819).

¾Cómo interpretamos el intervalo?

El intervalo de credibilidad más corta se llama el intervalo de máxima densidad a

posteriori.

En el ejemplo, el intervalo de máxima densidad a posteriori es (0,439, 0,826).

Estimación por intervalos

Un intervalo de 100(1− α) % de credibilidad es cualquier intervalo (a, b) tal queP (a < θ < b|datos) = 1− α.En nuestro ejemplo, un intervalo de 95% de credibilidad para θ es (0,430, 0,819).

¾Cómo interpretamos el intervalo?

El intervalo de credibilidad más corta se llama el intervalo de máxima densidad a

posteriori.

En el ejemplo, el intervalo de máxima densidad a posteriori es (0,439, 0,826).

Contrastes y selección de modelos

En principio, hacer contrastes a la bayesiana es fácil. Dada distribuciones a priori,P(H0) y P(H1) = 1− P(H0), se puede calcular las probabilidades a posteriori:

P(H0|datos) ∝ f (datos|H0)P(H0) ∝ P(H0)

∫f (datos|H0, θ)f (θ|H0) dθ

Luego, dada una regla de decisión, se puede decidir rechazar H0 o no.

En principio, podemos utilizar las mismas técnicas para seleccionar modelos:�jadas las probabilidades a priori de cada modelo, calculamos las probabilidades aposteriori y seleccionar el modelo más probable.

Ejemplo

Supongamos que queremos contrastar H0 : θ ≤ 0,5 frente a H1 : θ > 0,5.

Dada la a priori Beta(5, 5) empleada anteriormente, entonces

P(H0) =∫0,5

0f (θ) dθ = 0,5 y luego, a posteriori,

P(H0|datos) =

∫0,5

B(14, 8)θ14−1(1− θ)8−1 dθ = 0,0946.

Dada la regla de decisión de rechazar H0 si su probabilidad a posteriori es menorque 0,05, no rechazariamos esta hipótesis.

¾Hay algún problema con este idea?

Predicción

Supongamos que queremos predecir el valor de una nueva variable Y . Entonces,

f (y |datos) =

∫f (y |θ, datos)f (θ|datos) dθ

y en muchas aplicaciones, Y es condicionalmente independiente de los datos dadoθ, y luego:

f (y |datos) =

∫f (y |θ)f (θ|datos) dθ.

Ejemplo

Supongamos que queremos calcular la distribución del X = el número de crucesen 10 más tiradas de la moneda.

Tenemos X |θ ∼ Binomial(10, θ), y θ|datos ∼ Beta(14, 8). Entonces:

P(X = x |datos) =

)θx(1− θ)10−x 1

B(14, 8)θ14−1(1− θ)8−1 dθ

B(14, 8)

θ14+x−1(1− θ)18−x−1 dθ

)B(14+ x , 18− x)

B(14, 8)

B(14+ x , 18− x)θ14+x−1(1− θ)18−x−1 dθ

)B(14+ x , 18− x)

B(14, 8)para x = 0, 1, ..., 10.

Ejemplo

Supongamos que queremos calcular la distribución del X = el número de crucesen 10 más tiradas de la moneda.

Tenemos X |θ ∼ Binomial(10, θ), y θ|datos ∼ Beta(14, 8). Entonces:

P(X = x |datos) =

)θx(1− θ)10−x 1

B(14, 8)θ14−1(1− θ)8−1 dθ

B(14, 8)

θ14+x−1(1− θ)18−x−1 dθ

)B(14+ x , 18− x)

B(14, 8)

B(14+ x , 18− x)θ14+x−1(1− θ)18−x−1 dθ

)B(14+ x , 18− x)

B(14, 8)para x = 0, 1, ..., 10.

Cálculo de la media de X

El cálculo directo a través de la distribución beta-binomial parece complicado.¾Existe una manera más fácil?

= 10× 14

14 + 8= 6,364.

Cálculo de la media de X

El cálculo directo a través de la distribución beta-binomial parece complicado.¾Existe una manera más fácil?

= 10× 14

14 + 8= 6,364.

Resumen y siguiente sesión

En esta clase, hemos introducido algunas de las ideas básicas de la inferenciabayesiana.

En la siguiente sesión, veremos que si utilizamos una distribución a priori beta enproblemas semejantes al ejemplo de hoy, la inferencia Bayesiana es fácil deimplementar.

Inferencia bayesiana [5mm]...

Documents

INFERENCIA BAYESIANA EN MODELOS DE …argos.pucp.edu.pe/~jlbazan/download/Reporte-25.pdf · Baz an y Bayes 2.Inferencia Bayesiana en el Modelo Lineal En este cap tulo abordamos la

Inferencia bayesiana sobre los parámetros de dispersión genéticos …ri.agro.uba.ar/files/download/tesis/doctorado/2011munillaleguiza... · COMITÉ CONSEJERO Director de tesis

ANÁLISIS DE DATOS MEDIANTE TÉCNICAS ESTADÍSTICAStauja.ujaen.es/bitstream/10953.1/6812/1/TFG_ORTEGA_BONILLA_SA… · correspondiente. 3.2 INFERENCIA BAYESIANA Es ente subapartado

Inferencia Bootstrap bayesiana para una proporción en ...Inferencia Bootstrap bayesiana para una Proporción 33 probabilidad posterior para el para´metro ρy definido como ρy

Enfoque bayesiano en la estimación de área pequeña · Inferencia bayesiana La estadística bayesiana es una forma alternativa a la frecuentista de hacer inferencia sobre los pa-rámetros

INFERENCIA FILOGENÉTICA MEDIANTE SECUENCIAS DE … · inferencia bayesiana, han producido polémicas entre los investigadores que usan caracteres moleculares (secuen- cias de aminoácidos

Modelización e Inferencia Bayesiana aplicada a Clasificación y … · 2014. 9. 15. · Rafael Molina EVIA 2014 15. Modelización Bayesiana Inferencia Bayesiana Basadaen encontrar,

· ... por ejemplo, que la Sanidad ... mediante el empleo de organismos ... de inferencia y decisión bayesiana, que permiten la utilización de información inicial

MÉTODOS ESTADÍSTICOS BAYESIANOS - ITAM - …allman.rhon.itam.mx/~lnieto/index_archivos/NotasMB1.pdf · Tipos de INFERENCIA: Clásica Bayesiana Paramétrica ... CUANTIFICACIÓN de

Curso de Inferencia Bayesiana · adscritos al ISPA. Una vez realizada la preinscripción se confirmará por correo electrónico y se indicará el procedimiento de pago. INSCRIPCIÓN

FINBA – Fundación para la investigación y la innovación ... · promoción de la estadística Bayesiana como mejor método de inferencia estadística. Por ello, ofertamos ahora

Introducción a la Inferencia Bayesiana Probabilidadusers.df.uba.ar/alejo/materias/InferenciaBayesiana/... · Introducción a la Inferencia Bayesiana Probabilidad. Repaso de probabilidad

Distribuciones conjugadas: cuando la inferencia bayesiana ...halweb.uc3m.es/esp/Personal/personas/mwiper/docencia/Spanish/In… · Distribuciones conjugadas: cuando la inferencia

Inferencia bayesiana de filogenias - ccg.unam.mxvinuesa/tlem/docs/Inferencia_Bayesiana_de... · • En la estadística bayesiana, en cambio, se considera la evidencia en favor de

ANTROPOMETRÍA CRANEOFACIAL EN NIÑOS DE 0 A 4 AÑOS- … · Crecimiento y Desarrollo Craneofacial Inferencia Bayesiana Universidad Nacional de Colombia Universidad Nacional de Colombia

UNIDAD ACADÉMICA COCHABAMBA PLANIFICACIÓN · PDF fileTEORIA BAYESIANA 8.1. Probabilidad y teorema de Bayes 8.2. Información a priori 8.3. Inferencia Bayesiana e intérvalos de confianza

Análisis de Influencia en el modelo de regresión Beta por Inferencia Bayesiana

2.3. An¶alisis bayesiano para datos normales - …nunez/mastertecnologiastelecomunicacion/Tema2... · 88 Inferencia bayesiana 2.3.1. Caso de media desconocida y varianza conocida:

Inferencia clásica o frecuentista [5mm] [height=2in ...halweb.uc3m.es/esp/Personal/personas/mwiper... · La inferencia clásica se basa en el uso de la interpretación frecuentista

Squalius pyrenaicus Squalius malacitanus - DIGITAL.CSIC: Homedigital.csic.es/bitstream/10261/128595/1/MartaCoboBilbao.pdf · análisis de Inferencia Bayesiana con el programa MrBayes