46
Curso Estadística Bayesiana Prof: Richard F. Fernández Vásquez [email protected] UNIVERSIDAD NACIONAL DE INGENIERÍA Facultad de Ingeniería Económica, Estadística y Ciencias Sociales Escuela Profesional de Ingeniería Estadística

Inferencia Bayesiana MCMC Winbugs

Embed Size (px)

DESCRIPTION

Inferencia Bayesiana MCMC Winbugs

Citation preview

  • Curso Estadstica Bayesiana

    Prof: Richard F. Fernndez Vsquez [email protected]

    UNIVERSIDAD NACIONAL DE INGENIERA

    Facultad de Ingeniera Econmica, Estadstica y Ciencias Sociales Escuela Profesional de Ingeniera Estadstica

  • Inferencia Bayesiana

    Con el uso de Winbugs

  • Mtodo de Monte Carlo

    El algoritmo de Monte Carlo permite obtener una estimacin y el error estndar para la media posterior de cualquier funcin de los parmetros de inters siempre que sea posible simular valores desde la distribucin posterior.

    Suponga que se desea estimar h() usando su media posterior:

    Se simula una muestra independiente 1; ; m a partir de la distribucin posterior.

    El estimador de Monte Carlo para h() y su error estndar asociado son:

  • WinBUGS (Windows Bayesian inference Using Gibbs Sampling)

    Sofware para hacer anlisis Bayesiano de modelos estadsticos complejos, usando Mtodos Monte Carlo de Cadenas de Markov (MCMC).

    Elementos para especificar un modelo en WinBUGS

    Cdigo con el modelo a simular

    Distribuciones iniciales de los parmetros (nodos)

    Datos

    Valores iniciales de los parmetros

  • WinBUGS

    Para descargar ingrese al siguiente enlace:

    http://www.wcsmalaysia.org/analysis/WinBUGS_install.htm

    Para instalar el programa WinBUGS basta copiar la carpeta WinBUGS en cualquier ubicacin.

    Este programa no proporciona la distribucin a posteriori, sino que genera una muestra de dicha distribucin.

    Si la muestra es muy grande, esta debe ser muy aproximada a la verdadera distribucin.

  • Inferencia Bayesiana

    Esta es la frmula para realizar la inferencia bayesiana sobre un parmetro, sin embargo, para una mayor cantidad de parmetros requiere de mtodos computacionales.

    Las dificultades del enfoque bayesiano son la determinacin de una distribucin a priori y los clculos para obtener la distribucin a posteriori.

  • Inferencia Bayesiana

    Adems, el segundo trmino del lado derecho es la funcin de verosimilitud de la muestra, luego se tiene que:

    Entonces, tenemos la frmula general siguiente para obtener la distribucin a posteriori:

  • Ejemplo 1

    Se desea hacer inferencias estadsticas sobre la proporcin P, de personas que aprueban la gestin de la alcaldesa de Lima.

    Para este fin se tomar una muestra de 40 personas, y se recibir como informacin a X, el nmero de estas personas que aprueban dicha gestin.

    Supongamos que la informacin disponible sobre esta proporcin, previa a la toma de datos, evidencia que sus valores posibles se distribuyen alrededor de 0.5 y con una dispersin promedio de 0.1.

    Luego de tomada la muestra, se registr que 30 de las 40 aprobaban la gestin.

  • Ejemplo 1

    El parmetro que se estima es P, la proporcin de personas que aprueban la gestin de la alcaldesa de Lima es visto como una variable aleatoria.

    El primer paso consiste en determinar una distribucin de probabilidades para P, de modo que exprese la informacin disponible sobre ella, previa a la toma de datos.

    Como P es una proporcin, entonces su rango de valores posibles est entre 0 y 1, por esta razn, podemos pensar en una distribucin beta, es decir:

  • Ejemplo 1

    Los parmetros y los debemos escoger de modo que se refleje la informacin disponible, esto es, que los valores posibles de la proporcin de aceptacin se distribuyen alrededor de 0.5 y con una dispersin promedio de 0.1.

    De esto se obtiene que = = 12.

  • Ejemplo 1

    As, la distribucin a priori de P, es decir, previa a la toma de datos o nueva informacin recibida, est dada por:

    El paso siguiente es determinar la distribucin a posteriori de P, es decir, la distribucin luego de la toma de datos o nueva informacin.

  • Ejemplo 1

    La informacin que se ha recibido corresponde a un valor de la variable aleatoria X, definida como el nmero de personas, entre las 40 pruebas de la muestra, que aprueban la gestin de la alcaldesa de Lima. Ntese que se ha observado que X = 30.

    La distribucin anterior es en realidad la distribucin condicional de X dado P = p, es decir:

  • Ejemplo 1

    La distribucin a posteriori de P, dado que X = 30, la obtenemos de la siguiente manera:

    La distribucin obtenida se identifica fcilmente, se trata de una distribucin beta con parmetros = 42 y = 22. Denotamos esto mediante:

  • Ejemplo 1

    Esta distribucin a posteriori es la inferencia obtenida bajo el enfoque bayesiano.

    Cualquier conclusin o inferencia particular se obtiene de esta distribucin, por ejemplo, veamos cmo obtener una estimacin y un intervalo de confianza del 95% para P.

    Una estimacin muy razonable es la media de la distribucin a posteriori de P, a esta se le denomina la estimacin bayesiana. As:

  • Ejemplo 1

    Un intervalo de confianza del 95% para P, se obtiene fcilmente recordando la definicin de intervalo de confianza.

    En efecto, buscamos dos valores a y b para los cuales la probabilidad de que P se encuentre entre ellos sea 0, 95, es decir:

    En este caso la probabilidad corresponde a la distribucin a posteriori. Por lo tanto, lo anterior es equivalente a que:

  • Ejemplo 1

    De aqu determinamos los valores a y b, lo ptimo es de manera que minimicen la diferencia entre ellos o, como es usual, simplemente por los percentiles 2.5 y 97.5, es decir:

    A partir de la informacin recibida, y con una probabilidad de 0,95, podemos inferir que la proporcin de la aprobacin de la gestin de la alcaldesa de Lima, P, se encuentra entre 0,5366 y 0,7666.

  • 1. Especificar el modelo: remarcar la palabra model, en el programa, y en la barra de opciones elegir Model, en esta opcin escoger Specification

  • En la ventana de especificacin del modelo elegir primero la opcin check model:

  • En la parte inferior de la ventana principal aparecern mensajes sobre el resultado de las acciones pedidas, por ejemplo, que la sintaxis del modelo est correcta.

  • 2. Luego se cargan los datos, para esto se debe remarcar la palabra list y luego presionar sobre la opcin load data:

  • Al cargar los datos aparecer el mensaje correspondiente en la parte inferior de la ventana principal:

  • 3. Luego se compila el programa, al hacerlo aparecer el mensaje de respuesta:

  • 4. Luego se cargan los valores iniciales, previamente se remarca la palabra list del programa, despus aparecer el mensaje correspondiente:

  • 5. Para finalizar esta etapa, se cargan los valores iniciales, previamente se remarca la palabra list:

  • 6. Ahora, se regresa a la barra de opciones de la ventana principal y se escoge la opcin Inference, para definir los parmetros sobre los cuales se har la inferencia bayesiana (es decir, determinar la distribucin a posteriori):

  • 7. Se escoge la opcin Samples

  • Al hacerlo aparecer una ventana con las opciones de muestreo, en esta se escribir el nombre del parmetro para el que se desea determinar la distribucin a posteriori:

  • 8. Despus de escribir el nombre, asignado en el modelo del programa, se presiona sobre la opcin set, as quedar definido el parmetro. Esto se deber hacer para todos los parmetros para los que se desee obtener la distribucin a posteriori.

  • 9. Luego se regresa a la barra de opciones de la ventana principal y se escoge la opcin Model, ahora se ejecuta la actualizacin (update), es decir se generar la muestra aleatoria de la distribucin a posteriori deseada:

  • Aparecer una ventana en la que se indicar el tamao de muestra deseado, el cual est predeterminado como 1000 observaciones de la distribucin a posteriori:

  • 10. Se marca la opcin update para ejecutar, luego aparecer el mensaje correspondiente:

  • 11. Finalmente, se piden los resultados en la opcin Inference, de la barra de opciones principal, con la opcin Samples:

  • 12. En la ventana node se busca el parmetro deseado:

  • 13. Entre las opciones, se escoge stats, para ver las estadsticas de la muestra de la distribucin a posteriori:

  • O, para ver la muestra generada, la opcin coda:

  • Esta muestra se puede insertar en una de hoja de clculo de Excel, para efectuar otros clculos sobre la distribucin a posteriori:

  • Ejemplo 2

    Un procedimiento patrn para ejecutar cierto tipo de tareas muy similares produce tiempos cuya media es desconocida y, segn las caractersticas dadas, es considerada, a priori, como una variable aleatoria M con distribucin normal de media 4 horas y desviacin estndar un dcimo de hora.

    Dado cualquier valor , de M, los tiempos necesarios para ejecutar las tareas siguen una distribucin normal con desviacin estndar media hora.

    Si (X1,X2) = (3, 5; 4, 5) es una muestra aleatoria de tamao 2 de dichos tiempos, veamos cmo proceder con la inferencia bayesiana de la media de la poblacin de los tiempos M.

  • Ejemplo 2

    El primer paso es determinar la distribucin a priori de M, en este caso esta est dada por:

    Y la distribucin de X, dado M = , est dada por:

    Por lo tanto, para determinar la distribucin a posteriori, tenemos que:

  • Ejemplo 2

    Obtenemos:

    Finalmente, se identifica fcilmente la distribucin anterior: se trata de una distribucin normal con media 4 y varianza 1/108. Denotamos esto mediante:

    Veamos cmo obtener una estimacin y un intervalo de confianza del 95% para M.

  • Ejemplo 2

    La estimacin bayesiana del parmetro es la media de su distribucin a posteriori. En este caso:

    La estimacin de Bayes para la media, M, es igual a 4.

  • Ejemplo 2

    En este caso los valores usuales para a y b (que tambin minimizan la diferencia entre ellos) son los percentiles 2,5 y 97,5, es decir:

    A partir de los valores de la muestra disponible, y con una probabilidad de 0,95, podemos inferir que la media, M, se encuentra entre 3,8113 y 4,1886.

  • Ejemplo 2

    Para obtener un intervalo de confianza del 95% para M, buscamos dos valores a y b para los cuales la probabilidad de que P se encuentre entre ellos sea 0,95, es decir:

    En este caso la probabilidad corresponde a la distribucin a posteriori. Por lo tanto, lo anterior es equivalente a que:

  • En WinBUGS

    model {

    for (i in 1:N) { x[i]~ dnorm(mu, 4)

    }

    mu~dnorm(4, 100)

    }

    list(x = c(3.5,4.5), N=2)

  • Preguntas?