21
Bioestadística Prueba Chi-cuadrado

14pruebachi-cuadrado-121120125534-phpapp01.ppt

Embed Size (px)

Citation preview

  • BioestadsticaPrueba Chi-cuadrado

    Roberto Matamoros, MV, MSc, PhD

  • Objetivos del tema Chi-cuadradoConocer en que ocasiones se aplica esta prueba.

    Saber aplicarla e interpretarla

    Criterio de rechazo

    Ejemplos

  • Contexto

  • Prueba de Asociacin: Chi cuadrado c2Mide la relacin entre dos variables nominales. Compara las frecuencias observadas con el modelo terico-matemtico Chi cuadrado (=frecuencias esperadas).

    Medicin: escala nominal (datos cualitativos):s/noResponde a tratamiento/no responde a tratamientonunca/a veces/siempreSobrevivi/no sobreviviCada caso (=persona) es contado slo 1 vez.

  • Distribucin chi-cuadradoCuando se analizan los resultados de una posible relacin, se necesita conocer si los resultados obtenidos se desvan significativamente de los resultados esperados. La prueba de Chi-cuadrado se usa para comparar los resultados observados de los resultados esperados por una hiptesis y si la desviacin obtenida no es significativa y puede atribuirse al azar o es significativa y otras variables diferentes al azar estn influyendo en nuestros resultados.

  • Distribucin chi-cuadrado

    -Nunca adopta valores menores de 0-Es asimtrica positiva.-Es en realidad una familia de curvas, en funcin de los llamados grados de libertad. Es decir, hay una distribucin chi-cuadrado con 1 gl, una distribucin chi-cuadrado con 2 gl, etc. (Nota: Los grados de libertad son siempre nmeros positivos)Grados de libertad df = n 1 ; donde n es el # de posibles combinaciones.-A medida que aumentan los grados de libertad, la distribucin se hace ms y ms simtrica.

  • Prueba chi-cuadrado c2

    Prueba c2 como medida de relacin: El caso de independencia de dos variables cualitativas

    La hiptesis nula ser que ambas variables sean independientes

    Las frecuencias empricas (observadas) son las que tenemos en la tabla de contingencia. Ahora bien, cmo calcular las frecuencias tericas (esperadas)? Lo veremos en un minutoBajo la hiptesis nula (ambas variables independientes), dicho estadgrafo sigue una distribucin chi-cuadrado con (num_filas-1)*(num_columnas-1) grados de libertad

  • Prueba chi-cuadrado c2La independencia de dos variables consiste en que la distribucin de una de las variables es similar sea cual sea el nivel que examinemos de la otra. Esto se traduce en una tabla de contingencia en que las frecuencias de las filas (y las columnas) son aproximadamente proporcionales. Posiblemente sea ms cmodo reconocerlo usando en la tabla de contingencias los porcentajes por filas (o columnas) y observando si estos son similares. Sin embargo, la informacin que se ingresa a la tabla esta relacionada con la frecuencia de presentacin del evento.

  • Prueba chi-cuadrado c2La prueba de independencia ji-cuadrado (chi-cuadrado) contrasta la hiptesis de que las variables son independientes, frente a la hiptesis alternativa de que una variable se distribuye de modo diferente para diversos niveles de la otra.

  • Prueba chi-cuadrado c2Observe la siguiente tabla, en la que en un estudio con escolares de 10 a 12 aos se les pregunt a qu daban ms prioridad de entre tres posibilidades: Tener buenas notas, destacar en los deportes o ser popular entre los compaeros. Tabla de contingencia Sexo * PrioridadRecuento

    PrioridadTotalDeportesNotasPopularSexoNia NioTotal175168101951967538113193184377

  • Prueba chi-cuadrado c2Observe la siguiente grfico

  • Prueba chi-cuadrado c2Si prestamos atencin a la distribucin de las prioridades en porcentajes para cada sexo, tal vez la diferencia sea ms evidente:

  • Prueba chi-cuadrado c2La prueba de chi-cuadrado contrasta si las diferencias observadas entre los dos grupos son atribuibles al azar. En este caso, despus de que usted haga el ejercicio se dar cuenta que se obtiene una significacin cercana al 0%, con lo que para al nivel de significacin habitual del 5%, se rechaza la hiptesis de independencia de las prioridades de los estudiantes y el sexo (las preferencias no se distribuyen del mismo modo entre chicos y chicas). O que las preferencias podran estar relacionadas con el sexo.

  • Usos y aplicacionesTablas de contingencia

  • Limitaciones de la prueba de chi-cuadrado c2El contraste de independencia tiene muy pocas limitaciones, aunque es conveniente hacer algunas observaciones:

  • Limitaciones de la prueba de chi-cuadrado c2Para contrastar la independencia se suele usar el estadgrafo chi-cuadrado. Su clculo se basa en calcular la diferencia entre las observaciones observadas para cada par de modalidades de las variables, y las que seran de esperar en caso de que se satisficiese la condicin de independencia. Para que se pueda considerar correcta la significacin calculada por la prueba, se debe cumplir que las frecuencias esperadas no sean muy pequeas (inferiores a 5) ms que en unas pocas celdas. Si es en muchas celdas donde esto ocurre (ms del 20% por ejemplo) se debe usar una prueba que no incluya aproximaciones, como la prueba exacta de Fisher. Esta la ofrece cualquier programa como opcin cuando se hace este tipo de contrastes.

  • Limitaciones de la prueba de chi-cuadrado c2Si las muestras son muy grandes, la prueba de independencia dar resultados significativos incluso donde, posiblemente, consideremos que las diferencias no sean en realidad clnicamente interesantes.

  • Limitaciones de la prueba de chi-cuadrado c2Si una de las variables es numrica u ordinal, posiblemente queramos hacer algo ms que contrastar la simple independencia. Lo aconsejable es usar pruebas de tipo t-student, andeva u otra prueba estadstica.

  • Limitaciones de la prueba de chi-cuadrado c2El contraste de chi-cuadrado sirve para contrastar la independencia. No hay que considerarla como una medida de la asociacin entre variables. Si buscamos estudiar la asociacin de variables tenemos otros mtodos a nuestra disposicin como la regresin lineal o la logstica que esta incluida en la tabla resumen de pruebas estadsticas pero que no se ver en este curso.

  • Limitaciones de la prueba de chi-cuadrado c2Ejemplo: Se tienen datos demogrficos de ms de 130.000 individuos. De ellos se conoce la edad y el nivel de estudios. Se desea contrastar si el nivel de estudios de la poblacin es similar para los individuos de diferentes edades. La sospecha es que en los individuos ms jvenes, el nivel de estudios es superior. Seguramente una prueba ANDEVA o un modelo de regresin seran ms convenientes.

  • Gracias

    ********************