15
Instituto Tecnológico de León Material didáctico/Pruebas de Bondad de Ajuste Elaboró: Lic. Lilia Angélica Vázquez Gutiérrez Página 1 4 PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO PARAMÉTRICAS En la unidad 2 se analizaron datos a escala de intervalo, en la unidad 3 se realizaron pruebas de hipótesis respecto de una sola media de población y dos medias de población. Para estas pruebas supusimos que las poblaciones siguen una distribución de probabilidad normal. Sin embargo hay pruebas en las cuales no es necesaria una suposición respecto a la forma de la población. A estas se les conoce como no paramétricas. Esto significa que no es necesario suponer una población normal. Algunos experimentos generan respuestas que pueden ser ordenadas o clasificadas, pero el valor real de la respuesta no puede ser medido numéricamente excepto con una escala arbitraria que se puede crear. Puede ser que el experimentador diga sólo si una observación es mayor que otra. Quizá pueda clasificar todo un conjunto de observaciones sin saber en realidad los valores numéricos exactos de las mediciones. Por ejemplo: La experiencia de ventas de cuatro vendedores son clasificadas de la mejor a la peor. Las características de comestible y sabor de cinco marcas de fibra de pasitas son clasificadas en una escala arbitraria de 1 a 5. Cinco diseños de automóvil son clasificados del más atractivo al menos atractivo. ¿Cómo pueden analizarse estos datos? Los métodos de muestra pequeña vistos en la unidad 3 son válidos sólo cuando la(s) población(es) muestreada(s) es (son) normal(es) o aproximadamente normal(es). Los datos formados por rangos de escalas arbitrarias de 1 a 5 no satisfacen la suposición de normalidad. En algunas aplicaciones, las técnicas son válidas si las muestras se toman al azar de entre poblaciones cuyas varianzas son iguales. Cuando los datos no parecen satisfacer éstas y otras suposiciones similares, puede usarse un método alternativo, es decir, métodos estadísticos no paramétricos. Los métodos no paramétricos por lo general satisfacen las hipótesis en términos de distribuciones poblacionales más que parámetros por ejemplo medias y desviaciones estándar. Es frecuente que las suposiciones paramétricas sean sustituidas por suposiciones más generales acerca de las distribuciones poblacionales y las clasificaciones de las observaciones se usen a veces en lugar de las mediciones reales.

UNIDAD 4 PRUEBAS DE BONDAD DE AJUSTE recortado.pdf

Embed Size (px)

Citation preview

Instituto Tecnológico de León

Material didáctico/Pruebas de Bondad de Ajuste Elaboró: Lic. Lilia Angélica Vázquez Gutiérrez Página 1

4 PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO PARAMÉTRICAS

En la unidad 2 se analizaron datos a escala de intervalo, en la unidad 3 se realizaron pruebas de hipótesis respecto de una sola media de población y dos medias de población. Para estas pruebas supusimos que las poblaciones siguen una distribución de probabilidad normal. Sin embargo hay pruebas en las cuales no es necesaria una suposición respecto a la forma de la población. A estas se les conoce como no paramétricas. Esto significa que no es necesario suponer una población normal. Algunos experimentos generan respuestas que pueden ser ordenadas o clasificadas, pero el valor real de la respuesta no puede ser medido numéricamente excepto con una escala arbitraria que se puede crear. Puede ser que el experimentador diga sólo si una observación es mayor que otra. Quizá pueda clasificar todo un conjunto de observaciones sin saber en realidad los valores numéricos exactos de las mediciones. Por ejemplo:

La experiencia de ventas de cuatro vendedores son clasificadas de la mejor a la peor.

Las características de comestible y sabor de cinco marcas de fibra de pasitas son clasificadas en una escala arbitraria de 1 a 5.

Cinco diseños de automóvil son clasificados del más atractivo al menos atractivo.

¿Cómo pueden analizarse estos datos? Los métodos de muestra pequeña vistos en la unidad 3 son válidos sólo cuando la(s) población(es) muestreada(s) es (son) normal(es) o aproximadamente normal(es). Los datos formados por rangos de escalas arbitrarias de 1 a 5 no satisfacen la suposición de normalidad. En algunas aplicaciones, las técnicas son válidas si las muestras se toman al azar de entre poblaciones cuyas varianzas son iguales. Cuando los datos no parecen satisfacer éstas y otras suposiciones similares, puede usarse un método alternativo, es decir, métodos estadísticos no paramétricos. Los métodos no paramétricos por lo general satisfacen las hipótesis en términos de distribuciones poblacionales más que parámetros por ejemplo medias y desviaciones estándar. Es frecuente que las suposiciones paramétricas sean sustituidas por suposiciones más generales acerca de las distribuciones poblacionales y las clasificaciones de las observaciones se usen a veces en lugar de las mediciones reales.

Instituto Tecnológico de León

Material didáctico/Pruebas de Bondad de Ajuste Elaboró: Lic. Lilia Angélica Vázquez Gutiérrez Página 2

4.1.1 PRUEBA DE BONDAD DE AJUSTE: frecuencias esperadas iguales.

La prueba de bondad de ajuste es una de las pruebas estadísticas de uso más común. La primera situación de esta prueba supone el caso en que las frecuencias esperadas de las celdas son iguales. Como su nombre lo indica, el propósito de la prueba de bondad de ajuste es comparar una distribución observada con una distribución esperada. Un ejemplo describirá la situación de una prueba de hipótesis. Ejemplo 1: La señora Jan Kilpatrick es la gerente de marketing de un fabricante de tarjetas deportivas. Ella planea iniciar la venta de una serie de tarjetas con fotografías y estadísticas de juego de ex jugadores de las Ligas Mayores de Béisbol. Uno de los problemas es la selección de ex jugadores. En una exhibición de tarjetas de béisbol en Southwyck Mall el pasado fin de semana, instalo un puesto y ofreció tarjetas de los siguientes seis jugadores miembros del Salón de la Fama: Tom Seaver, Nolan Ryan, Ty Cobb, George Brett, Hank Aaron y Johnny Bench. Al final del día vendió un total de 120 tarjetas. El número de tarjetas vendidas de cada jugador aparece en la tabla 4.1. ¿La señora Kilpatrick puede concluir que las ventas no son iguales por cada jugador?

Jugador Tarjetas vendidas

Tom Seaver 13 Nolan ryan 33 Ty Cobb 14 George Brett 7 Hank Aaron 36 Johnny Bench 17

Total 120

Tabla 4.1 Número de tarjetas vendidas de cada jugador

Si no hay una diferencia significativa en la popularidad de los jugadores, se esperaría que las frecuencias observadas (fo) fueran iguales, o casi iguales. Es decir, se esperaría vender igual número de tarjetas de Tom Seaver que de Nolan Ryan. Por lo tanto, cualquier discrepancia en las frecuencias observada y esperada puede atribuirse al muestreo (casualidad). ¿Qué sucede con el nivel de medición en este problema? Observe que, cuando se vende una tarjeta, la “medición” de la tarjeta se basa en el nombre del jugador. No hay un orden natural para los jugadores. Ningún jugador es mejor que otro. En consecuencia, se utiliza una escala nominal para evaluar cada observación.

Instituto Tecnológico de León

Material didáctico/Pruebas de Bondad de Ajuste Elaboró: Lic. Lilia Angélica Vázquez Gutiérrez Página 3

Como hay 120 tarjetas en la muestra, se espera que (fe) sea 20 tarjetas, es decir, la frecuencia esperada, fe, aparecerá en cada una de las seis categorías (tabla 4.2). Estas categorías se denominan celdas. Un análisis del conjunto de frecuencias observadas en la tabla 4.1 indica que la tarjeta de George Brett no se vende con frecuencia, en tanto que las de Hank Aaron y Nolan Ryan se venden con más frecuencia. ¿Se debe a la casualidad la diferencia en las ventas, o es posible concluir que hay una preferencia por las tarjetas de ciertos jugadores?

Jugador Tarjetas vendidas, fo

Número vendido esperado, fe

Tom Seaver 13 20 Nolan ryan 33 20 Ty Cobb 14 20 George Brett 7 20 Hank Aaron 36 20 Johnny Bench 17 20

Total 120 120

Tabla 4.2 Frecuencias observadas y esperadas de las 120 tarjetas vendidas

SOLUCIÓN: Emplearemos el mismo procedimiento sistemático de cinco pasos visto en la unidad 3 de nuestro curso de estadística. Paso 1: Formulación de hipótesis. La hipótesis nula, Ho, es que no hay diferencia entre el conjunto de frecuencias observadas y el conjunto de frecuencias esperadas, es decir, cualquier diferencia entre los dos conjuntos de frecuencias se puede atribuir al muestreo (casualidad). La hipótesis alternativa, H1, es que hay una diferencia entre los conjuntos observado y esperado de frecuencias. Si rechazamos Ho, significa que las ventas no se distribuyen de igual forma entre las seis categorías (celdas). Paso 2: Seleccionar el nivel de significancia. Seleccionamos el nivel de significancia, para este problema tomaremos 0.05. La probabilidad de que rechacemos la hipótesis nula verdadera es 0.05. Paso 3: Calcular el estadístico de prueba o contraste. El estadístico de prueba sigue la distribución ji cuadrada, designada como:

Instituto Tecnológico de León

Material didáctico/Pruebas de Bondad de Ajuste Elaboró: Lic. Lilia Angélica Vázquez Gutiérrez Página 4

Con k – 1 grados de libertad, donde: k es el número de categorías.

es una frecuencia observada en una categoría en particular. es una frecuencia esperada en una categoría en particular. De las 120 tarjetas vendidas en la muestra, se cuenta el número de veces que se vendieron Tom Seaver y Nolan Ryan, y cada uno de los demás jugadores. Los conteos se registran en la tabla 4.1 Los siguientes son los cálculos para ji cuadrada. (Observe una vez más que las frecuencias esperadas son las mismas para cada celda). Columna 1: Determine las diferencias entre cada y . Es decir, . La

suma de estas diferencias es cero. Columna 2: Eleve al cuadrado la diferencia entre cada frecuencia observada y

esperada, es decir .

Columna 3: Divida el resultado de cada observación entre la frecuencia

esperada. Es decir,

. Finalmente, sume estos valores. El

resultado es el valor de , que es 34.40.

Jugador Tarjetas vendidas,

fo

Número vendido

esperado, fe

(1)

(2)

(3)

Tom Seaver

13 20 -7 49 49/20 = 2.45

Nolan ryan 33 20 13 169 169/20 = 8.45 Ty Cobb 14 20 -6 36 36/20 = 1.80 George Brett

7 20 -13 169 169/20 = 8.45

Hank Aaron

36 20 16 256 256/20 = 12.80

Johnny Bench

17 20 -3 9 9/20 = 0.45

Total 120 120 0 34.40

PASO 4: Formular la regla de decisión. Recordemos que la regla de decisión en las pruebas de hipótesis debemos determinar un número que separe la región donde no se rechaza la Ho de la región de rechazo. Este número se denomina valor crítico. El número de grados de libertad en este tipo de problema se encuentra mediante k – 1, donde k es el número de categorías. En este problema en particular hay seis. Como hay seis categorías, hay k – 1 = 6 – 1 = 5 grados de libertad. Como ya se mencionó, una categoría se denomina celda, por lo que hay seis celdas. El valor crítico para cinco grados de libertad y el nivel de significancia 0.05 es de 11.070, el cual se obtiene de las tablas ji cuadrada.

Instituto Tecnológico de León

Material didáctico/Pruebas de Bondad de Ajuste Elaboró: Lic. Lilia Angélica Vázquez Gutiérrez Página 5

La regla de decisión es rechazar Ho si el valor calculado de ji cuadrada es mayor que 11.070. Si es menor o igual a 11.070, no se rechaza Ho. En la gráfica siguiente se muestra la regla de decisión. La regla de decisión indica que si hay diferencias grandes entre las frecuencias

observada y esperada, lo que genera una calculada mayor que 11.070, se debe rechazar la hipótesis nula. El razonamiento es que es probable que esas diferencias pequeñas entre las frecuencias observada y esperada se deban a la casualidad. Recuerde que las 120 observaciones son una muestra de la población.

PASO 5: Tomar una decisión. La calculada de 34.40 está en la región de rechazo más allá del valor crítico de 11.070. Por tanto, la regla decisión es rechazar Ho con un nivel de significancia de 0.05. La diferencia entre las frecuencias observada y esperada no se debe a la casualidad. Más bien, las diferencias entre fo y fe son lo bastante grandes para considerarse relevantes. La posibilidad de que estas diferencias se deban a un error de muestreo es muy pequeña. Por tanto, se concluye que es improbable que las ventas de tarjetas sean las mismas entre los seis jugadores. PRUEBA DE BONDAD DE AJUSTE: frecuencias esperadas desiguales. Las frecuencias esperadas (fe) en la distribución de las tarjetas de béisbol fueron iguales (20). De acuerdo con la hipótesis nula, se esperaba que una fotografía de Tom Seaver se vendiera de manera aleatoria 20 veces, una de Johnny Bench, 20 veces de 120 intentos, etc. La prueba ji cuadrada también es útil si las frecuencias esperadas no son iguales. El siguiente ejemplo ilustra el caso de frecuencias desiguales y también presenta un uso práctico de la prueba de bondad de ajuste ji cuadrada para determinar si una experiencia local difiere de una experiencia más amplia, la nación estadounidense (por ejemplo). Ejemplo 2: Consideremos un estudio sobre participación en el mercado realizado por la empresa Scott Marketing Research. A lo largo de los años las participaciones en el mercado se han estabilizado en 30% para la empresa A, 50% para la empresa B y 20% para la empresa C. Recién la empresa C ha elaborado un nuevo y mejorado producto para sustituir a uno de sus productos en el mercado

11.070 Escala de Valor crítico

No se Región de rechazo Rechaza Ho 0.05

Instituto Tecnológico de León

Material didáctico/Pruebas de Bondad de Ajuste Elaboró: Lic. Lilia Angélica Vázquez Gutiérrez Página 6

y pidió a la empresa Scott Marketing que determinara si el nuevo producto modificaría su participación en el mercado. SOLUCIÓN: Scott realizará un estudio muestral y calculará la proporción que prefiere el producto de cada empresa. Después aplicará una prueba de hipótesis para ver si el nuevo producto modifica las participaciones en el mercado. (En este caso, la población de interés es multinomial, es decir cada cliente se clasifica como cliente de alguna de las empresas A, B o C, de ahí surge lo multinomial). Denotamos las proporciones así:

PA = participación en el mercado de la empresa A PB = participación en el mercado de la empresa B PC = participación en el mercado de la empresa C

Vamos a suponer que el nuevo producto de la empresa C no modifica las participaciones en el mercado, es decir que son iguales; entonces, las hipótesis nula y alternativa serían las siguientes:

Ho: PA = 0.30, PB = 0.50 y PC = 0.20 H1: Las proporciones poblacionales NO son PA = 0.30, PB = 0.50 y PC = 0.20

Si los resultados muestrales llevan al rechazo de Ho Scott Marketing tendrá evidencias de que la introducción del nuevo producto afecta las participaciones del mercado. Consideremos que para este estudio la empresa de investigación de mercado ha empleado un panel de 200 consumidores. A cada individuo se le pide que indique su preferencia entre el producto de la empresa A, el de la empresa B o el nuevo producto de la empresa C. Las respuestas obtenidas se presentan a continuación en forma resumida:

Producto de la empresa A = 48 Producto de la empresa B = 98 Producto de la empresa C = 54

Ahora se realiza la prueba de bondad de ajuste para determinar si la muestra de las 200 preferencias de los clientes coincide (se ajusta o sea apega) con la hipótesis nula. Dicha prueba de bondad de ajuste se basa en la comparación de los resultados observados con los resultados esperados, bajo la suposición de que la hipótesis nula es verdadera. Por tanto, el siguiente paso consiste en calcular las preferencias esperadas en los 200 clientes, con el supuesto de que PA = 0.30, PB = 0.50 y PC = 0.20.

Frecuencias observadas (fo)

Instituto Tecnológico de León

Material didáctico/Pruebas de Bondad de Ajuste Elaboró: Lic. Lilia Angélica Vázquez Gutiérrez Página 7

FRECUENCIAS ESPERADAS: Producto de la empresa A 200(0.30) = 60 Producto de la empresa B 200(0.50) = 100 Producto de la empresa C 200(0.20) = 40

Como podemos observar, la frecuencia esperada de cada categoría se encuentra multiplicando el tamaño de la muestra, 200, por la proporción hipotética de cada categoría. Como ya se mencionó antes, en la prueba de bondad de ajuste lo que interesa son las diferencias entre frecuencias observadas y esperadas, es decir entre lo que se tiene (observado) y lo que se esperaba tener (esperado). Se requiere de un estadístico de prueba o de contraste para poder decir si se rechaza o no la hipótesis nula, dicho estadístico se calcula con la siguiente fórmula:

Donde: fo = frecuencia observada en la categoría 1 fe = frecuencia esperada en la categoría 1 Nota: el estadístico de prueba tiene una distribución ji cuadrada con k-1 grados de libertad, siempre que en todas las categorías las frecuencias esperadas sean 5 o más. Veamos cómo desarrollar la formula anterior del estadístico de prueba: Categoría Proporción

Hipotética Frecuencia Observada

(fo)

Frecuencia esperada

(fe)

Diferencia

(fo-fe)

Cuadrado de la

diferencia (fo-fe)

2

Cuadrado de la

diferencia dividido entre fe (fo-fe)

2/fe

Empresa A 0.30 48 60 -12 144 2.4

Empresa B 0.50 98 100 -2 4 0.04

Empresa C 0.20 54 40 14 196 4.90

200 =7.34

Como ya sabemos, la prueba de bondad de ajuste siempre es una prueba de una cola, en la que el rechazo se presenta en la cola superior de la distribución ji cuadrada.

Ahora debemos obtener el valor crítico usando las tablas de distribución ; así que considerando que tenemos un nivel de significancia de 0.05 y que los grados de libertad son K-1 o sea 3-1, el valor de las tablas es:

5.991

Instituto Tecnológico de León

Material didáctico/Pruebas de Bondad de Ajuste Elaboró: Lic. Lilia Angélica Vázquez Gutiérrez Página 8

Por medio de la gráfica podemos ver que decisión es la que deberemos tomar respecto de la hipótesis nula; por lo que graficamos tanto el valor crítico como el estadístico de contraste quedando de la siguiente manera: Como lo vimos anteriormente, la regla de rechazo de la cola superior es:

Rechazar Ho si ≥ 5.991 En la gráfica podemos ver claramente que la regla de rechazo se cumple, es decir

, por lo tanto rechazamos Ho.

Y se concluye que el nuevo producto de la empresa C sí modifica la estructura de la participación de mercado.

4.1.2 PRUEBA DE INDEPENDENCIA Y TABLAS DE CONTINGENCIA

Otra aplicación importante de la distribución ji cuadrada es el empleo de datos muestrales para probar la independencia de dos variables. Para ilustrar la prueba de independencia se considera la prueba de independencia realizada por la cervecería Cuauhtémoc Moctezuma de México. Esta cervecería produce y distribuye tres tipos de cerveza: ligera, clara y oscura. Al analizar los segmentos de mercado de las tres cervezas, el grupo de investigación de mercado de la empresa se preguntó si las preferencias de los consumidores por estos tipos de cerveza diferían entre hombres y mujeres. En caso de que las preferencias fueran independientes del género del consumidor, iniciarían una campaña publicitaria para todas las cervezas de la Cuauhtémoc Moctezuma. Pero, si las preferencias por los distintos tipos de cerveza dependían del género del consumidor, la empresa ajustaría sus promociones a los mercados. Para determinar si la preferencia por un tipo de cerveza (ligera, clara u oscura) era independiente del género del consumidor (hombre o mujer) se usó una prueba de independencia. Las hipótesis para esta prueba de independencia fueron:

Instituto Tecnológico de León

Material didáctico/Pruebas de Bondad de Ajuste Elaboró: Lic. Lilia Angélica Vázquez Gutiérrez Página 9

: La preferencia por un tipo de cerveza es independiente del género del consumidor.

: La preferencia por un tipo de cerveza NO es independiente del género del consumidor Para describir la situación a estudio usaremos la siguiente tabla:

Cerveza preferida Ligera Clara Oscura

Género Hombre Celda (1,1) Celda (1,2) Celda (1,3) mujer Celda (2,1) Celda (2,2) Celda (2,3)

Después de identificar la población como todos los consumidores de cerveza, hombres y mujeres, se toma una muestra y a cada individuo se le pide que indique cuál de las tres cervezas Cuauhtémoc Moctezuma prefiere. Cada individuo pertenecerá a una de las seis celdas de la tabla. Así, por ejemplo, se puede tener un individuo que sea hombre y que prefiera la cerveza clara (celda (1,2)), o una mujer que prefiera la cerveza ligera (celda (2,1)), o una mujer que prefiera la cerveza oscura (celda (2,3)), etc. Dado que en la tabla se han enumerado todas las posibles combinaciones de cerveza preferida y género o, en otras palabras, todas las posibles contingencias, a la tabla anterior se le llama TABLA DE CONTINGENCIA. Como en la prueba de independencia se usa el formato de las tablas de contingencia, a esta prueba también se le suele llamar prueba de tabla de contingencia. Suponga que toma una muestra aleatoria simple de 150 consumidores de cerveza. Cada individuo de la muestra prueba los tres tipos de cerveza y después se le pide que indique cuál prefiere o cuál es su primera elección. En la siguiente tabla se tabulan las respuestas obtenidas en el estudio:

Cerveza preferida Ligera Clara Oscura Total

Género Hombre 20 40 20 80 Mujer 30 30 10 70 Total 50 70 30 150

4.3 Tabla con frecuencias observadas

Los datos para la prueba de independencia se obtienen contando las cantidades o frecuencias correspondientes a cada celda o categoría. De las 150 personas que formaban la muestra, 20 hombres prefirieron la cerveza ligera, 40 hombres prefirieron la cerveza clara, 20 hombres prefirieron la cerveza oscura, etc. Los datos de esta tabla son las frecuencias observadas para cada una de las seis clases o categorías. Si determina las frecuencias esperadas bajo la suposición de independencia entre cerveza preferida y género del consumidor, se puede

Instituto Tecnológico de León

Material didáctico/Pruebas de Bondad de Ajuste Elaboró: Lic. Lilia Angélica Vázquez Gutiérrez Página 10

emplear la distribución ji cuadrada para establecer si existe diferencia significativa entre las frecuencias observadas y las esperadas. Las frecuencias esperadas para las celdas de la tabla de contingencia se basan en la idea siguiente: Primero, se supone que la hipótesis nula es verdadera, es decir, que la cerveza preferida es independiente del género del consumidor. Segundo, se observa que en toda la muestra de 150 consumidores de cerveza, 50 prefirieron la cerveza ligera, 70 la clara y 30 la oscura. En términos de proporciones se concluye que 50/150 = 1/3 de los consumidores prefirió la cerveza ligera, 70/150 =7/15 prefirieron la cerveza ligera y 30/150 =1/5 prefirió la oscura. Si la suposición de independencia es correcta, estas proporciones serán las que se observen tanto entre los hombres como entre las mujeres. Por consiguiente, bajo la suposición de independencia, es de esperarse que en la muestra de 80 consumidores del sexo masculino, (1/3)(80)=26.67 prefieran la cerveza ligera, (7/15)(80)=37.33 prefieran la cerveza clara y (1/5)(80)=16 prefieran la oscura. Aplicando las proporciones correspondientes a los 70 consumidores del sexo femenino, se obtienen las frecuencias esperadas que se muestran a continuación.

Cerveza preferida Ligera Clara Oscura Total

Género Hombre 26.67 37.33 16.00 80 Mujer 23.33 32.67 14.00 70 Total 50 70 30 150

4.4 Tabla con frecuencias esperadas

Sea la frecuencia esperada en el renglon i columna j de la tabla de

contingencia. Mediante dicha notación, ahora se reconsiderará el calculo de la frecuencia esperada correspondiente a los hombres (renglón i=1) que prefieren la

cerveza clara (columna j=2); es decir, la frecuencia esperada . Siguiendo el argumento anterior para el cálculo de las frecuencias esperadas, se ve que

Observe que en esta expresión, 80 es el número total de hombres (total del renglón 1), 70 es la cantidad total de individuos que prefieren la cerveza clara (total de la columna 2) y 150 es el tamaño total de la muestra. De lo que se ve que:

Instituto Tecnológico de León

Material didáctico/Pruebas de Bondad de Ajuste Elaboró: Lic. Lilia Angélica Vázquez Gutiérrez Página 11

La generalización de esta expresión lleva a la fórmula siguiente para obtener las frecuencias esperadas en una tabla de contingencia para una prueba de independencia. Al aplicar esta fórmula para los consumidores hombres que prefieren cerveza

oscura, se encuentra que la frecuencia esperada es

, tal

como vemos en la tabla de frecuencias esperadas anterior. El procedimiento de prueba para comparar las frecuencias esperadas con las frecuencias observadas es semejante a los cálculos para la prueba de bondad de ajuste vista al principio de esta unidad. En concreto, el valor ji cuadrada que se basa en frecuencias observadas y esperadas se calcula como se indica a continuación: La doble sumatoria de la ecuación anterior indica que el cálculo debe hacerse con todas las celdas que aparecen en la tabla de contingencia. En las frecuencias esperadas que aparecen en la tabla de ellas, se ve que en cada categoría la frecuencia esperada es de 5 o más. Por tanto se puede proceder a calcular el estadístico de prueba ji cuadrada, como veremos a continuación.

FRECUENCIAS ESPERADAS EN UNA TABLA DE CONTINGENCIA BAJO LA SUPOSICIÓN DE INDEPENDENCIA

ESTADÍSTICO DE PRUEBA PARA INDEPENDENCIA:

Donde: = frecuencia observada en la categoría del renglón i columna j de la tabla de

contingencia. = frecuencia esperada en la categoria del renglón i columna j de la tabla de contingencia,

basada en la suposición de independencia. Nota: Si una tabla de contingencia tiene n renglones y m columnas, el estadístico de prueba tiene una distribución ji cuadrada con (n-1)(m-1) grados de libertad, siempre y cuando en todas las categorías las frecuencias esperadas sean cinco o más.

Instituto Tecnológico de León

Material didáctico/Pruebas de Bondad de Ajuste Elaboró: Lic. Lilia Angélica Vázquez Gutiérrez Página 12

CÁLCULO DEL ESTADÍSTICO DE PRUEBA JI-CUADRADA PARA DETERMINAR SI LA PREFERENCIA POR UN TIPO DE CERVEZA ES INDEPENDIENTE DEL GÉNERO DEL CONSUMIDOR Cerveza

preferida Frecuencia observada

Frecuencia esperada

Diferencia (

(

Hombre Ligera 20 26.67 -6.67 44.44 1.67 Hombre Clara 40 37.33 2.67 7.11 0.19 Hombre Oscura 20 16.00 4.00 16.00 1 Mujer Ligera 30 23.33 6.67 44.44 1.90 Mujer Clara 30 32.67 -2.67 7.11 0.22 Mujer Oscura 10 14.00 -4.00 16.00 1.14

Total 150 X2= 6.12

Como se observa, el valor del estadístico de prueba es X2= 6.12. El número de grados de libertad para la distribución ji cuadrada adecuada se obtiene multiplicando el número de renglones menos 1 por el número de columnas menos 1. Debido a que se tienen dos renglones y tres columnas, los grados de libertad son (2-1)(3-1)=2. Como ocurre en la prueba de bondad de ajuste, en la prueba de independencia se rechaza Ho si las diferencias entre frecuencias observadas y esperadas dan un valor grande del estadístico de prueba. De manera que la prueba de independencia es también una prueba del extremo superior. Considerando un nivel de significancia de 0.05 y por medio de las tablas de

distribución se obtiene el valor crítico, para este caso en particular se tiene que

=5.992, contra

= 6.12 se rechaza la hipótesis nula y se concluye que la preferencia por una cerveza no es independiente del género del consumidor. Mediante una comparación informal de las frecuencias observadas y esperadas se obtiene una idea de la dependencia entre cerveza preferida y género. Al observar las tablas de frecuencias observas y esperadas resalta que en los consumidores de sexo masculino las frecuencias observadas en la preferencia por cervezas clara y oscura son más altas que las frecuencias esperadas, mientras que en las mujeres la frecuencia observada en la preferencia por cerveza ligera es mayor que en la frecuencia esperada. Dichas observaciones permiten comprender las diferentes preferencias por cerveza entre los hombres y las mujeres. A continuación se resumen los pasos para una prueba de tabla de contingencia para independencia.

Instituto Tecnológico de León

Material didáctico/Pruebas de Bondad de Ajuste Elaboró: Lic. Lilia Angélica Vázquez Gutiérrez Página 13

El estadístico de prueba para las pruebas ji cuadrada de esta sección requiere una frecuencia esperada de cinco o más en cada categoría. Si en una categoría la frecuencia esperada es menor que cinco, es conveniente combinar dos categorías adyacentes para tener una frecuencia esperada de cinco o más en cada categoría. LIMITACIONES DE JI CUADRADA Si en una celda existe una frecuencia esperada pequeña inusual, ji cuadrada puede generar una conclusión errónea. Esto sucede debido a que fe aparece en el denominador y, al dividirlo entre un número muy pequeño, hace el cociente muy grande. Cómo proceder cuando las frecuencias de las celdas son pequeñas: para más de dos celdas, no se deberá utilizar ji cuadrada si más de 20% de las celdas fe tiene frecuencias esperadas menores de 5. Consideremos los siguientes datos:

Nivel de administración fo fe

Capataz 30 32 Supervisor 110 113 Gerente 86 87 Gerencia de nivel medio 23 24 Asistente de vicepresidente 5 2 Vicepresidente 5 4 Vicepresidente ejecutivo 4 1

Total 263 263 Observemos en la tabla anterior que tres de las siete celdas, o sea el 43%, tienen frecuencias esperadas (fe) menores que 5.

1. Establecer las hipótesis nula y alternativa: : La preferencia por un tipo de cerveza es independiente del género del consumidor. : La preferencia por un tipo de cerveza NO es independiente del género del consumidor

2. Seleccionar una muestra aleatoria y anotar en cada celda de la tabla de contingencias las frecuencias observadas.

3. Emplear la ecuación dada para calcular las frecuencias esperadas de cada celda. 4. Utilizar la ecuación correspondiente para calcular el estadístico de prueba o contraste. 5. Regla de rechazo: Rechazar Ho si

Donde: α es el nivel de significancia, y los n renglones y las m columnas dan los (n-1)(m-1) grados de libertad.

Instituto Tecnológico de León

Material didáctico/Pruebas de Bondad de Ajuste Elaboró: Lic. Lilia Angélica Vázquez Gutiérrez Página 14

Si realizamos la prueba de bondad de ajuste haciendo caso omiso a que tres celdas son pequeñas, el resultado sería:

Nivel de administración fo fe (fo-fe) (fo-fe)2 (fo-fe)

2/ fe

Capataz 30 32 -2 4 0.125 Supervisor 110 113 -3 9 0.080 Gerente 86 87 -1 1 0.011 Gerencia de nivel medio 23 24 -1 1 0.042 Asistente de vicepresidente 5 2 3 9 4.500 Vicepresidente 5 4 1 1 0.250 Vicepresidente ejecutivo 4 1 3 9 9.000

= 14.008

Para esta prueba, con un nivel de significancia de 0.05, rechace Ho si el valor calculado de ji cuadrada es mayor que 12.592. Como vemos, el valor calculado es 14.01, por tanto, se rechaza la hipótesis nula de que las frecuencias observadas representan una muestra aleatoria de la población de los valores esperados. Retomando la tabla anterior notemos que más de 98% del valor calculado de ji cuadrada se explica por las tres categorías de vicepresidentes ([4.500 + 0.250 + 9.000] / 14.008 = 0.9815). Lo cual es lógico, pues a estas tres categorías se les dio mucha ponderación. El dilema anterior se resuelve al combinar categorías si es lógico hacerlo. En el ejemplo anterior combinaremos tres categorías de vicepresidentes, lo que satisface la directriz de 20%. Así tenemos:

Nivel de administración fo fe

Capataz 30 32 Supervisor 110 113 Gerente 86 87 Gerencia de nivel medio 23 24 Vicepresidente 14 7

Total 263 263 El valor calculado de ji cuadrado con las categorías combinadas es 7.26 como veremos a continuación.

Nivel de administración fo fe (fo-fe) (fo-fe)2 (fo-fe)

2/ fe

Capataz 30 32 -2 4 0.125 Supervisor 110 113 -3 9 0.080 Gerente 86 87 -1 1 0.011 Gerencia de nivel medio 23 24 -1 1 0.042 Asistente de vicepresidente 14 7 7 49 7.000

= 7.258

Instituto Tecnológico de León

Material didáctico/Pruebas de Bondad de Ajuste Elaboró: Lic. Lilia Angélica Vázquez Gutiérrez Página 15

Este valor es menor que el valor crítico de 9.488 para el nivel de significancia 0.05. Por tanto, la hipótesis nula no se rechaza con el nivel de significancia de 0.05. Esto indica que no hay una diferencia relevante entre la distribución observada y la esperada.