20
Ejercicios de estadística INSTRUCCIONES: Elija la metodología adecuada según el problema planteado. Se debe utilizar software estadístico en el caso en que la metodología elegida se encuentre implementada. 1. Visa Card USA estudió la frecuencia con que los consumidores de diversos rangos de edades usan tarjetas plásticas (de crédito o de débito) al pagar sus compras (Associated Press, 16 de enero de 2006). A continuación se presentan los datos muestrales de 300 clientes divididos en cuatro grupos de edades Grupo de edad Forma de pago 18- 24 25-34 35- 44 45 y más Plástico 21 27 27 36 Efectivo o cheque 21 36 42 90 Tabla - 1 Pruebe la independencia entre el método de pago y el grupo de edad. ¿Cuál es el valor p? Usando un nivel de significancia del 0.05 ¿Cuál es su conclusión? Respuesta: Ho: La forma de pago y el grupo edad de la Tabla - 1 son independientes. Ha: La forma de pago y el grupo edad de la Tabla - 1 no son independientes. Usando Minitab, según el texto "Estadística para Negocios y economía" por Anderson, Sweeney, y Williams (libro utilizado en clase por la profesora), se ingresan los valores de la Tabla - 1, y se hace clic sobre el menú Prueba Chi-cuadrada (tabla de dos factores en hoja de trabajo)..., como se indica en la Fig. 1

Recup. parcial2

Embed Size (px)

Citation preview

Page 1: Recup. parcial2

Ejercicios de estadística

INSTRUCCIONES:

Elija la metodología adecuada según el problema planteado. Se debe utilizar software estadístico en el caso en que la metodología elegida se encuentre implementada.

1. Visa Card USA estudió la frecuencia con que los consumidores de diversos rangos de edades usan tarjetas plásticas (de crédito o de débito) al pagar sus compras (Associated Press, 16 de enero de 2006). A continuación se presentan los datos muestrales de 300 clientes divididos en cuatro grupos de edades

Grupo de edad

Forma de pago 18-24 25-34 35-44 45 y más

Plástico 21 27 27 36

Efectivo o cheque 21 36 42 90

Tabla - 1

Pruebe la independencia entre el método de pago y el grupo de edad. ¿Cuál es el valor p? Usando un nivel de significancia del 0.05 ¿Cuál es su conclusión?

Respuesta:

Ho: La forma de pago y el grupo edad de la Tabla - 1 son independientes.

Ha: La forma de pago y el grupo edad de la Tabla - 1 no son independientes.

Usando Minitab, según el texto "Estadística para Negocios y economía" por Anderson, Sweeney, y Williams (libro utilizado en clase por la profesora), se ingresan los valores de la Tabla - 1, y se hace clic sobre el menú Prueba Chi-cuadrada (tabla de dos factores en hoja de trabajo)..., como se indica en la Fig. 1

Page 2: Recup. parcial2

Fig. 1

Desde el menú Enviar sección a Microsoft Word, Fig. 2, se obtiene los resultados que se indican abajo.

Fig. 2

Page 3: Recup. parcial2

Prueba Chi-cuadrada: 18-24; 25-34; 35-44; 45 y más

Los conteos esperados se imprimen debajo de los conteos observadosLas contribuciones Chi-cuadradas se imprimen debajo de los conteos esperados

18-24 25-34 35-44 45 y más Total 1 21 27 27 36 111 15,54 23,31 25,53 46,62 1,918 0,584 0,085 2,419

2 21 36 42 90 189 26,46 39,69 43,47 79,38 1,127 0,343 0,050 1,421

Total 42 63 69 126 300

Chi-cuadrada = 7,947; GL = 3; Valor P = 0,047

En donde: 1 se refiere a la forma de pago Plástico y 2 a la forma de pago Efectivo o cheque.

El Valor p, como se indica en los resultados es de 0,047.

Conclusión: Usando un nivel de significancia del 0,05, se observa que el Valor p (de 0,047) no supera este nivel, por lo tanto se rechaza la hipótesis nula Ho.

2 . El número de llamadas telefónicas que llegan por minuto al conmutador de una empresa tiene una distribución de Poisson. Use un nivel de significancia del 10% y los siguientes datos para probar esta suposición

Número de llamadas por minutos 0 1 2 3 4 5 6

Frecuencia observada 15 31 20 15 13 4 2

Respuesta:

Ho: El número de llamadas telefónicas que llegan por minuto al conmutador tiene una distribución Poisson.

Ha: El número de llamadas telefónicas que llegan por minuto al conmutador no tiene una distribución Poisson.

= 0,1

Con esta información se construye la siguiente tabla, baso en el método de prueba de bondad y ajuste de la distribución de Poisson(ampliar para mejor visibilidad):

Page 4: Recup. parcial2

Número de llamadas por minutos

Frecuencia observada

numero de llamadas por

frecuencia observada

probabilidad de poisson

Numero esperado de

2 minutos con x

llamadas(100f(x)

Freecuencia Observada(fi

)Frecuencia

esperada(ei)

Cuadrado de la

diferencia(fi-ei)^2

Cuadrado de la diferencia dividido entre la frecuencia espererada

0 15 0 0,1353 13,53 15 13,53 2,15 0,161 31 31 0,2707 27,07 31 27,07 15,47 0,572 20 40 0,2707 27,07 20 27,07 49,94 1,853 15 45 0,1804 18,04 15 18,04 9,27 0,514 13 52 0,0902 9,02 13 9,02 15,82 1,755 4 20 0,0361 3,61 6 5,27 0,54 0,106 2 12 0,0120 1,20

7 o más 0,0045 0,45

Total 100 200chi-

cuadradogrados de

libertadp-

valorµ 2 0,9955 100,00 100 100,0000 4,95 4,00 0,2929e 2,718281828

Conclusiones:

Dado que el p-valor (0,2929) es mayor que α(0,1) se concluye que no se rechaza la hipótesis nula Ho, es decir, que el número de llamadas telefónicas que llegan por minuto al conmutador tiene una distribución Poisson.

3. Las siguientes son las calificaciones en los exámenes finales en un curso universitario

55 85 72 99 48 71 88 70 59 98 80 74 93 85 74 82 90 71 83 80

60 95 77 84 73 63 72 95 79 51 85 76 81 78 65 75 87 86 70 64

Use un nivel de significancia del 5% y realice una prueba para determinar si se debe rechazar que una distribución normal sea representativa de la distribución poblacional de estas calificaciones.

Respuesta:

Se utiliza la herramienta SSPS, y existen dos formas de acceso para ello. Ambos se refieren al procedimiento Prueba de Kolmogorov-Smirnov para una muestra compara la función de distribución acumulada observada de una variable con una distribución teórica determinada, que puede ser la normal, la uniforme, la de Poisson o la exponencial. La Z de Kolmogorov-Smirnov se calcula a partir de la diferencia mayor (en valor absoluto) entre las funciones de distribución acumuladas teórica y observada. Esta prueba de bondad de ajuste contrasta si las observaciones podrían razonablemente proceder de la distribución especificada.

A continuación se muestra primera la secuencia de acceso a esta prueba (cuadros de diálogos antiguos).

Page 5: Recup. parcial2

Fig. 3

Page 6: Recup. parcial2

En la siguiente imagen se muestra la segunda secuencia de acceso a este método, y es el más moderno:

Fig. 3

Esta secuencia lleva a las siguientes ventanas:

Fig. 4

Page 7: Recup. parcial2

Fig. 5

Fig. 6

Los resultados obtenidos de esta prueba son los siguientes.

Page 8: Recup. parcial2

NPAR TESTS

/K-S(NORMAL)=Calificaciones

/STATISTICS DESCRIPTIVES QUARTILES

/MISSING ANALYSIS.

Pruebas no paramétricas

Notas

Resultados creados 26-MAY-2012 20:42:55

Comentarios

Entrada

Conjunto de datos activo Conjunto_de_datos0

Filtro <ninguno>

Peso <ninguno>

Dividir archivo <ninguno>

Núm. de filas del archivo de

trabajo40

Manipulación de los valores

perdidos

Definición de los perdidos

Los valores perdidos

definidos por el usuario será

tratados como perdidos.

Casos utilizados

Los estadísticos para cada

prueba se basan en todos los

casos con datos válidos para

las variables usadas en dicha

prueba.

Sintaxis

NPAR TESTS

/K-

S(NORMAL)=Calificaciones

/STATISTICS

DESCRIPTIVES

QUARTILES

/MISSING ANALYSIS.

Recursos Tiempo de procesador 00:00:00,02

Page 9: Recup. parcial2

Tiempo transcurrido 00:00:00,02

Número de casos

permitidosa196608

a. Basado en la disponibilidad de memoria en el espacio de trabajo.

[Conjunto_de_datos0]

Estadísticos descriptivos

N Media Desviación

típica

Mínimo Máximo Percentiles

25

Calificaciones 40 76,8250 12,42596 48,00 99,00 70,2500

Estadísticos descriptivos

Percentiles

50 (Mediana) 75

Calificaciones 77,5000 85,0000

Prueba de Kolmogorov-Smirnov para una muestra

Calificaciones

N 40

Parámetros normalesa,b

Media 76,8250

Desviación típica 12,42596

Diferencias más extremas

Absoluta ,091

Positiva ,037

Negativa -,091

Z de Kolmogorov-Smirnov ,578

Page 10: Recup. parcial2

Sig. asintót. (bilateral) ,892

a. La distribución de contraste es la Normal.

b. Se han calculado a partir de los datos.

*Nonparametric Tests: One Sample.

NPTESTS

/ONESAMPLE TEST (Calificaciones) KOLMOGOROV_SMIRNOV(NORMAL=SAMPLE )

/MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE

/CRITERIA ALPHA=0.05 CILEVEL=95.

Pruebas no paramétricas

Notas

Resultados creados 26-MAY-2012 20:51:26

Comentarios

Entrada

Conjunto de datos activo Conjunto_de_datos0

Filtro <ninguno>

Peso <ninguno>

Dividir archivo <ninguno>

Núm. de filas del archivo de

trabajo40

Page 11: Recup. parcial2

Sintaxis

NPTESTS

/ONESAMPLE TEST

(Calificaciones)

KOLMOGOROV_SMIRNOV(

NORMAL=SAMPLE )

/MISSING

SCOPE=ANALYSIS

USERMISSING=EXCLUDE

/CRITERIA ALPHA=0.05

CILEVEL=95.

Recursos

Tiempo de procesador 00:00:00,53

Tiempo transcurrido 00:00:00,85

[Conjunto_de_datos0]

Fig. 7

Conclusión:

Los datos suministrados se aproximan a una distribución normal dentro de un nivel de significancia del 5%.

Page 12: Recup. parcial2

4. Con objeto de determinar su efecto en el rendimiento de la gasolina en millas por galón en los automóviles de pasajeros, se prueban dos aditivos para gasolina. A continuación aparecen los resultados de esta prueba en 12 automóviles; en cada automóvil se probaron los dos aditivos. Use un nivel de significancia del 5% y la prueba de los rangos con signo de Wilcoxon para determinar si existe una diferencia significativa entre estos dos aditivos

Automóvil 1 2 3 4 5 6 7 8 9 10 11 12

Aditivo 1 20.12 23.56 22.03 19.15 21.23 24.77 16.16 18.55 21.87 24.23 23.21 25.02

Aditivo 2 18.05 21.77 22.57 17.06 21.22 23.80 17.20 14.98 20.03 21.15 22.78 23.70

Respuesta:

Antes de realizar la prueba de los rangos con signo de Wilcoxon se observa la distribución de los datos para verificar si existe algún tipo de simetría, ya que la prueba asume este tipo de relación entre los datos. Se ha creado un gráfico con estos datos, Fig. 8 , y efectivamente podemos asumir que existe simetría entre los mismos, no siendo sesgadas.

Fig. 8

Otro punto que debe tomarse en cuenta es que la prueba se presenta como alternativa a la t de Student cuando el supuesto de normalidad no es asumible, que es lo que se observa en la Fig. 9.

Automóvil Aditivo 1 Aditivo 2 Diferencia Diferencia Absoluta

Page 13: Recup. parcial2

1 20,12 18,05 2,07 2,07

2 23,56 21,77 1,79 1,79

3 22,03 22,57 -0,54 0,54

4 19,15 17,06 2,09 2,09

5 21,23 21,22 0,01 0,01

6 24,77 23,8 0,97 0,97

7 16,16 17,2 -1,04 1,04

8 18,55 14,98 3,57 3,57

9 21,87 20,03 1,84 1,84

10 24,23 21,15 3,08 3,08

11 23,21 22,78 0,43 0,43

12 25,02 23,7 1,32 1,32

Tabla - 2

A simple vista (ver tabla 1), se puede observar que el rendimiento del automóvil con el Aditivo 1 es mejor que el del Aditivo 2, excepto por los automóviles 3 y 7.

En particular, se usará la prueba de rangos con signo de Wilcoxon para la diferencia entre la mediana de los rendimientos para los dos aditivos usados en las pruebas los 12 automóviles.

Las hipótesis son las siguientes, para un nivel de significancia del 5%.

Ho: Existe una diferencia significativa entre las medianas de los rendimientos producidos por los dos aditivos.

Ha: No existe una diferencia significativa entre las medianas de los rendimientos producidos por los dos aditivos.

Usando SPSS, se siguen los siguientes pasos:

Page 14: Recup. parcial2

Fig. 9

Fig. 10

Page 15: Recup. parcial2

Fig. 11

Los primeros resultados que nos devuelve SPSS, son los siguientes:

*Nonparametric Tests: Related Samples.

NPTESTS

/RELATED TEST(Aditivo1 Aditivo2) WILCOXON

/MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE

/CRITERIA ALPHA=0.05 CILEVEL=95.

Pruebas no paramétricas

Notas

Resultados creados 27-MAY-2012 08:41:15

Comentarios

Page 16: Recup. parcial2

Entrada

Conjunto de datos activo Conjunto_de_datos0

Filtro <ninguno>

Peso <ninguno>

Dividir archivo <ninguno>

Núm. de filas del archivo de

trabajo12

Sintaxis

NPTESTS

/RELATED TEST(Aditivo1

Aditivo2) WILCOXON

/MISSING SCOPE=ANALYSIS

USERMISSING=EXCLUDE

/CRITERIA ALPHA=0.05

CILEVEL=95.

Recursos

Tiempo de procesador 00:00:00,25

Tiempo transcurrido 00:00:00,24

[Conjunto_de_datos0]

Nótese que SPSS rechaza la hipótesis nula de que la diferencia entre ambos redimientos es cero. Por lo que SSPS considera como hipótesis nula, lo que para la respuesta de este ejercicio es la hipótesis alterna.

Para observar los resultados con más detalle, SSPS nos da los siguientes resultados:

[Conjunto_de_datos0]

Page 17: Recup. parcial2

Rangos

N Rango promedio Suma de rangos

aditivo2 - aditivo1

Rangos negativos 10a 7,00 70,00

Rangos positivos 2b 4,00 8,00

Empates 0c

Total 12

a. aditivo2 < aditivo1

b. aditivo2 > aditivo1

c. aditivo2 = aditivo1

Estadísticos descriptivos

N Media Desviación

típica

Mínimo Máximo Percentiles

25 50 (Mediana) 75

Aditivo1 12 21,6583 2,73926 16,16 25,02 19,3925 21,9500 24,0625

Aditivo2 12 20,3592 2,89744 14,98 23,80 17,4125 21,1850 22,7275

Page 18: Recup. parcial2

Estadísticos de contrastea

aditivo2 -

aditivo1

Z -2,432b

Sig. asintót. (bilateral) ,015

Sig. exacta (bilateral) ,012

Sig. exacta (unilateral) ,006

Probabilidad en el punto ,001

a. Prueba de los rangos con signo de Wilcoxon

b. Basado en los rangos positivos.

Conclusión: 

Como el P-valor es 0,012 (ver resultados en rojo, página anterior) y el nivel de significancia es de

5%(0,05) , es decir que 0,012< 0,05, entonces nos quedamos con la hipótesis que indica que no hay

diferencia significativa entre el rendimiento de los dos aditivos. Para SPSS, ésta es la hipótesis

alternativa, para la respuesta de este ejercicio es la hipótesis nula, Ho.