21
CLASE FRECUENCIA CLASE Xi 0 --5 29 0-5 2.5 5--10 13 5-10 7.5 10--15 11 10-15 12.5 15--20 3 15-20 17.5 20--25 2 20-25 22.5 25--30 1 25-30 27.5 30--35 1 30-35 32.5 CLASE FO MENOS DE 5 29 5-10 13 10-15 11 15-20 3 20-25 2 25-30 1 MÁS DE 30 1 60 1. Los siguientes datos se refieren al tiempo (en minutos) de servir la orden en un restaurante. Aplicar una prueba de ajuste χ2 a una distribución normal con α = 0.05

Clase 5 Prueba de Bondad de Ajuste (3)

Embed Size (px)

Citation preview

Page 1: Clase 5 Prueba de Bondad de Ajuste (3)

CLASE FRECUENCIA CLASE Xi 0 --5 29 0-5 2.5 29 5--10 13 5-10 7.5 13 10--15 11 10-15 12.5 11 15--20 3 15-20 17.5 3 20--25 2 20-25 22.5 2 25--30 1 25-30 27.5 1 30--35 1 30-35 32.5 1

60

CLASE FO PMENOS DE 5 29 0.344

5-10 13 0.28510-15 11 0.22615-20 3 0.10820-25 2 0.03125-30 1 0.005

MÁS DE 30 1 0.00160 1.000

1. Los siguientes datos se refieren al tiempo (en minutos) de servir la orden en un restaurante.

Fobs

Aplicar una prueba de ajuste χ2 a una distribución normal con α = 0.05

Page 2: Clase 5 Prueba de Bondad de Ajuste (3)

XI*FO MEDIA S72.5

7.75

6.25 181.25

46.97 6.85

97.5 56.25 731.25137.5 156.25 1718.7552.5 306.25 918.7545 506.25 1012.5

27.5 756.25 756.2532.5 1056.25 1056.25465 6375

CLASE P (Foi - Fei)^220.647 MENOS DE 5 29 0.344 20.647 69.7717.072 5-10 13 0.285 17.072 16.5913.577 10-15 11 0.226 13.577 6.646.488 MÁS DE 15 7 0.145 8.704 2.901.861 60 1.000 60.0000.320

0.035

Xi2 Xi2 * Fobs S2

FEi FOi FEi

Se debe cumplir que FEi sea ≥ 5

Rechazamos H0, hay evidencia estadística de que los tiempos de servir la orden en un restaurante no siguen una distribución normal.

Page 3: Clase 5 Prueba de Bondad de Ajuste (3)

(Foi - Fei)^2 / Fei3.380.970.490.33

5.173 χ²

3.841 χ²0,05,(4-2-1)

, hay evidencia estadística de que los tiempos de servir la orden en un restaurante

Page 4: Clase 5 Prueba de Bondad de Ajuste (3)

CLASE Xi FO XI*FO0-5 2.5 29 72.5

5-10 7.5 13 97.510-15 12.5 11 137.515-20 17.5 3 52.520-25 22.5 2 4525-30 27.5 1 27.530-35 32.5 1 32.5

60 465

CLASE FO PMENOS DE 5 29 0.475 28.525

5-10 13 0.249 14.96410-15 11 0.131 7.85015-20 3 0.069 4.11820-25 2 0.036 2.16025-30 1 0.019 1.133

MÁS DE 30 1 0.021 1.25060 1.000 60.000

2. Aplicar una prueba de ajuste χ2 a una distribución exponencial con α = 0.05 a los datos del problema 1.

FEi

Page 5: Clase 5 Prueba de Bondad de Ajuste (3)

MEDIA

7.75

CLASE P (Foi - Fei)^2 (Foi - Fei)^2 / FeiMENOS DE 5 29 0.475 28.525 0.23 0.01

5-10 13 0.249 14.964 3.86 0.2610-15 11 0.131 7.850 9.92 1.26

MÁS DE 15 7 0.144 8.661 2.76 0.3260 1.000 60.000 1.849

5.991

FOi FEi

Se debe cumplir que FEi sea ≥ 5

No se Rechaza H0, hay evidencia estadística de que los tiempos de servir la orden en un restaurante siguen (o se ajustan a) una distribución exponencial.

Page 6: Clase 5 Prueba de Bondad de Ajuste (3)

χ²

χ²0,05,(4-1-1)

, hay evidencia estadística de que los tiempos de servir la orden en un

Page 7: Clase 5 Prueba de Bondad de Ajuste (3)

MÁQUINA 1 MÁQUINA 211.1 12.18

11.06 12.3410.87 13.111.07 12.2211.42 11.9610.5 12.23

11.07 11.5411.44 11.9811.29 11.7510.71 12.08

11.5212.85

3. Construir una Q-Q plot para una distribución normal a los datos de la máquina 2 del ejemplo 18 de las lecturas de la semana 8.

Ejemplo 18. Se desea comparar el tiempo de ciclo de dos máquinas que fabrican el mismo producto (el tiempo de ciclo es el tiempo en segundos en que se fabrica una pieza). Se toma una muestra aleatoria de cada máquina obteniendo lo que se indica en la tabla 8.

Podemos ver que los puntos del "Q-Q plot" siguen la trayectoria de la recta de 45°, razón por la cual podriamos decir que los datos se ajustan a una distribución normal.

11.40 11.60 11.80 12.00 12.20 12.40 12.60 12.80 13.00 13.2010.500

11.000

11.500

12.000

12.500

13.000

13.500

Q-Q PLOT PARA LA DISTRIBUCIÓN NORMAL DEL TIEMPO DE CICLO DE LA MÁQUINA 2

Tiempo (s)

Perc

entil

Teó

rico

Page 8: Clase 5 Prueba de Bondad de Ajuste (3)

K MÁQUINA 2(X) Probabilidad Percentil teórico (y)1 11.52 0.042 11.3302 11.54 0.125 11.6043 11.75 0.208 11.7634 11.96 0.292 11.8885 11.98 0.375 11.9966 12.08 0.458 12.0977 12.18 0.542 12.1958 12.22 0.625 12.2969 12.23 0.708 12.404

10 12.34 0.792 12.52811 12.85 0.875 12.68812 13.10 0.958 12.961

MEDIA 12.15S 0.471

Podemos ver que los puntos del "Q-Q plot" siguen la trayectoria de la recta de 45°, razón por la cual podriamos decir que los datos se ajustan a una distribución normal.

11.40 11.60 11.80 12.00 12.20 12.40 12.60 12.80 13.00 13.2010.500

11.000

11.500

12.000

12.500

13.000

13.500

Q-Q PLOT PARA LA DISTRIBUCIÓN NORMAL DEL TIEMPO DE CICLO DE LA MÁQUINA 2

Tiempo (s)

Perc

entil

Teó

rico

Page 9: Clase 5 Prueba de Bondad de Ajuste (3)

MÁQUINA 1 MÁQUINA 211.1 12.18

11.06 12.3410.87 13.111.07 12.2211.42 11.9610.5 12.23

11.07 11.5411.44 11.9811.29 11.7510.71 12.08

11.5212.85

3. Construir una Q-Q plot para una distribución exponencial a los datos de la máquina 2 del ejemplo 18 de las lecturas de la semana 8.

Ejemplo 18. Se desea comparar el tiempo de ciclo de dos máquinas que fabrican el mismo producto (el tiempo de ciclo es el tiempo en segundos en que se fabrica una pieza). Se toma una muestra aleatoria de cada máquina obteniendo lo que se indica en la tabla 8.

Podemos ver que los puntos del "Q-Q plot" no siguen la trayectoria de la recta de 45° razón por la cual podriamos decir que los datos no se ajustan a una distribución exponencial.

11.50 11.70 11.90 12.10 12.30 12.50 12.70 12.90 13.10 13.30-2.000

3.000

8.000

13.000

18.000

23.000

28.000

33.000

38.000

43.000

Q-Q PLOT PARA LA DISTRIBUCIÓN EXPONENCIAL DEL TIEMPO DE CICLO DE LA MÁQUINA 2

Tiempo (s)

Perc

entil

teór

ico

Page 10: Clase 5 Prueba de Bondad de Ajuste (3)

K MÁQUINA 2(X) ProbabilidadPercentil teórico (y)1 11.52 0.042 0.5172 11.54 0.125 1.6223 11.75 0.208 2.8374 11.96 0.292 4.1885 11.98 0.375 5.7096 12.08 0.458 7.4477 12.18 0.542 9.4768 12.22 0.625 11.9139 12.23 0.708 14.965

10 12.34 0.792 19.05211 12.85 0.875 25.25712 13.10 0.958 38.600

MEDIA 12.15

Podemos ver que los puntos del "Q-Q plot" no siguen la trayectoria de la recta de 45° razón por la cual podriamos decir que los datos no se ajustan a una distribución exponencial.

11.50 11.70 11.90 12.10 12.30 12.50 12.70 12.90 13.10 13.30-2.000

3.000

8.000

13.000

18.000

23.000

28.000

33.000

38.000

43.000

Q-Q PLOT PARA LA DISTRIBUCIÓN EXPONENCIAL DEL TIEMPO DE CICLO DE LA MÁQUINA 2

Tiempo (s)

Perc

entil

teór

ico

Page 11: Clase 5 Prueba de Bondad de Ajuste (3)

ESTATURA

57,5 - 63,5 29

ESTATURA 63,5 - 69,5 75

57,5 - 63,5 29 69,5 - 72,5 68

63,5 - 69,5 75 72,5 - 78,5 28

69,5 - 72,5 68 TOTAL 200

72,5 - 78,5 28

MEDIA 68.4VARIANZA (S2) 19.86DESVEST (S) 4.46

Se desea probar si la estatura de los empleados tiene distribución normal. Se toma una muestra aleatoria de 200 empleados a quienes se les pregunta su estatura en pulgadas. Los resultados obtenidos son:

No. EMPLEADOS

(nj)

No. EMPLEADOS

Con base en ésta información, ¿se puede concluir que su distribución es normal?

H0: La estatura de los empleados tiene distribución normal

H1: La estatura de los empleados no tiene distribución normal

Page 12: Clase 5 Prueba de Bondad de Ajuste (3)

Xj nj * Xj

60.5 1754.5 3660.25 106147.2566.5 4987.5 4422.25 331668.7571 4828 5041 342788

75.5 2114 5700.25 15960713684 940211

Xj2 nj * Xj2

Page 13: Clase 5 Prueba de Bondad de Ajuste (3)

No. de DÍAS

0 40

1 36

2 16

3 7

4 2

5 1

Se distribuyó el número de clientes que visitaron la oficina de un joven abogado durante sus primeros 102 días de práctica, de la siguiente manera:

No. de CLIENTES

Pruebe si el número de clientes por día sigue una distribución Poisson.

H0: El número de clientes por día tiene distribución Poisson

H1: El número de clientes por día no tiene distribución Poisson

Page 14: Clase 5 Prueba de Bondad de Ajuste (3)

No. DE AUTOS

≤ 1 40

1 - 2 29

2 - 3 15

≥ 3 8

Solución

Si los autos llegan a un supermercado siguiendo un proceso de Poisson, el tiempo entre llegadas sucesivas es una variable aleatoria con distribución exponencial. Se registraron las horas de llegada para todos los automóviles durante 2 horas y los tiempos entre llegadas (en minutos) se resumen a continuación:

TIEMPO ENTRE LLEGADAS

Pruebe si es cierto que el tiempo entre llegadas tiene distribución exponencial.

H0: El tiempo entre llegadas tiene distribución exponencial

H1: El tiempo entre llegadas no tiene distribución exponencial

Page 15: Clase 5 Prueba de Bondad de Ajuste (3)

0 8

1 25

2 32

3 24

4 10

5 o más 1

Una revisión de 100 informes que tienen diez datos cada uno presentado por los vendedores de una gran compañía permitió determinar algún tipo de error en dichos informes. Los resultados fueron como aparecen en la tabla que sigue:

Número de errores por cada 10 datos

Número de informes

Pruebe al nivel de significancia α = 0.05, determine si estos datos provienen de una población binomial con p = 0,20.

Page 16: Clase 5 Prueba de Bondad de Ajuste (3)

DATOS NO AGRUPADOS

23 TABLA DE DISTRIBUCIÓN DE FRECUENCIAS

23 m intervalos

24 1 2327 2 33.529 3 44.031 4 54.532 5 65.033 6 75.533 7 86.035 total3637 PARAMETROS DISTRIBUCIÓN NORMAL4042 MEDIA 55.0443 DESVEST 19.0043

44 m intervalos

45 1 2348 2 33.548 3 4454 4 54.554 5 6556 6 75.5

57

575858

585859 NIVEL DE SIGNIFICANCIA

6161 M-K-1=grados de libertad

62 m=6

Cincuenta números de dos dígitos se extraerá al azar de guía telefónica, y la prueba de chi-cuadrado de bondad de ajuste se utiliza para ver si podían haber sido las observaciones de una variable aleatoria normalmente distribuida. Los números, después de ser dispuestos en orden desde el más pequeño al más grande, son los siguientes.

Fifty two-digit numbers were drawn at random from telephone book, and the chi-squared test for goodness of fit is used to see if they could have been observations on a normally distributed random variable. The numbers, after being arranged in order from the smallest to the largest, are as follows.

Como el valor T es menor que χ²0,05,2 , entonces aceptamos H0, y se infiere que hay evidencia estadística de que los datos recolectados siguen una distribución normal.

F15
sala407: Valor minimo de los datos = 23
F26
sala407: Se selecionan todos los datos
Page 17: Clase 5 Prueba de Bondad de Ajuste (3)

63 k=2

64 M-K-1=3

656668687073737475778187899397

Page 18: Clase 5 Prueba de Bondad de Ajuste (3)

Rango r 74No de Clases m 7.071067812

A 10.465 10.5

intervalos nj Pj Nj33.5 9 0.1285 6.426244.0 8 0.1521 7.606454.5 5 0.2080 10.400765.0 14 0.2112 10.561175.5 8 0.1593 7.963886.0 2 0.0892 4.459397.0 4 0.0516 2.5825

total 50 1

intervalos nj Pj (nj - ej)33.5 9 0.1285 6.4262 2.5738 6.6246 1.030944 8 0.1521 7.6064 0.3936 0.1549 0.0204

54.5 5 0.2080 10.4007 -5.4007 29.1677 2.804465 14 0.2112 10.5611 3.4389 11.8260 1.1198

75.5 8 0.1593 7.9638 0.0362 0.0013 0.000297 6 0.1408 7.0418 -1.0418 1.0854 0.1541

50 T 5.12977.815

H0: These numbers are observations on a normally distributed random variable.

ej

El número de observaciones esperadas en cada clase debe ser mayor o igual a 5, es decir ej >= 5, si esto no ocurre unen las clases adyacentes hasta cumplir el requisito

ej (nj - ej)2 (nj - ej)2/ ej

χ²0,05,(5-2-1)

Como el valor T es menor que χ²0,05,2 , entonces aceptamos H0, y se infiere que hay evidencia estadística de que los datos recolectados siguen una distribución normal.

I10
sala407: Valor máximo - Valor minimo
I11
sala407: número de intervalos en la tabla es la raíz cuadrada de el número de datos n
I12
sala407: r/m el rango div el número de clases
H14
sala407: Frecuencia Absoluta
I14
sala407: PROBABILIDADES
J14
sala407: FRECUNCIA ESPERADA
G15
sala407: Limite superior, es la suma del limite inferior + el ancho
J15
sala407: Total de NJ * PJ
G16
sala407: Limite superior, es la suma del limite inferior + el ancho
I16
sala407: A la mayor probabilidad se le resta la menor probabilidad
G17
sala407: Limite superior, es la suma del limite inferior + el ancho
G21
sala407: Para que contenga el mayor valor (97), terminamos esta en celda en ese valor
I21
sala407: Se calcula 1 - la suma de las anteriores
L29
sala407: (nj-ej)*(nj-ej)
Page 19: Clase 5 Prueba de Bondad de Ajuste (3)

Columna1

Media 55.04Error típico 2.687683169Mediana 57.5Moda 58Desviación está 19.00478994Varianza de la 361.1820408Curtosis -0.60556952Coeficiente de a 0.158196346Rango 74Mínimo 23Máximo 97Suma 2752Cuenta 50