MTA3 Pruebas de Bondad de Ajuste v5

Embed Size (px)

Citation preview

  • 8/18/2019 MTA3 Pruebas de Bondad de Ajuste v5

    1/29

    1

  • 8/18/2019 MTA3 Pruebas de Bondad de Ajuste v5

    2/29

    2

  • 8/18/2019 MTA3 Pruebas de Bondad de Ajuste v5

    3/29

    3

  • 8/18/2019 MTA3 Pruebas de Bondad de Ajuste v5

    4/29

    En el presente MTA analizaremos un conjunto de datos usando un histograma, el cual

    nos permitirá plantear la hipótesis acerca de la función que podría representar al

    conjunto de datos bajo análisis, posteriormente se ejecutará la prueba de bondad deajuste llamada “Chi‐cuadrado” para verificar la veracidad de la hipótesis planteada.

    4

  • 8/18/2019 MTA3 Pruebas de Bondad de Ajuste v5

    5/29

    Casi todos los eventos del mundo que nos rodea tienen un comportamiento aleatorio y

    este comportamiento puede ser recreado usando funciones de probabilidad, por

    ejemplo:

    ¿Sabías que con una distribución de probabilidades POISSON podemos recrear la

    cantidad de ordenes de compra que arriban cada día a la empresa?

    ¿Te imaginabas que con una distribución de probabilidades EXPONENCIAL podemos

    recrear el tiempo de atención de los clientes en la ventanilla de un banco?

    Las pruebas de bondad de ajuste nos permiten determinar qué función representa a un

    conjunto de datos.

    5

  • 8/18/2019 MTA3 Pruebas de Bondad de Ajuste v5

    6/29

    A continuación, determinaremos la función de probabilidades a usar para representar

    un proceso en un modelo de simulación.

    6

  • 8/18/2019 MTA3 Pruebas de Bondad de Ajuste v5

    7/29

    Iniciaremos analizando los datos recolectados.

    Supongamos que tenemos una muestra de tamaño 30, esta muestra es tomada a partir

    de los tiempos históricos requeridos para atender a los usuarios y están dados en

    minutos, este es el paso inicial de recolección de los datos y los mostramos en el

    siguiente cuadro de “Tiempos de Actividad”.

    El segundo paso, es hallar los estadísticos máximo, mínimo, promedio y calcular la

    cantidad de intervalos de clase, al cual llamaremos “K”, y el “Ancho de Clase”

    La cantidad de intervalos es hallada usando la regla de STURGES y el ancho de clase

    dividiendo la diferencia del máximo y mínimo valor observado entre K, para los datos

    analizados, la cantidad de intervalos de clase es 5.87 y lo redondeamos a 6 y el ancho de

    clase es 8.5.

    7

  • 8/18/2019 MTA3 Pruebas de Bondad de Ajuste v5

    8/29

    El siguiente paso es crear los intervalos de clase.

    De acuerdo al análisis previo, se requiere K = 6 intervalos de clase y usaremos el ancho

    de clase para hallar cada intervalo. Cada intervalo de clase tiene un límite inferior y

    superior.

    Para el primer intervalo, el límite inferior es igual al mínimo valor “1” y el limite superior

    es obtenido sumando el limite inferior más el ancho de clase “8.5”, lo que nos da como

    resultado “9.5”.

    Para el segundo intervalo el limite inferior es igual al limite superior del primer intervalo

    “9.5” y el limite superior es obtenido sumando el limite inferior más el ancho de clase“8.5”, lo que nos da como resultado “18”.

    Del mismo modo hallamos el resto de intervalos de clase, tal como se muestra en el

    cuadro completo con los seis intervalos de clase.

    8

  • 8/18/2019 MTA3 Pruebas de Bondad de Ajuste v5

    9/29

    En el paso anterior hallamos los intervalos de clase, por lo tanto, ahora podemos hallar

    la frecuencia observada (FO), la cual muestra cuántos datos se encuentran dentro de

    cada intervalo.

    En el primer intervalo que va desde “1” hasta “9.5” tenemos una frecuencia observada

    igual a “18”, lo cual significa que de los “30” datos analizados, “18” observaciones caen

    dentro de este intervalo.

    Del mismo modo, para los otros intervalos hay que contar cuántos datos caen dentro de

    cada uno de ellos.

    9

  • 8/18/2019 MTA3 Pruebas de Bondad de Ajuste v5

    10/29

    Una vez que hallamos la frecuencia observada, podemos obtener el gráfico del

    histograma.

    El gráfico del histograma nos ayuda a analizar cómo se distribuyen los datos y dónde

    están más concentrados. También nos ayuda a plantear la hipótesis acerca de la función

    de probabilidades que podría representar al conjunto de datos.

    10

  • 8/18/2019 MTA3 Pruebas de Bondad de Ajuste v5

    11/29

    Descarga el archivo adjunto y crea el histograma en Excel mostrado en el paso anterior.

    11

  • 8/18/2019 MTA3 Pruebas de Bondad de Ajuste v5

    12/29

    El siguiente paso implica plantear la hipótesis, acerca de la función de probabilidades

    que representa a los datos bajo análisis.

    Analizando las funciones Uniforme, Exponencial y Normal, notamos que la función

    exponencial es la que mejor se ajusta al histograma.

    Por lo tanto, la hipótesis es:

    Ho: Los datos tienen un comportamiento exponencial

    H1: Los datos NO tienen un comportamiento exponencial

    12

  • 8/18/2019 MTA3 Pruebas de Bondad de Ajuste v5

    13/29

    Ahora recordaremos las características de la función de distribución exponencial.

    Notamos que se define la función “f” minúscula, la cual es denominada “la función de

    distribución de probabilidades” y la “F” mayúscula la que se denomina la función dedistribución de probabilidades acumulada”.

    El parámetro “beta” es el promedio que para los 30 datos bajo análisis es igual a 11.53

    Casi siempre la función exponencial representa los tiempos requeridos para la

    ejecución de una actividad o la prestación de un servicio. Esta función requiere

    de un parámetro que es el promedio.

    13

  • 8/18/2019 MTA3 Pruebas de Bondad de Ajuste v5

    14/29

    Una vez que se plantea la hipótesis, hay que verificar la validez de dicha hipótesis, para

    lo cual ejecutamos la prueba Chi‐cuadrado.

    14

  • 8/18/2019 MTA3 Pruebas de Bondad de Ajuste v5

    15/29

    El primer paso al ejecutar la prueba Chi‐cuadrado requiere hallar la probabilidad para

    cada intervalo de clase del histograma.

    La probabilidad es hallada usando la función planteada en la hipótesis, en este caso

    exponencial, donde el promedio es 11.53 (un solo parámetro requerido).

    Como se desea la probabilidad de un intervalo se usa la función de distribución de

    probabilidades acumulada, representada por la “F” mayúscula.

    15

  • 8/18/2019 MTA3 Pruebas de Bondad de Ajuste v5

    16/29

    Una vez que tenemos la probabilidad de cada intervalo, procedemos a calcular la

    frecuencia esperada.

    La frecuencia esperada es hallada multiplicando la probabilidad de cada intervalo por la

    cantidad de datos (30 en este caso)

    16

  • 8/18/2019 MTA3 Pruebas de Bondad de Ajuste v5

    17/29

    Una vez hallada la frecuencia esperada, podemos calcular los valores de la columna Chi‐

    cuadrado, elevando al cuadrado la diferencia entre la frecuencia observada y la

    frecuencia esperada y dividiendo este resultado entre la frecuencia esperada.

    La suma de esta columna es llamada “valor Chi‐cuadrado calculado” que en este caso es

    igual a 2.88.

    17

  • 8/18/2019 MTA3 Pruebas de Bondad de Ajuste v5

    18/29

    La tabla Chi‐cuadrado es una tabla de doble entrada que requiere a nivel de fila los

    grados de libertad y a nivel de columna el nivel de error “α” (alfa).

    Los grados de libertad = K – 1 – [cantidad parámetros de la función]

    K = numero de intervalos de clase.

    La cantidad parámetros de la función exponencial = 1, pues solo se estima el promedio.

    entonces, los grados de libertad = [6 intervalos de clase]   ‐ 1 – [1 parámetro estimado] =

    4 grados de libertad.

    Seleccionamos en la tabla la fila correspondiente a 4 grados de libertad y la columna

    asociada a un nivel alfa = 10%.

    Por lo tanto el valor Chi‐cuadrado = 7.7794

    18

  • 8/18/2019 MTA3 Pruebas de Bondad de Ajuste v5

    19/29

    El último paso es validar la hipótesis planteada al inicio.

    19

  • 8/18/2019 MTA3 Pruebas de Bondad de Ajuste v5

    20/29

    20

  • 8/18/2019 MTA3 Pruebas de Bondad de Ajuste v5

    21/29

    21

  • 8/18/2019 MTA3 Pruebas de Bondad de Ajuste v5

    22/29

    Para practicar lo aprendido, analice los siguientes datos y determine si pueden ser

    representados por una función EXPONENCIAL (los datos se encuentran en el archivo

    Excel que bajaron previamente).

    Recuerde calcular la probabilidad usando la función planteada en la hipótesis y use un

    alfa = 10%.

    22

  • 8/18/2019 MTA3 Pruebas de Bondad de Ajuste v5

    23/29

    23

  • 8/18/2019 MTA3 Pruebas de Bondad de Ajuste v5

    24/29

    24

  • 8/18/2019 MTA3 Pruebas de Bondad de Ajuste v5

    25/29

    Esta es la solución del problema desarrollado en Excel, compara tus resultados con los

    mostrados en esta página.

    25

  • 8/18/2019 MTA3 Pruebas de Bondad de Ajuste v5

    26/29

    26

  • 8/18/2019 MTA3 Pruebas de Bondad de Ajuste v5

    27/29

    27

  • 8/18/2019 MTA3 Pruebas de Bondad de Ajuste v5

    28/29

    28

  • 8/18/2019 MTA3 Pruebas de Bondad de Ajuste v5

    29/29