3
PRUEBA DE BONDAD DE AJUSTE DE KOLMOGOROV-SMIRNOV (KS) La prueba de Kolmogórov-Smirnov (también prueba K-S) es una prueba no paramétrica que se utiliza para determinar la bondad de ajuste de dos distribuciones de probabilidad entre sí. Conviene tener en cuenta que la prueba Kolmogórov-Smirnov es más sensible a los valores cercanos a la mediana que a los extremos de la distribución. La prueba de Anderson- Darling proporciona igual sensibilidad con valores extremos. Hipótesis a contrastar: H0: Los datos analizados siguen una distribución M. H1: Los datos analizados no siguen una distribución M. Estadístico de contraste: Prueba de Kolmogórov-Smirnov donde: x i es el i-ésimo valor observado en la muestra (cuyos valores se han ordenado previamente de menor a mayor). es un estimador de la probabilidad de observar valores menores o iguales que x i la probabilidad de observar valores menores o iguales que x i cuando H 0 es cierta.

Prueba de Bondad de Ajuste de Kolmogorov

Embed Size (px)

DESCRIPTION

Kolmogorov

Citation preview

PRUEBA DE BONDAD DE AJUSTE DE KOLMOGOROV-SMIRNOV (KS)La prueba de Kolmogrov-Smirnov (tambin prueba K-S) es una prueba no paramtrica que se utiliza para determinar la bondad de ajuste de dos distribuciones de probabilidad entre s.

Conviene tener en cuenta que la prueba Kolmogrov-Smirnov es ms sensible a los valores cercanos a la mediana que a los extremos de la distribucin. La prueba de Anderson-Darling proporciona igual sensibilidad con valores extremos.

Hiptesis a contrastar:H0: Los datos analizados siguen una distribucin M.H1: Los datos analizados no siguen una distribucin M.Estadstico de contraste:

Prueba de Kolmogrov-Smirnovdonde:

xi es el i-simo valor observado en la muestra (cuyos valores se han ordenado previamente de menor a mayor). es un estimador de la probabilidad de observar valores menores o iguales que xi la probabilidad de observar valores menores o iguales que xi cuando H0 es cierta.

As pues, D es la mayor diferencia absoluta observada entre la frecuencia acumulada observada y la frecuencia acumulada terica , obtenida a partir de la distribucin de probabilidad que se especifica como hiptesis nula.Si los valores observados son similares a los esperados , el valor de D ser pequeo. Cuanto mayor sea la discrepancia entre la distribucin emprica y la distribucin terica, mayor ser el valor de D.Por tanto, el criterio para la toma de la decisin entre las dos hiptesis ser de la forma:

Ejemplo 1:Determinar si los valores de la primera columna se conforman a unadistribucin normal:

(media: 4.1 varianza: 1.82)

Como el valor D = 0.216 < 0.262, no se rechaza H0y se aceptaque los datos se distribuyen normalmente.