Transcript
Page 1: 02. Generación de números y variables aleatorias

Generación de números y variables aleatoriasIng. Luis Clemente

Page 2: 02. Generación de números y variables aleatorias

Agenda

► Números aleatorios

► Generadores de números aleatorios

► Pruebas de aleatoriedad

► Generación de variables aleatorias

► Pruebas de bondad de ajuste

Page 3: 02. Generación de números y variables aleatorias

Agenda

► Números aleatorios

► Generadores de números aleatorios

► Pruebas de aleatoriedad

► Generación de variables aleatorias

► Pruebas de bondad de ajuste

Page 4: 02. Generación de números y variables aleatorias

¿Cuáles son sus aplicaciones?

► Simulación de procesos

► Juegos o teorías de decisiones

► Cálculo numérico

► Teoría del muestreo

► Programación

Page 5: 02. Generación de números y variables aleatorias

Características de los números aleatorios

► Deben estar uniformemente distribuidos

Los números aleatorios (que serán representados por “Ri”) deben cumplir las siguientes condiciones:

R ~ U [ 0 , 1]

f(R) = 1 , 0 <= R <= 1

0 , caso contrario

F(R) =

0 , R < 0

R , 0 <= R < 1

1 , R >= 1

E[R] = 1/2

Var(R) = 1/12

f(R)

1

0 1 R

Page 6: 02. Generación de números y variables aleatorias

Características de los números aleatorios► Deben ser estadísticamente independientes

– ¿Auto correlación?– ¿Estacionalidad de los números?

► El período (tiempo hasta que un número se repita) debe ser lo suficientemente largo

0.36, 0.80, 0.25, 0.11, 0.78, 0.91, 0.06, 0.36

► Deben ser generados a través de un método rápido y que no requiera mucha capacidad de almacenamiento

Período pequeño

Page 7: 02. Generación de números y variables aleatorias

Agenda

► Números aleatorios

► Generadores de números aleatorios

► Pruebas de aleatoriedad

► Generación de variables aleatorias

► Pruebas de bondad de ajuste

Page 8: 02. Generación de números y variables aleatorias

¿Cómo deben ser los generadores de números aleatorios?► La generación de números debe ser rápida

► El almacenamiento debe ocupar la menor cantidad de memoria posible

► La secuencia de números aleatorios debe ser reproducible

► El período debe ser lo suficientemente largo

► Los números aleatorios deben cumplir las propiedades estadísticas de uniformidad e independencia

Page 9: 02. Generación de números y variables aleatorias

¿Qué tipos de generadores existen?

► Provisión externa

Ventajas

- Secuencia reproducible

Desventajas

- Necesidad de almacenamiento grande- Produce pseudo aleatorios

Page 10: 02. Generación de números y variables aleatorias

¿Qué tipos de generadores existen?

► Generación física

Ventajas

- Puede producir números realmente aleatorios

Desventajas

- Método de generación lento- No es posible reproducir una secuencia- Requiere gran cantidad de almacenamiento

Page 11: 02. Generación de números y variables aleatorias

¿Qué tipos de generadores existen?

► Generación matemática

Ventajas

- Método de generación rápida- Secuencia reproducible

Desventajas

- Produce pseudo aleatorios

Page 12: 02. Generación de números y variables aleatorias

Método del Medio Cuadrado

► Propuesto por John von Newmann. Es un método con pobres propiedades estadísticas

– Se escoge un número inicial X0 (semilla). Este será un número entero de “k” dígitos

– Se eleva al cuadrado dicho número, y se obtiene un valor que como máximo tendrá “2k” dígitos. Si el número no llega a “2k”, completar con ceros a la izquierda

– Los “k” dígitos centrales corresponden al número X1 y servirán para crear el primer aleatorio. Como los aleatorios deben ser menores a 1, entonces R1 se obtiene dividiendo X1 entre 10k

Si en algún momento los “k” dígitos centrales son igual a cero, la secuencia de números se degenera

Page 13: 02. Generación de números y variables aleatorias

Método del Medio Producto

► Muy similar al método anterior. Es un método con pobres propiedades estadísticas

– Se escogen dos números iniciales X0 y X’0. Ambos serán números entero de “k” dígitos

– Se multiplican ambos números, y se obtiene un valor que como máximo tendrá “2k” dígitos. Si el número no llega a “2k”, completar con ceros a la izquierda

– Los “k” dígitos centrales corresponden al número X1 y servirán para crear el primer aleatorio. Como los aleatorios deben ser menores a 1, entonces R1 se obtiene dividiendo X1 entre 10k

Si en algún momento los “k” dígitos centrales son igual a cero, la secuencia de números se degenera

Page 14: 02. Generación de números y variables aleatorias

Método de la Multiplicación por una Constante► Muy similar al método anterior. Es un método con

pobres propiedades estadísticas

– Se escogen dos números iniciales X0 y C (constante entera). Ambos serán números entero de “k” dígitos

– Se multiplican ambos números, y se obtiene un valor que como máximo tendrá “2k” dígitos. Si el número no llega a “2k”, completar con ceros a la izquierda

– Los “k” dígitos centrales corresponden al número X1 y servirán para crear el primer aleatorio. Como los aleatorios deben ser menores a 1, entonces R1 se obtiene dividiendo X1 entre 10k

Si en algún momento los “k” dígitos centrales son igual a cero, la secuencia de números se degenera

Page 15: 02. Generación de números y variables aleatorias

Generador Congruencial Lineal (GCL)

► Es el generador más utilizado

► Produce una secuencia periódica o cíclica siguiendo la fórmula:

Para obtener el aleatorio R, se divide Z entre m

Zi+1 = (a*Zi + c) * mod m

m = móduloa = multiplicadorc = incrementoZ0 = semilla

Los 4 parámetros son enteros no negativos, y además deben cumplir:

m > 0 m > a m > c m > Z0

Page 16: 02. Generación de números y variables aleatorias

Generador Congruencial Lineal (GCL)

► Ejemplo

Zi+1 = (5*Zi + 7) * mod 8m = 8a = 5

c = 7Z0 = 6

N (5Zi + 7) (5Zi + 7) mod 8 Ri

1 5 * 6 + 7 = 37 37 mod 8 = 5 5 / 8 = 0.625

2 5 * 5 + 7 = 32 32 mod 8 = 0 0 / 8 = 0.000

3 5 * 0 + 7 = 7 7 mod 8 = 7 7 / 8 = 0.875

4 5 * 7 + 7 = 42 42 mod 8 = 2 2 / 8 = 0.250

5 5 * 2 + 7 = 17 17 mod 8 = 1 1 / 8 = 0.125

6 5 * 1 + 7 = 12 12 mod 8 = 4 4 / 8 = 0.500

7 5 * 4 + 7 = 27 27 mod 8 = 3 3 / 8 = 0.375

8 5 * 3 + 7 = 22 22 mod 8 = 6 6 / 8 = 0.750

9 5 * 6 + 7 = 18 37 mod 8 = 5 5 / 8 = 0.625

Es posible generar 8 números aleatorios antes de repetir el primero. El período es igual al módulo, por lo que se dice que este ejemplo es un generador de período completo

Page 17: 02. Generación de números y variables aleatorias

Generador Congruencial Lineal (GCL)

► Algunos apuntes

– La selección de parámetros a, c, m y la semilla, tiene gran influencia en las propiedades estadísticas de los números generados

– Los enteros que se generan, sólo pueden tomar los siguientes posibles valores: {0, 1/m, 2/m, … , (m-1)/m}. Esto hace que los valores obtenidos sean discretos en el intervalo (0,1) en lugar de ser continuos

– Se puede asumir que los valores son de naturaleza continua si se trabaja con módulos grandes. Los más usados en lenguajes de simulación son m = 231-1 y m = 248

– Un caso particular es el Generador Congruencial Multiplicativo, en el cual el incremento “c” toma valor cero

Page 18: 02. Generación de números y variables aleatorias

¿Cómo escoger los parámetros?

► Teorema de Hull y Dobell para un GCL que asegure el mayor período

– P1: El módulo y el incremento deben ser primos entre sí. Es decir, el único entero positivo que divide exactamente a “m” y “c” es 1

– P2: Si “q” es un número primo que puede dividir a “m”, entonces también “q” debe poder dividir a “a – 1”

– P3: Si 4 divide a “m”, entonces 4 divide a “a – 1”

Page 19: 02. Generación de números y variables aleatorias

¿Cómo escoger los parámetros?

► Caso 1: Módulo potencia de 2 e incremento ≠ 0– Zi+1 = (aZi + c) mod 2b

– Si “c” y “m” son primos entre sí, y el multiplicador es de la forma 4k + 1, la longitud máxima del período es P = m = 2b

► Caso 2: Módulo potencia de 2 e incremento = 0– Zi+1 = (aZi) mod 2b

– Semilla impar– b > 2– a = 3 + 8k… ( o en su defecto a = 5 + 8k)

► Caso 3: Módulo primo e incremento = 0– Zi+1 = (aZi) mod m

– El menor entero que hace posible que ak-1

sea divisible por m, es k = m - 1

P = 2b-2

P = m - 1

Page 20: 02. Generación de números y variables aleatorias

Agenda

► Números aleatorios

► Generadores de números aleatorios

► Pruebas de aleatoriedad

► Generación de variables aleatorias

► Pruebas de bondad de ajuste

Page 21: 02. Generación de números y variables aleatorias

¿Qué tan adecuados son los números generados?► Existen diferentes métodos para comprobar que los

números aleatorios generados (bajo cualquier técnica) cumplen con las condiciones deseadas de uniformidad e independencia

Descripción

Prueba de Frecuencia Compara la secuencia generada contra una distribución uniforme mediante las pruebas de K-S, o Chi-cuadrado

Prueba de Corridas (Run Test)

Determina la existencia o no de comportamientos anormales de (de)crecimiento constante o por encima o debajo del promedio

Prueba de Autocorrelación

Compara la correlación existente entre los números generados con la esperada (nula correlación)

Prueba de Espacios (Gap Test)

Cuenta los dígitos entre dos repeticiones seguidas y compara ese valor con el esperado con la prueba K-S

Prueba Póker Controla la frecuencia de aparición de dígitos dentro de una serie

Page 22: 02. Generación de números y variables aleatorias

¿Qué tan adecuados son los números generados?► Las pruebas antes mostradas pueden agruparse según

el objetivo e hipótesis a usar

► En todas las pruebas, es necesario fijar un nivel de significancia adecuado. Este suele oscilar entre 0.01 y 0.05

Objetivo Pruebas adecuadas Hipótesis evaluada

Probar uniformidad FrecuenciaH0: Ri ~ U [ 0,1 ]H1: Ri ≠ U [ 0,1 ]

Probar independencia Corridas, autocorrelación, espacios, póker

H0: Ri ~ independienteH1: Ri ≠ independiente

Page 23: 02. Generación de números y variables aleatorias

Prueba de Frecuencia

► Existen 2 métodos para esta prueba. Ambos miden el grado de aproximación de la distribución empírica de los números generados y la distribución uniforme teórica

► Kolmogorov – Smirnov (KS)– Ordenar los números aleatorios de menor a mayor

– Calcular

– Calcular

– Determinar el valor crítico usando la tabla KS

– Si “D” es mayor a este valor crítico, se rechaza la hipótesis nula

Page 24: 02. Generación de números y variables aleatorias

Prueba de Frecuencia

► Chi - Cuadrado– Se evalúa la fórmula

– Donde “O” es el número de observaciones de cada intervalo, y “E” (E = N / n) es el esperado de cada intervalo*, siendo “N” el número de datos y “n” el número de intervalos

– Determinar el valor crítico usando la tabla Chi – Cuadrado, con “n – 1” grados de libertad

– Si el estadístico es mayor al crítico, se rechaza la hipótesis nula

* Si N ≤ 100, el número de intervalos es N1/2. En caso contrario, usar la ley de Sturges: 1+3.33 log (N)

La prueba Chi – Cuadrado sólo es válida para muestras grandes de números. La prueba KS sigue siendo eficiente con muestras pequeñas

Page 25: 02. Generación de números y variables aleatorias

Corrida #1

Corrida #2

Corrida #3

Corrida #4

Prueba de Corridas

► Se verifica la aleatoriedad de los números, comprobando que el número de corridas sea una variable aleatoria distribuida normalmente

► Una corrida se define como una sucesión de eventos similares precedidos y seguidos por un evento diferente a éste

Page 26: 02. Generación de números y variables aleatorias

Prueba de Corridas

► Corridas Arriba y Abajo– Si a un número le sigue otro mayor, se le asigna un signo “+”,

caso contrario, se asigna un singo “-”– Se calcula b = número de corridas– Considerando como “N” la cantidad de números de la secuencia,

se calculan los parámetros

– Para N > 20, el número de corridas se puede aproximar a una distribución normal. El estadístico de pruebas es

– Si |Z0| > Z1-α/2, se rechaza la hipótesis nula

Page 27: 02. Generación de números y variables aleatorias

Prueba de Corridas

► Corridas Arriba y Debajo de la Media– Si un número está por encima de la media teórica (1/2), se le

asigna un signo “+”, caso contrario, se asigna un singo “-”

– Se calculan los valores n1= observaciones encima de la media, n2= observaciones debajo de la media, b = número de corridas

– Considerando como “N” la cantidad de números de la secuencia, se calculan los parámetros

– Para N > 20, el número de corridas se puede aproximar a una distribución normal. El estadístico de pruebas es

– Si |Z0| > Z1-α/2, se rechaza la hipótesis nula

Page 28: 02. Generación de números y variables aleatorias

Agenda

► Números aleatorios

► Generadores de números aleatorios

► Pruebas de aleatoriedad

► Generación de variables aleatorias

► Pruebas de bondad de ajuste

Page 29: 02. Generación de números y variables aleatorias

Consideraciones previas

► Existen métodos generales para ser aplicados, y también métodos particulares según el tipo de distribución que se desea replicar

f(R) = 1 , 0 <= R <= 1

0 , caso contrario

F(R) =

0 , R < 0

R , 0 <= R < 1

1 , R >= 1

► Se asume que se cuenta con un buen generador de números aleatorios

Page 30: 02. Generación de números y variables aleatorias

Método de la Transformada Inversa

► Una primera noción nos dice que podemos generar un número Ri entre 0 y 1, interceptarlo con la curva F(x) y obtener el valor del número “x” respectivo

► Este método utiliza la distribución acumulada F(x) de la distribución que deseamos. Se basa en el hecho que F(x) es monótona creciente y toma valores entre 0 y 1

F(x)

1

0 Xx = F-1 (R)

R

F(x) = R x = F-1(R)

Page 31: 02. Generación de números y variables aleatorias

Método de la Transformada Inversa - Distribuciones Continuas

► Recordar que F(x) se obtiene integrando sobre f(x)

► Para una distribución de este tipo, F(x) es una función continua, y puede aplicarse directamente la función inversa F-1(x) sobre Ri para calcular las variables que siguen la distribución buscada

F(x)

1

0 Xx = F-1 (R)

R

F(x) = R x = F-1(R)

Page 32: 02. Generación de números y variables aleatorias

Método de la Transformada Inversa – Distribuciones Discretas

► Recordar que F(x) es la sumatoria f(x) desde 0 hasta “x”

► La gráfica de F(x) ya no es continua, por lo que no se puede aplicar directamente la función inversa propiamente dicha. En este caso se emplea la función inversa generalizada. Para cada R, el valor “x” correspondiente, es el mínimo valor que cumple F(x) ≥ R

F(xi-1) = ri-1 < R < ri = F(xi)

F(x)

1

0 Xx

R

Page 33: 02. Generación de números y variables aleatorias

Método de la Transformada Inversa – Distribución Bernoulli

► Función de probabilidad: f(x) = px (1-p)1-x , x = 0,1

► Si X es una variable aleatoria que mide “número de éxitos” y se realiza un único experimento con dos posibles resultados (éxito o fracaso), se dice que sigue una distribución Bernoulli de parámetro “p” (probabilidad de éxito)

- Generar un número aleatorio R entre 0 y 1- Si R ≤ p, hacer x = 1; en caso contrario, x = 0

Page 34: 02. Generación de números y variables aleatorias

Método de la Transformada Inversa – Distribución Empírica

► Basta generar un aleatorio R y hacemos que X tome los valores

► Supongamos que queremos generar el valor de una variable X que cumple P(X = xj) = pj, j = 0, 1

- Generar un número aleatorio R entre 0 y 1- Si R < p0, hacer X = xo y terminar- Si R < p0 + p1, hacer X = x1 y terminar- Si R < p0 + p1 + p2, hacer X = x2 y terminar…

…X =

x0 , si R < p0

x1 , si p0 ≤ R < p0 + p1

xj , si Σj-1

i=1 pi ≤ R < si Σj

i=1 pi

Page 35: 02. Generación de números y variables aleatorias

Método de la Transformada Inversa – Distribución Uniforme

► Función de densidad

► Se dice que una variable X sigue una distribución uniforme con parámetros “a” y “b” si todos los valores X tienen la misma probabilidad de aparición dentro del intervalo [a ; b]

f(x) = 1/(b-a) , a ≤ x ≤ b0 , caso contrario

- Generar un número aleatorio R entre 0 y 1- Hacer x = a + (b – a) * R

Page 36: 02. Generación de números y variables aleatorias

Método de la Transformada Inversa – Distribución Exponencial

► Función de densidad

► La distribución exponencial describe el tiempo transcurrido entre eventos que ocurren continua e independientemente, a una tasa promedio constante igual a ß

- Generar un número aleatorio R entre 0 y 1- Hacer x = (-1 / ß) * ln (R)

f(x) = ße-ßx , x ≥ 00 , caso contrario

Page 37: 02. Generación de números y variables aleatorias

Método de la Transformada Inversa – Distribución Weibull

► Función de densidad

► La distribución Weibull puede ser usada para describir el tiempo que transcurre hasta que ocurra una falla en componentes eléctricos. La distribución exponencial es un caso especial de Weibull

- Generar un número aleatorio R entre 0 y 1- Hacer x = α * (- ln (R))1 / ß

f(x) = (ß/αß) xß-1 e-(x/α)ß , x ≥ 00 , caso contrario

Page 38: 02. Generación de números y variables aleatorias

Método de la Transformada Inversa – Distribución Triangular

► Función de densidad

► Esta distribución se utiliza cuando sólo se conocen los límites máximos y mínimos de las variables (“a” y “b”), y la moda “c”

f(x) = 2(x-a)/((b-a)*(c-a)) , a ≤ x ≤ b2(c-x)/((c-b)*(c-a)), b ≤ x ≤ c

- Generar un número aleatorio R entre 0 y 1- Hacer

x = a + [(b-a)*(c-a)*R]1/2 , 0 ≤ R ≤ (b-a)/(c-a)c - [(c-b)*(c-a)*(1-R)]1/2 , (b-a)/(c-a) ≤ R ≤ 1

Page 39: 02. Generación de números y variables aleatorias

Método de la Transformada Inversa – Distribución Poisson

► Función de probabilidad

► Se usa para describir la probabilidad de que ocurra determinado número de eventos en un intervalo de tiempo T

- Generar un número aleatorio R entre 0 y 1- Hacer i = 0 , p = e-λ , F = p- Si R < F, hacer X = i y terminar- p = λp / (i+1) , F = F + p , i = i +1- Ir al 3° paso

f(i) = e-λ*λi / i ! , i = 0, 1, 2…0 , caso contrario

Page 40: 02. Generación de números y variables aleatorias

Método de Aceptación y Rechazo

► Supongamos que tenemos un método para generar una variable aleatoria con función de densidad “g” (se recomienda usar una distribución uniforme 0 a 1)

► A diferencia del anterior, este método utiliza la función “f”

► Se debe hallar una constante “c” tal que

f(w) / g(w) ≤ c, para cualquier w

- Generar variable “y” con función de densidad “g”- Generar un número aleatorio R entre 0 y 1- Si R < f(y) / [g(y) * c] , hacer x = y, caso contrario, regresar al 1° paso

Page 41: 02. Generación de números y variables aleatorias

Método de Convolución

► Este método se usa para generar aquellas variables aleatorias que pueden ser expresadas como una función lineal de otras variables aleatorias, de la forma

► Con este método pueden generarse variables con distribución normal, binomial, earlang, etc

- Generar números aleatorios R entre 0 y 1- Con cualquiera de los métodos conocidos, se generan las variables aleatorias Y- Se obtiene X mediante la función lineal original

X ~ b1*Y1 + b2*Y2 + b3*Y3 + … + bn*Yn

Page 42: 02. Generación de números y variables aleatorias

Método de Convolución – Distribución Binomial

► Función de probabilidad

► Mide el número de éxitos en una secuencia de “n” ensayos independientes de Bernoulli con una probabilidad “p” de éxito

f(x) = Cn

x px (1-p)n-x

- Generar las variables X1, X2, … Xn con distribución Bernoulli- Generar Y como la suma de X1 + X2 + … + Xn

Page 43: 02. Generación de números y variables aleatorias

Método de Convolución – Distribución Normal► Permite modelar numerosos fenómenos naturales,

sociales y psicológicos (asumiendo que cada observación se obtiene como la suma de unas pocas causas independientes)

- Generar 12 números aleatorios R- Calcular Z (estandarizada) = (R1 + R2 + … + R12) – 6- Bastaría usar la transformación Y = Z*σ + μ

f(x)

1

0 x

Page 44: 02. Generación de números y variables aleatorias

Método de Convolución – Distribución Chi Cuadrado► Utilizada para pruebas de independencia, bondad de

ajuste, estimación de varianzas. Se puede expresar como la suma de los cuadrados de “k” variables normales estándar

- Generar Z (estandarizada)- Elevar al cuadrado cada variable Z- Sumar los cuadrados de las “k” variables Z

f(x)

0 x

Page 45: 02. Generación de números y variables aleatorias

Método Especial para la Distribución Poisson► Es uno de los muchos métodos para generar variables

con distribución de Poisson en un lapso de tiempo T

- Hacer t = 0 , i = 0 - Generar un número aleatorio R entre 0 y 1- Hacer t = t – ln (U) / λ Si t < T, terminar- i = i +1- Ir al 2° paso

► La simulación considera que los arribos de Poisson ocurren en intervalos de tiempo que siguen una distribución exponencial

Page 46: 02. Generación de números y variables aleatorias

Método Especial para la Distribución Normal

► El algoritmo Box Muller utiliza dos variables uniformes [0,1] para producir dos variables que siguen una distribución normal estándar

- Generar R1 y R2

- Hacer X = [-2 ln(R1)]½ * cos(2πR2

- Hacer Y = [-2 ln(R1)]½ * sen(2πR2)

► El principal inconveniente es que el uso de senos y cosenos es ineficiente

Método Box Muller

Page 47: 02. Generación de números y variables aleatorias

Método Especial para la Distribución Normal

► Se desprende del método anterior

- Generar R1 y R2

- Hacer V1 = 2*U1 – 1, V2 = 2*U2 – 1- Calcular S = V1

2 + V22

- Si S > 1, regresar al 1° paso- Hacer X = [-2*ln(S) / S] ½ * V1 , Y = [-2*ln(S) / S] ½ * V2

Método Polar (Marsaglia Brax)

► Utiliza transformaciones polares para trabajar de forma más eficiente

Page 48: 02. Generación de números y variables aleatorias

Agenda

► Números aleatorios

► Generadores de números aleatorios

► Pruebas de aleatoriedad

► Generación de variables aleatorias

► Pruebas de bondad de ajuste

Page 49: 02. Generación de números y variables aleatorias

Pruebas de bondad de ajuste

► Son pruebas de hipótesis que sirven para comprobar que la distribución generada puede aproximarse o no a una distribución teórica dada

► Las hipótesis con las que se trabaja son

► En todos los casos, se debe definir el nivel de significancia (0.05)

H0 = La variable aleatoria se ajusta a la distribución dada con los parámetros indicados

H1 = Caso contrario

Page 50: 02. Generación de números y variables aleatorias

Prueba Kolmogorov – Smirnov (KS)

► Sólo aplicable a variables aleatorias continuas

► Es necesario trabajar con intervalos

► Se calcula la diferencia (en valor absoluto) de las frecuencias acumuladas observadas con las teóricas de cada clase

► Se busca la mayor diferencia (Dmáx) y se compara con los valores de la tabla KS

► Es aplicable a todo tamaño de muestras

Page 51: 02. Generación de números y variables aleatorias

Prueba Kolmogorov – Smirnov (KS)

► Pasos– Crear una tabla de frecuencias para los “n” datos agrupados en

intervalos– Hallar la frecuencia observada de cada intervalo– Dividir la frecuencia observada entre el número de datos. Así se

obtiene la probabilidad observada POi

– Calcular la probabilidad acumulada observada (OAi)

– Para cada intervalo, calcular la probabilidad esperada (PEi) y la probabilidad acumulada esperada (EAi)

– En cada intervalo calcular la diferencia absoluta entre EAi y OAi

– Se toma Dmáx como la diferencia máxima de todos los intervalos y se compara con el valor límite de las tablas

– Si Dmáx es mayor que el límite, se rechaza la hipótesis nula

Page 52: 02. Generación de números y variables aleatorias

Prueba Chi Cuadrado

► Válida tanto para variables aleatorias continuas como discretas

► Es necesario trabajar con intervalos

► Se comparan las frecuencias observadas con las teóricas de cada clase

► El estadístico hallado (“Medida de discrepancia”) se compara con los valores de la tabla Chi Cuadrado

► Es aplicable sólo a muestras grandes

Page 53: 02. Generación de números y variables aleatorias

Prueba Chi Cuadrado

► Pasos– Crear una tabla de frecuencias para los “n” datos agrupados en

intervalos– Hallar la frecuencia observada de cada intervalo (Oi) y calcular

la frecuencia esperada (Ei)*. Si esta es muy pequeña (menor a 5), agrupar intervalos

– Para cada clase, aplicar la fórmula

– De las tablas Chi Cuadrado, se obtiene el estadístico X2α,k’-r-1 ,

donde “r” es la cantidad de parámetros de la distribución y k’ es la cantidad final de intervalos empleados

– Si el resultado de la fórmula es mayor que el estadístico teórico, se rechaza la hipótesis nula

* Si la distribución candidata es discreta, cada valor de la variable aleatoria debería ser un intervalo. Si fuese continua, se debe utilizar la diferencia de acumuladas

Page 54: 02. Generación de números y variables aleatorias

Generación de números y variables aleatoriasIng. Luis Clemente


Recommended