Click here to load reader

Selección de distribuciones de probabilidadjgimenez/Modelos y Simulacion/2012/clase13_p… · Para ciertos tests, es necesario asumir independencia de los datos observados. Ejemplos

  • View
    216

  • Download
    0

Embed Size (px)

Text of Selección de distribuciones de probabilidadjgimenez/Modelos y Simulacion/2012/clase13_p… · Para...

  • Seleccin de distribuciones de probabilidad

    Georgina Flesia

    FaMAF

    3 de mayo, 2012

  • Anlisis estadstico de datos simulados

    I Los sistemas reales tienen fuentes de aleatoriedad:

    Tipo de sistema Fuente de aleatoriedad

    Fabricacin Tiempos de procesamientoTiempos de fallaTiempos de reparacin de mquinas

    Defensa Tiempos de arribo y carga tilde aviones o misiles.Errores de lanzamiento.

    Comunicaciones Tiempos entre llegadas de mensajes.Longitudes de mensajes.

    Transporte Tiempo de embarqueTiempos entre arribos a un subte...

  • Simulacin a partir de los datos

    Para simular un sistema real es necesario:I Representar cada fuente de aleatoriedad de acuerdo a una

    distribucin de probabilidad.I Elegir adecuadamente la distribucin, para no afectar los

    resultados de la simulacin.

    Cmo elegir una distribucin? Cmo simular un sistema a partirde un conjunto de observaciones?

    I Utilizando los datos directamente.I Realizando el muestreo a partir de la distribucin emprica de los

    datos.I Utilizando tcnicas de inferencia estadstica.

    I Eleccin de una distribucin terica.I Estimacin de parmetros.I Tests de bondad de ajuste.I Simulacin a partir de la distribucin terica.

  • Eleccin de una distribucin

    Utilizar los datos directamente:I Slo reproduce datos histricos.I En general es una informacin insuficiente para realizar

    simulaciones.I Es til para comparar dos sistemas, para hacer una validacin

    del modelo existente con el simulado.Distribucin emprica:

    I Reproduce datos intermedios (datos continuos).I Es recomendable si no se pueden ajustar los datos a una

    distribucin terica.

  • Inferencia estadstica de un modelo

    Inferencia estadstica vs. distribucin emprica:I Las distribuciones empricas pueden tener irregularidades si hay

    pocos datos, una distribucin terica suaviza los datos.I Puede obtenerse informacin an fuera del rango de los datos

    observados.I Puede ser necesario imponer un determinado tipo de

    distribucin, por el tipo de modelo que se desea simular.I No es necesario almacenar los datos observados ni las

    correspondientes probabilidades acumuladas.I Es fcil modificar los parmetros.I Puede no existir una distribucin adecuada.I Generacin de valores extremos no deseados.

  • Distribuciones de probabilidad ms utilizadas

    Continuas:I Uniforme: Para cantidades que varan "aleatoriamente" entre

    valores a y b, y que no se conocen ms datos.I Exponencial: Tiempos entre llegadas de "clientes" a un sistema,

    y que ocurren a una tasa constante. Tiempos de falla demquinas.

    I Gamma, Weibull: Tiempo de servicio, tiempos de reparacin.I Normal: Errores. Sumas grandes Teorema central del lmite.I Otras: (Law & Kelton, cap. 6)

    Parmetros:I de posicin: (normal, uniforme)I de escala: (normal, uniforme, exponencial, lognormal)I de forma: (Gamma, Weibull, lognormal)

  • Distribucin uniforme

    I f (x) = 1ba I(a,b)(x)I a: posicin, b a: escala.I Rango: a < x < b.I Media: a+b2 .

    I Varianza: (ba)2

    2 .

  • Distribucin Gamma(, )

    I f (x) = x1 exp(x/)

    ()

    I : forma, : escala.I Rango: x > 0.I Media: .I Varianza: 2.I NOTACIN para I = 1 Exponencial

  • Distribucin Weibull (, )

    I f (x) = x1 e(x/)

    I : forma, : escala.I Rango: x > 0.I Media:

    ( 1

    ).

  • Distribucin Normal(, 2)

    I f (x) =12

    exp((x )2/(22))I : posicin, : escala.I Rango: R.I Media: .I Varianza: 2.

  • Distribucin Lognormal(, 2)

    I f (x) = 1x

    22e(log(x))

    2/(22)

    I : forma, : escala.I Rango: x > 0.I Media: e+

    2/2.I Varianza: e2+

    (e2 1).

  • Distribuciones de probabilidad ms utilizadas

    Discretas:I Bernoulli.I Uniforme discreta.I Geomtrica: nmero de observaciones hasta detectar el primer

    error.I Binomial negativa: nmero de observaciones hasta detectar el

    n-simo error.I Poisson: Nmero de eventos en un intervalo de tiempo, si

    ocurren a tasa constante.

  • Distribucin Binomial

    n = 5, p = 0.1 n = 5, p = 0.5 n = 5, p = 0.8

  • Distribucin Geomtrica

    p = 0.25 p = 0.5

  • Distribucin Poisson

  • Distribucin Poisson

    Corresponde a = 25.

  • Distribucin empricaI Supongamos que se tienen disponibles los datos observados

    Y1 = y1, Y2 = y2, . . . ,Yn = yn Y1,Y2, . . . ,Yn, se define ladistribucin emprica de la muestra a la funcin

    Fe(x) =#{i | Yi x}

    n.

    I Fe(x): proporcin de valores observados menores o iguales a x .I Si se ordena los datos en forma creciente :

    y(j) = j simo valor ms pequeo

    y(1) < y(2) < < y(n).

    Distribucin emprica Fe(x) =

    0 x < y(1)1n y(1) x < y(2)...jn y(j) x < y(j+1)...1 y(n) x

  • Grficamente

    F (x)

    y(1) y(3)y(2) y(4) y(5)

    1

  • Tcnicas de prueba de independencia

    Para ciertos tests, es necesario asumir independencia de los datosobservados.Ejemplos de no independencia:

    I Datos de temperaturas a lo largo de un da.I Tiempos de demora en una cola de espera.

    TcnicasI Grficos de correlacin: j .I Diagramas de dispersin (scattering): (Xi ,Xi+1).I Tests no paramtricos.

  • Inferencia estadstica de un modelo1. Elegir una o ms distribuciones apropiadas.2. Estimacin de parmetros de la distribucin elegida.3. Pruebas (tests) de bondad de ajuste.

    I Hiptesis nula: Fe(x) es cercana a F (x).I Estadstico de Kolmogorov-Smirnov

    D maxx|Fe(x) F (x)| , < x

  • Medidas tiles

    Parmetro Estimador EstimaMin, Max X(1), X(n) rangoMedia X (n) Tendencia central

    Mediana m =

    {X(n+1)/212 (Xn/2 + X(n/2+1))

    Tendencia central.

    Varianza 2 S2(n) Variabilidad

    c.v.= cv(n) =

    S2(n)X(n)

    Variabilidad

    = S2(n)

    X(n)Variabilidad

    Asimetra = E [(X)3]

    (2)3/2(n) =

    i (XiX(n))

    3/n[S2(n)]3/2 Simetra