Click here to load reader

Variables aleatorias continuas, TCL y Esperanza Condicionaljgimenez/Modelos_y_Simulacion/2013/clase3.pdf · Variables aleatorias continuas Definición Una variable aleatoria X se

  • View
    6

  • Download
    0

Embed Size (px)

Text of Variables aleatorias continuas, TCL y Esperanza...

  • Variables aleatorias continuas, TCL yEsperanza Condicional

    FaMAF

    19 de marzo, 2013

    1 / 37

  • Poisson P(λ)

    Número de éxitos en una cantidad grande de ensayosindependientes

    I Rango: {0,1,2, . . . } = {0} ∪ NI Función de masa:

    P(X = k) = e−λλk

    k !.

    I Valor esperado:E [X ] = λ.

    I Varianza:Var(X ) = λ.

    I Fórmula recursiva:pk+1 =

    λ

    k + 1pk .

    2 / 37

  • Poisson

    0 5 10 150

    0.1

    0.2

    0.3

    0.4λ=1

    0 5 10 150

    0.05

    0.1

    0.15

    0.2

    0.25

    0.3

    0.35λ=2

    0 5 10 150

    0.05

    0.1

    0.15

    0.2λ=5

    0 5 10 150

    0.05

    0.1

    0.15

    0.2λ=7

    0 5 10 150

    0.1

    0.2

    0.3

    0.4

    0.5

    0.6

    0.7

    0.8

    0.9

    1

    3 / 37

  • Variables aleatorias continuas

    DefiniciónUna variable aleatoria X se dice (absolutamente continua) si existef : R 7→ R con f ≥ 0, tal que

    P(X ∈ C) =∫

    Cf (x) dx .

    Ejemplos:I Uniforme: X ∼ U(a,b)I Normal: X ∼ N (µ, σ)I Exponencial: X ∼ E(λ).I Otras: " distribuciones derivadas de la normal": χ2, t-Student.I Otras: Gamma, Beta, Weibull, Cauchy, Laplacian, etc.

    4 / 37

  • Distribución uniforme

    DefiniciónX se dice uniformemente distribuida en (a,b) si su función dedensidad está dada por

    f (x) =1

    b − aI(a,b)(x) =

    {1

    b−a a < x < b0 c.c.

    I Función de distribución acumulada:

    F (x) =

    0 x ≤ ax−ab−a a < x < b1 x ≥ b

    I E [X ] =a + b

    2.

    I Var(X ) =112

    (b − a)2.

    5 / 37

  • Gráficos

    f (x) =12I(3,5)(x) F (x) =

    0 x ≤ 3x−3

    2 3 < x < 51 x ≥ 5

    6 / 37

  • Distribución exponencial

    DefiniciónUna v.a. X con función de densidad dada por

    fλ(x) = λe−λx , x > 0,

    para cierto λ > 0 se dice una v.a. exponencial con parámetro λ.

    I E [X ] =1λ

    I Var(X ) =1λ2

    7 / 37

  • Función de densidad

    0 5 10 15 20 250

    0.1

    0.2

    0.3

    0.4

    0.5

    0.6

    0.7

    0.8

    0.9

    1

    8 / 37

  • Propiedades

    I Una variable aleatoria con distribución exponencial tiene falta dememoria.

    P(X > s + t | X > s) = P(X > t).I Son las únicas v.a. continuas con falta de memoria.I El análogo en el caso discreto son las v.a. geométricas.I F (x) = 1− exp(−λx)I Si X ∼ E(λ), entonces c X ∼ E( 1cλ).

    9 / 37

  • Mínimo de exponenciales

    Sean X1, X2, . . . , Xn son v.a. independientes con f.d.a. F1, F2, . . . ,Fn, y sea

    M = min1≤i≤n

    {X1,X2, . . . ,Xn} .

    Entonces

    1− FM(x) = P(M > x) = (1− F1(x)) · (1− F2(x)) · · · (1− Fn(x)).

    Si Xi ∼ E(λi ), entonces

    1− FX (x) = e−λ1x · e−λ2x . . . e−λnx = e−(∑

    i λi ) x .

    M ∼ E(λ1 + λ2 + · · ·+ λn).

    10 / 37

  • Distribución Normal

    DefiniciónLa v.a. X se dice normalmente distribuida con media µ y varianza σ2

    si su función de densidad de probabilidad está dada por

    f (x) =1√2πσ

    e−(x−µ)2/2σ2 , x ∈ R.

    I µ ∈ R, σ > 0.I Notación: X ∼ N(µ, σ).I Distribución normal estándar: Z ∼ N(0,1).

    fZ (x) =1√2π

    e−x2/2, x ∈ R.

    11 / 37

  • Variando µ

    I Máximo: x = µ

    I Valor Máximo:1√2πσ

    I1√2π' 0.398

    I1√2π 2

    ' 0.2

    12 / 37

  • Variando σ

    13 / 37

  • La desviación estándar

    I P(|X − µ| < σ) ' 68%I P(|X − µ| < 2σ) ' 95%I P(|X − µ| < 3σ) ' 99.7%

    14 / 37

  • Distribución Normal estándar

    Φ(x) = P(Z ≤ x) = 1√2π

    ∫ x−∞

    e−t2/2 dt .

    I No existe una fórmula cerrada para Φ(x).I Si X ∼ N(µ, σ), entonces

    aX + b ∼ N(aµ+ b, |a|σ).

    IX − µσ

    ∼ Z = N(0,1).

    I Si X ∼ N(µ, σ),

    P(X ≤ x) = Φ(

    X − µσ

    ).

    15 / 37

  • La función Φ(x)

    P(X ≤ 2) = P(Z ≤ 1) = Φ(1).

    16 / 37

  • Valores de Φ(x)

    I Para α ∈ (0,1), zα es el número real tal que

    P(Z > zα) = α.

    I Los valores de Φ(z) están tabulados:

    Φ(zα) = P(Z ≤ α) = 1− α

    I Φ(−z) = 1−Φ(z), por lo tanto es suficiente tabular para z ≥ 0, oz ≤ 0.

    17 / 37

  • Tabla de Φ(z)

    Z ∼ N(0,1)

    P(Z ≤ 1.51) = 0.93448

    z 0.00 0.01 0.02 0.030 0.5 0.50399 0.50398 0.51197...

    1.5 0.93319 0.93448 0.93574 0.93699...

    18 / 37

  • Valores usuales de zα

    I α = 0.05I zα = 1.64

    P(−1.64 ≤ Z ≤ 1.64) = 0.90

    19 / 37

  • Valores usuales de zα

    I α = 0.025I zα = 1.96

    P(−1.96 ≤ Z ≤ 1.96) = 0.95

    20 / 37

  • Valores frecuentes de zα

    I α = 0.01I zα = 2.33

    P(−2.33 ≤ Z ≤ 2.33) = 0.98

    21 / 37

  • Desigualdad de Chebyshev

    Lema (Desigualdad de Markov)Si X toma sólo valores no negativos y a > 0, entonces

    P(X ≥ a) ≤ E [X ]a

    .

    Teorema (Desigualdad de Chebyshev)Si X es v.a. con media µ y varianza σ2, entonces para k > 0

    P(|X − µ| ≥ kσ) ≤ 1k2.

    22 / 37

  • Leyes de los grandes números

    Si X1, X2, . . . , Xn, . . . son v.a. independientes e idénticamentedistribuidas, con media µ:

    I Ley débil de los grandes números:

    P(∣∣∣∣X1 + X2 + · · ·+ Xnn − µ

    ∣∣∣∣ > �)→ 0 n→∞.I Ley fuerte de los grandes números:

    Con probabilidad 1 se cumple que:

    limn→∞

    X1 + X2 + · · ·+ Xnn

    = µ.

    23 / 37

  • LGN

    0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000−40

    −20

    0

    20

    40

    60

    80

    100número de caras−número de cecas

    N=cantidad de tiradas−1000 0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

    0

    0.1

    0.2

    0.3

    0.4

    0.5

    0.6

    0.7frecuencia relativa=proporción de caras

    N=cantidad de tiradas

    24 / 37

  • Teorema Central del límite

    Teorema (Teorema Central del Límite)Sean X1, X2, . . . , variables aleatorias igualmente distribuidas, conmedia µ y varianza σ2. Entonces

    limn→∞

    P(

    X1 + X2 + · · ·+ Xn − nµσ√

    n< x

    )= Φ(x).

    25 / 37

  • Muestra finita

    80 90 100 1100

    1

    2

    3

    4

    551 intervalos

    80 90 100 1100

    1

    2

    3

    4

    5

    6

    725 intervalos

    80 90 100 1100

    2

    4

    6

    8

    10

    1215 intervalos

    80 90 100 1100

    2

    4

    6

    8

    10

    1210 intervalos

    26 / 37

  • Teorema Central del límite

    EjemploSupongamos que un programa suma números aproximando cadasumando al entero más próximo. Si todos los errores cometidos sonindependientes entre sí y están distribuidos uniformemente entre -0.5y 0.5 y se suman 1500 números, ¿A lo sumo cuántos númerospueden sumarse juntos para que la magnitud del error total semantenga menor que 10 con probabilidad 0.9?

    27 / 37

  • resolución

    Cada error cometido es una variable aleatoria εk con distribuciónU [−0.5,0.5]

    E(εk ) = [0.5 + (−0.5)]/2 = 0 Var(εk ) = (0.5− (0.5))2/12 = 1/12

    Definamos Sn =∑n

    k=1 εk , si deseamos encontrar el n más grandepara el cual

    0.9 = P(|Sn| < 10)

    Usando el TCL [S1500 − nE(ε)]/√

    nVar(ε) ∼ N(0,1) y

    P(|Sn| < 10) = P

    (−10− nE(ε)√

    nVar(ε)≤ Sn − nE(ε)√

    nVar(ε)≤ 10− nE(ε)√

    nVar(ε)

    )

    = P

    −10√n12

    ≤ Z ≤ 10√n12

    = 1− 2PZ ≤ −10√

    n12

    28 / 37

  • resolución

    por lo cual

    0.9 = 1− 2P

    Z ≤ −10√n12

    =⇒ PZ ≤ −10√

    n12

    = 0.05y −10√ n

    12

    = −1.65. Entonces, despejando resulta n = 10212

    1.652 = 440.7.

    29 / 37

  • Teorema Central del límite

    EjemploSuponga que se tienen 100 lámparas de un cierto tipo, cuya duraciónpuede modelarse como una variable exponencial de parámetroλ = 0.002. Si la duración de cada lámpara es independiente de laduración de las otras, encuentre la probabilidad de que el promediomuestral T = (1/100)(T1 + · · ·+ T100) se encuentre entre 400 y 550horas.

    30 / 37

  • ResoluciónComo n es 100, podemos suponerlo suficientemente grande yaproximar la distribución del promedio por una normal. Entonces laesperanza y varianza de Sn = T1 + · · ·+ Tn son

    E(Sn) = E(T1 + · · ·+ T100) = 100.E(T1) =100

    0.002= 50000

    Var(Sn) = Var(T1 + · · ·+ T100) = 100.Var(T1) =100

    0.0022

    P(400 ≤ (1/100)T1+· · ·+T100 ≤ 550) = P(40000 ≤ T1+· · ·+T100 ≤ 55000)

    ∼ Φ(55000− E(Sn)/√

    Var(Sn))− Φ(40000− E(Sn)/√

    Var(Sn))= Φ(55000− 50000/5000)− Φ(40000− 50000/5000)= Φ(1)− Φ(−2) = 0.8413− 0.0228 = 0.8185

    31 / 37

  • Distribución condicional

    I X e Y discretas:

    p(x , y) = pX |Y (x | y)pY (y)

    pX |Y (x | y) = P(X = x | Y = y) =P(X = x ∩ Y = y)

    P(Y = y)=

    p(x , y)pY (y)

    .

    P(X ≤ x | Y = y) =∑ai≤x

    pX |Y (ai | y)

    I X e Y conjuntamente continuas con densidad:

    fX |Y (x | y) =f (x , y)fY (y)

    =fY |X (y | x)fX (x)

    fY (y).

    P(X ≤ x | Y = y) =∫ x−∞

    fX |Y (s | y) ds.

    32 / 37

  • Esperanza condicional

    I X e Y conjuntamente discretas se define a la esperanzacondicional de X dado Y = y como

    E(X | Y = y) =∑

    x

    xpX |Y (x | y)

    E(X | Y = y) =∑

    x

    xP(X = x | Y = y) =∑

    x

    xP(X = x ,Y = y)

    P(Y = y)

    I X e Y conjuntamente continuas con densidad:

    E(X | Y = y) =∫

    xfX |Y (x | y)dx =∫

    xf (x , y)dx∫f (x , y)dx

    33 / 37

  • Proposición

    ProposiciónSea E(X | Y ) la variable aleatoria (función de la variable aleatoria Y )cuyo valor en Y = y es E(X | Y = y). Entonces

    E(E(X | Y )) = E(X )

    Para el caso X ,Y conjuntamente absolutamente continuo oconjuntamente discreto,

    E(X ) =∑

    y

    E(X | Y = y)P(Y = y)

    E(X ) =∫

    E(X | Y = y)fY (y)dy

    34 / 37

  • Esperanza condicional

    EjemploUna rata está encerrada en el centro de un laberinto con tresposibles salidas a diferentes corredores, A, B, C que llevan al interiordel laberinto donde hay una celda con comida. La rata tiende a elegirla puerta de su derecha (A) la mitad de las veces, mientras que laotra mitad de las veces elige B o C sin distinguirlas. Ahora, si elige lapuerta A tarda 2 minutos en encontrar la celda de la comida, si eligela puerta B tarda 3 minutos, y si elige la puerta C da vueltas dentrodel laberinto por 5 minutos y vuelve al lugar de partida (pero no se dacuenta, es decir cuando elige la puerta del corredor lo hacenuevamente con las probabilidades de inicio). Encuentre laesperanza de T , el tiempo que tarda la rata en encontrar su comida.

    35 / 37

  • Esperanza condicionalI Sea éxito elegir la salida A o B, y sea C̃ la variable aleatoria que

    mide la cantidad de veces que se elige la salida C hasta por finelegir A o B. Entonces C̃ es geométrica de parámetro 3/4 (queva desde el cero!!).

    I Sea T el tiempo que se tarda en encontrar la salida

    T ={

    2 + 5C̃ si se elige C̃ veces la puerta C y luego A3 + 5C̃ si se elige C̃ veces la puerta C y luego B

    I Sea D la variable que es 1 si se eligió la puerta A y 0 si se eligióla puerta B. Entonces

    E(T ) = E(E(T | D)) = E(T | D = 0)P(D = 0)+E(T | D = 1)P(D = 1)

    = (2 + 5E(C̃))23

    + (3 + 5E(C̃))13

    = 4

    36 / 37

  • Varianza Condicional

    DefiniciónX e Y variables aleatorias se define a la varianza condicional de Xdado el valor de Y como

    Var(X | Y ) = E [(X − E [X | Y ])2 | Y ]

    Esto es, Var(X | Y ) es una función de Y tal que en Y = y es lavarianza de X dado Y = y .

    Proposición

    Var(X ) = E [Var(X | Y )] + Var(E [X | Y ])

    37 / 37