of 61/61
8/18/2019 10. Estimadores de Parámetros http://slidepdf.com/reader/full/10-estimadores-de-parametros 1/61

10. Estimadores de Parámetros

  • View
    217

  • Download
    1

Embed Size (px)

Text of 10. Estimadores de Parámetros

  • 8/18/2019 10. Estimadores de Parámetros

    1/61

  • 8/18/2019 10. Estimadores de Parámetros

    2/61

    Suponga que X es una variable aleatoria con media   y varianza   f2. Sea Xl  X 2 , ••• , XIIuna muestra alea

    de X de tamaño

    n.

    Demuestre que la media de la muestra

    X

    y la varianza de la muestra

     

    son estimadore

    sesgados de

     

    y

      f2,

    respectivamente. Considere

    Esto es,   es un estimador insesgado de 8 si en promedio  sus valores son iguales a   J. Obs

    que esto equivale a requerir que la media de la distribución de la muestra de   sea igual a 8.

     1e = 8.

    Una propiedad deseable de un estimador es que debe estar  cerca , en cierto sentido, del valor

    dadero del parámetro desconocido. Formalmente, decimos que   es un estimador insesg o  o

    tral

    del parámetro 8 si

    10 1 1 Propiedades de los estimadores

    Puede haber varios estimadores puntuales potenciales diferentes para un parámetro. Por e

    plo, si deseamos estimar la media de una variable aleatoria, podríamos considerar la media d

    muestra, la mediana de la muestra, o quizá el promedio de las observaciones más pequeña

    y

    grande en la muestra como estimadores puntuales. Para decidir cuál es el mejor estimador pun

    que puede usarse de un parámetro particular, necesitamos examinar sus propiedades estadístic

    desarrollar algunos criterios para estimadores comparativos.

    Las siguientes son estimaciones por puntos razonables de estos parámetros:

    • para

    / 1  

    la estimación es {l=

     

    la media de la muestra

    • para 0 2, la estimación es   2

     

    5 1 la varianza de la muestra

    • para p la estimación es

    p

    =

    X/n, la proporción de la muestra, donde X es el número de o

    tos en una muestra aleatoria de tamaño n que pertenece a la clase de interés

    • para / 1 1 - / 1 2 la estimación es { l1 { l2

     

    X I - X2 la diferencia entre las medias de la mu

    de dos muestras aleatorias independientes

    • para

    P I - P2

    la estimación es

    P I - P2

    la diferencia entre dos proporciones de la muestra ca

    ladas a partir de dos muestras aleatorias independientes

    Los problemas de estimación ocurren con frecuencia en ingeniería. A menudo necesitamos es

    los siguientes parámetros

    • la media

    / 1

    de una sola población

    • la varianza

    0 2

     o desviación estándar de

    a

    de una sola población

    • la proporción

    p

    de artículos en una población que pertenece a la clase de interés

    • la diferencia entre las medias de dos poblaciones, / 1 1 - / 1 2

    • la diferencia entre dos proporciones de población, p¡ -

    P2

     6

    PROBABILIDAD Y ESTADíSTICAPARA INGENIERíA

  • 8/18/2019 10. Estimadores de Parámetros

    3/61

    ECM e E[e - E e ]2

    + [8

    E e ]2

    El error cuadrático medio puede reescribirse como sigue:

     10-2

    El error cuadrático medio  ECM, conocido también como MSE, por sus siglas en inglés) de un

    e se define como

    Por tanto, la varianza de la muestra   es un estimador insesgado de la varianza de la población 0 2. Sin

    bargo, la desviación estándar S de lamuestra es un estimador sesgado de la desviación estándar O de la po-

    ación. En el caso de muestras grandes, este sesgo es despreciable.

     

    n/12

    +

    n0 2 - n/12 - 0 2)

    n

    = 0 2.

    Sin embargo, puesto que E X7) =

    /1 2 +

    0 2 YE X2) =

    /1 2 +

    0 2/n, tenemos

    = n ~

    1

    E ±XT - nX2)

     

    =  [ L n E c x b

    nECX2)] .

    i=1

      L n

    2  

    =--E X . +X2-2 XX)

    n   1  

    i=l

     

    n  

    =-E~CX-X )2

    i=1

    [

    ±C X ¡

    _X)2]

    EC S2  

    E _i=_I _

    En consecuencia, la media de la muestra

    X

    es un estimador insesgado de la media de la población

    /1 .

    Con-

    ere ahora

      n

    E X)  

    :L /1

     

    /1 .

    n i=1

    puesto que ECX i)   /1 para toda

    i

      1, 2, ... , n,

      11

     

    :L ECX ¡

    n i=1

    ESTIMACiÓN

    DE

    PARÁMETROS

     6

  • 8/18/2019 10. Estimadores de Parámetros

    4/61

    Puesto que  1/n < 1 para tamaños de muestra n ~ 2 concluiríamos que la media de la mue

    es un mejor estimador de

    J i

    que una sola observación

    X;

    Dentro de la clase de estimadores insesgados nos gustaría encontrar el estimador que tien

    varianza más pequeña. Éste se llama estimador insesgado de varianza mínima. La figura 10 1m

    tra la distribución de probabilidad de dos estimadores insesgados

     

    y e 2, teniendo

     

    una vari

    más pequeña que e

    2.

    El estimador

     

    producirá con mayor probabilidad que e

    2

    una estimación

    cercana al valor verdadero del parámetro desconocido  

    Es posible obtener una cota inferior en la varianza de todos los estimadores insesgados  

      un estimador insesgado del parámetro

    e  

    basado en una muestra aleatoria de

    n

    observacione

    ECM X 2/n 1

      = =

    ECM X¡

    a2 n

    Si esta eficiencia relativa es menor que uno concluiríamos que é l es un estimador más efi

    te de

    e

    que é

    2

    en el sentido de que tiene un error cuadrático medio más pequeño. Por ejemplo

    ponga que deseamos estimar la media J i de una población. Tenemos una muestra aleatoria

    observaciones   l

    X 2 .•• Xn

    y deseamos comparar dos estimadores posibles para J i la media

    muestra

    X

    y una sola observación de la muestra digamos

    Xi

    Observe que tanto

    X

    como

    Xi

    so

    timadores insesgados de

    J i ;

    en consecuencia el error cuadrático medio de ambos estimadores es

    plemente la varianza. Para la media de la muestra  tenemos

    ECM X  V X

    o- n donde a

    2

    varianza de la población; en una observación individual tenemos

    ECM X

    i =

    V X¡

    2.

    Por t

    la eficiencia relativa de

    X ¡

    a   es

    ECM el 

    ECM e2 ·

    Esto es el error cuadráticomedio de e es igual a la varianza del estimadormás el sesgo al cu

    do. Si

    e

    es un estimador insesgadode e   el error cuadrático medio de

    e

    es igual a la varianza de

    El error cuadrático medio es un criterio importante para comparar dos estimadores. Sean

     

    dos estimadores del parámetro

    e

    y

    ECM el

    y

    ECM e2

    los errores cuadráticos medios de

     

    Entonces la eficiencia relativa de

     

    a

     

    se define como

     

    PROB BILID D Y EST DíSTIC P R INGENIERí

  • 8/18/2019 10. Estimadores de Parámetros

    5/61

    1

    [

    X

      1 l ] 2

    nE

    2

    V X ) ~ _ _ :- -

    1 -:-

    nE ~

    [ ln GJ2i l ~ X :~

    n

    Al sustituir en la ecuación 10-4 obtenemos

      X   1 l 2

      In O v 2]t) -   0 .

    Demostraremos que la media de la muestra

     

    es el estimador insesgado de varianza mínima de la media de

    una distribución normal con varianza conocida.

    En el ejemplo 10.1 observamos que   es un estimador insesgado de   Observe que

    Esta desigualdad se denomina cota inferior de Cramér-Rao. Si un estimador insesgado é satis

    face la ecuación 1 4 como una igualdad, se tratará del estimador insesgado de varianza mínima

    de 8.

     l0-4

    considere que

    ¡ x

    8) denota la distribución de probabilidad de la variable aleatoria X. Entonces una

    cota inferior en la varianza de é es

    1

    ESTIMACiÓN DE PARÁMETROS

      7

  • 8/18/2019 10. Estimadores de Parámetros

    6/61

    Distribución de

     

    1

    Uno de los mejores métodos para obtener un estimador puntual es el de máxima verosimilitud. Sup

    ga que X es una variable aleatoria con distribución de probabilidad

    f x  e  

    donde

    e

    es un paráme

    10 1 2 Método de máxima verosimilitud

    La consistencia es una propiedad de muestras grandes, puesto que describe el comportamien

    en el límite del estimador é conforme el tamaño de la muestra tiende al infinito. Suele ser difícil

    mostrar que un estimador es consistente usando la definición de la ecuación 10-5. Sin embargo,

    estimadores cuyo error cuadrático medio o varianza, si el estimador es insesgado tiende a c

    cuando el tamaño de la muestra se acerca al infinito, son consistentes. Por ejemplo, X es un estim

    dor consistente de la media de una distribución normal, puesto que X es insesgado

    y

    lím

    V X

    lím   J2 /n  

    O

    n--7~

    n--7~

     lO

    Encontramos algunas veces que los estimadores sesgados son preferibles a los insesgados

    que tienen un error cuadrático medio más pequeño. Esto es, podemos reducir la varianza del esti

    dor de manera considerable introduciendo una cantidad relativamente pequeña de sesgo. En t

    que la reducción en la varianza sea mayor que el sesgo al cuadrado, se obtendrá un estimador m

    rado en el sentido de error cuadrático medio. Por ejemplo, la figura 10-2 muestra la distribución

    probabilidad de un estimador sesgado

    {j 

    con varianza menor que el estimador insesgado

    {j2

    S

    más probable que una estimación basada en

    {jl

    estuviera más cerca del valor verdadero de

    e

    que

    basada en

    {j2

    Veremos una aplicación de la estimación sesgada en el capítulo 15.

    Un estimador

    { j 

    con un error cuadrático medio menor o igual al error cuadrático medio de c

    quier otro estimador

    {j

    para todos los valores del parámetro

    e  

    se llama estimador óptimo de

    e  

    Otra manera de definir la cercanía de un estimador

    { j

    a un parámetro

    e

    se da en términos d

    consistencia. Si

    {jn

    es un estimador de e basado en una muestra aleatoria de tamaño n decimos

    én

    es consistente para e si, para

    e >

    Pu~to que sabemos que, de manera general, la varianza de la media d e la muestra es

    V X  J2/n 

    vemo

    V X 

    satisface la cota inferior de Cramér-Rao con una igualdad. En consecuencia,

    X

    es el estimador

    gado de varianza mínima de 1 1 para la distribución normal donde

     J2

    es conocida.

      8 PROBABILIDAD Y ESTADíSTICA PARA INGENIERíA

  • 8/18/2019 10. Estimadores de Parámetros

    7/61

    n

    L Jl)

     

    II

    _1_e- xi-Jl 2/2r:Jl

    i

     

    1  .,fiii

    =

     

    e- I/2r:Jl i xi-Jl 2

     2na2 n /2 i=1 •

    Sea X distribuida normalmente con media u desconocida y varianza a

    2

    conocida. La función de verosimilitud

    de una muestra de tamaño

    n

    es

    que, intuitivamente, es una respuesta satisfactoria. Por supuesto, se debe realizar una prueba de segunda deri-

    vada, pero aquí la obviaremos.

    Al igualar esto a cero y despejarp, se obtiene el estimador de máxima verosimilitud, p , como

    i x ¡   n - i x ¡  

    d InL P) __ i_=I_ _  =1

    dp _ p --- -:l;---p- ---

    Luego,

    Observamos que si

     

    maximiza L P), entonces

     

    también maximiza In L  P), ya que el logaritmo es una

    función monótona creciente. Por tanto,

    i=1

     

    n L x ; n   I x ¡

    L p)   p ¡  1_p)J-x¡  P i=1  1_p) i=l

    donde

    p

    es el parámetro que se va a estimar. La función de verosimilitud de una muestra de tamaño n sería

    x

    =

    0 1 

    en otro caso,

    O  

    p x)

      p 1_

    p)I-x,

    Sea X una variable aleatoria de Bemoulli. La función de probabilidad es

    Observe que la función de verosimilitud es ahora función únicamente del parámetro descono-

    cido 8. El estimador de máxima verosimilitud  EMV,o MLE, por sus siglas en inglés  de 8 es el valor

    de 8 que maximiza la función de verosimilitud L 8 . E n esencia, el estimador demáxima verosimili-

    tud es el valor de 8 que maximiza la probabilidad de ocurrencia de los resultados de la muestra.

    00-68

    f xl

    8 .

    f X2 

    8 · ... .

    f x

    n,

    8).

    desconocido único. Sean

    XI  X

    2, ••. ,

    X

    n los valores observados en una muestra aleatoria de tamaño

    n. Entonces, lafunción de verosimlitud de la muestra es

    ESTIM CiÓN DE P RÁMETROS

      9

  • 8/18/2019 10. Estimadores de Parámetros

    8/61

    Considere que X se distribuye normalmente con media Ji y varianza 0 2, donde tanto Ji como

    0 2

    se de

    cen. Encuentre los estimadores de máxima verosimilitud de

    Ji

    y

    0 2.

    La función de verosimilitud pa

    El método de máxima verosimilitud puede emplearse en situaciones en las que se requiere es

    varios parámetros desconocidos por ejemplo 8

    1

    8

    2 ... 8k.

    En tales casos la función de verosim

    es una función de los

    k

    parámetros desconocidos 81, 82, ••• ,

    8

    k

    los estimadores de máxima vero

    1itud { ¡} se encontrarían igualando a cero las primeras

    k

    derivadas parciales

    aLc81 ,

    82 ...

    8

     

    1 2 ...

    k ,  

    resolviendo el sistema de ecuaciones resultante.

    Observe que la pendiente de esta función no es cero en todas partes por lo que no podemos utiliz

    todos de cálculo para encontrar el estimador de máxima verosimilitud á. Sin embargo la función de v

    militud aumenta cuando

    a

    disminuye. Por tanto maximizaríamos

    L a)

    fijando á como el valor más pe

    que podría suponerse en forma razonable. Por supuesto a no puede ser más pequeña que el valor más g

    de la muestra de modo que usaríamos la observación más grande como

    á.

    Así

    á  máx X¡

    es el EMV

    n

     

    L a)   n

    ;=1 a a

    Considere que X se distribuye uniformemente en el intervalo de   a

    a.

    La función de verosimilitud d

    muestra aleatoria de

    Xl

    X2 X

    n

    de

    tamaño

    n

    es

    No siempre es posible utilizar métodos de cálculo para determinar el máximo de

    L 8 .

    E

    ilustra en el siguiente ejemplo.

    como el estimador de máxima verosimilitud de Ji.

     

    n _

    fl=-~X.=X

    n ¿_

    ;=1

    d   n L Ji) _

    2)-1~ )

    ---- - - - O ¿ _

    X ; - Ji .

    dJi ;= 1

    . Al igualar a cero este último resultado y despejar

    Ji

    se obtiene

    y

    n

      n L Ji)   - n/2)ln 2Jr0 2)_ 20 2)-1 L x; Ji)2

    ;=1

    Ahora

    7 PROBABILIDAD Y ESTADíSTICA PARA INGENIERíA

  • 8/18/2019 10. Estimadores de Parámetros

    9/61

     

    grande. Los estimadores de máxima verosimilitud también son consistentes. Además, tienen

    propiedad de invarianza; esto es, si   es el estimador de máxima verosimilitud de e y u e es una

    nción de

    e

    que tiene un inverso de un valor único; entonces el estimador de máxima verosimilitud

    u e)

    es

    u e .

    Se puede demostrar en forma gráfica que la máxima verosimilitudse ubicará en el valor del má

    o estimadorde verosimilitud.Considereuna muestra de tamaño

    n

    =

    10de una distribuciónnormal:

    Los estimadores de máxima verosimilitudno son necesariamenteinsesgados véase el estimador

    máximaverosimilitud de  

    2

    en el ejemplo 10.6 ,pero es usual que puedan modificarse con facili

    ad para hacerlos insesgados. El sesgo se aproxima a cero en muestras grandes. En general, los esti

    adores demáxima verosimilitud tienen buenaspropiedades de muestra grande, llamadas   sintótic s

    specíficamente,los EMV se distribuyenen forma asintótica, son insesgadosy tienenuna varianzaque

    e aproxima a la cota inferior de Cramér-Raopara n grande. De modo más preciso, decimos que si  

    el estimador de máxima verosimilitud para

    e . . ¡n

      e

    e

    se distribuye normalmente con media ce

    y varianza

    e están muy relacionados con la varianza insesgada

     

    de la muestra, a saber:

    a

    2

    =   n - 1 /n S2.

    ~   ~

    fl

    = ; ;:~ x, =

    X

     =

    Las soluciones de las ecuaciones anteriores producen los estimadores de máxima verosimilitud

    dln L fl,a2 

    =

    _l_i, xi _ fl)

    =

    0,

    dfl

    0 2 i=1

    dln L ji,a2

    =

    -n

     

    _ _

    ±

     X _

     2 = o  

    d 0 2) 20 2 20 4 i=1

      fl

    Luego,

    n

      ~  

    In L  fl,a

    2  =  

    -ln 2n-a

    2  - -- ~  X i -

    fl)2.

    2 20 2 ;=1

    y

    ESTIMACiÓN DE PARÁMETROS  7

  • 8/18/2019 10. Estimadores de Parámetros

    10/61

    Los momentos { 1 1 ; } de la población serán en general funciones de los k parámetros desco

    dos

    {e

    i}. Al igualar los momentos de la muestra y los momentos de la población se produci

     discreta.  1 2 ...

    k,

    X continua1 2 ... k,

    1 ;   E X

    t)

     f~ x

    t

    f x; e 1 , e 2 , , e k dx,

     

    X

    p x; ~1,e2 ,  

    k

    X x

    Los primeros

    k

    momentos de la población en tomo al origen son

     

     

    1 2 ...

    k.

    Suponga que X es una variable aleatoria continua con densidad de probabilidadf x; e l e 2 , . . .

    o una variable aleatoria discreta con distribuciónp x;

    el

    2 ••• k caracterizada por k parám

    desconocidos. SeaXI

    2 ... , X;

    una muestra aleatoria deX de tamaño n; definimos los prime

    momentos de muestra respecto del origen como

    10 1 3 Método de momentos

    Figura 1 3 Log de la función de verosimilitud de diferentes medias.

    Media de la muestra

    -700 22

      J

      -600

     87

    6

     4

    3

    -500

    Suponga que se sabe que la varianza de la población es igual a 4. Según se ha demostra

    EMV para la media 1 1 . de una distribución normal es igual a

    X

    Para este conjunto de datos

    La figura 10-3presenta ellog de la función de verosimilitud para diferentes valores de la media

    serve que el valor máximo de la función log de verosimilitud está aproximadamente en  2

    gunas veces. la función de verosimilitud es relativamente plana en una región alrededo

    máximo. Esto se puede deber al tamaño de la muestra tomada de la población. Una muestra

    maño pequeño puede conducir a un log de verosimilitud muy plano. lo que implica menor

    sión en la estimación del parámetro de interés.

     

    PROBABILIDAD y ESTADíSTICA PARA INGENIERíA

  • 8/18/2019 10. Estimadores de Parámetros

    11/61

    El método de momentos suele producir estimadores razonablemente buenos. En el ejemplo 10.7,

    por mencionar un caso, los estimadores de momento son idénticos a los estimadores de máxima

    verosimilitud. En general, los estimadores de momento se distribuyen aproximadamente de man

    era normal y asintótica, y son consistentes. Sin embargo, su varianza puede ser mayor que la varian

    za de los estimadores obtenidos por otros métodos, tales como el método de máxima verosimilitud.

    o el estimador del momento de a es exactamente el doble de la media de la muestra.

    a

    = X

    El primer momento de la muestra es justamente   Por consiguiente,

    Considere que X se distribuye uniformemente en el intervalo O,a  Para encontrar un estimador de a por el

    método de momentos, tenga en cuenta que el primer momento de población alrededor de cero es

      ; :

    ~ Í , X f - n X 2   =  Í, X ¡_X 2.

    ~l  

    con la solución

    f . 1 ; ; : f . 1 ,

    /12;:  }  J i  

    Los momentos de la muestra son m i ; :

     lIn L7=¡X¡

    y

    m;;: lln L7=¡X7.

    De acuerdo con la ecuación 10-9 ob

    tenemos

    Sea X - N f . 1 ,

     }2 ,

    donde f . 1 y

     }2

    se desconocen. Para obtener estimadores para J i y

     }2

    por el método de mo

    mentos, recuerde que para la distribución normal

    La solución de la ecuación 10-9, denotada 81, 82, ... ,

     

    produce los estimadores de momen

    to de e l e 2 , . . . , e k .

    ESTIM CiÓN DE P RÁMETROS

     7

  • 8/18/2019 10. Estimadores de Parámetros

    12/61

    La distribución conjunta de la muestra y

     j

    en el numerador de la ecuación 10-10, son producto

    la distribución anterior de

     j, y

    la verosimilitud

    (lO-l

    Definimos la

    distribuciónposterior

    de

     j,

    como la distribución condicional de

     j

    dada por los

    sultados de la muestra. Esto es exactamente

    En los capítulos anteriores hemos hecho un amplio estudio del uso de la probabilidad. Hasta ah

    hemos interpretado las probabilidades en el sentido de la frecuencia; es decir, si se refieren a un

    perimento que se puede repetir un número indefinido de veces: si la probabilidad de que ocurra

    evento

    A

    es 0.6, entonces podríamos esperar que

    A

    ocurriera aproximadamente en 60  de los en

    yos experimentales. Con frecuencia, esta interpretación de la probabilidad se llama objetivismo

    punto de vista clásico.

    La inferencia bayesiana requiere una interpretación diferente de la probabilidad, que se lla

    punto de vista subjetivo. Con frecuencia encontramos enunciados subjetivos, tales como: Exi

    30  de posibilidades de que llueva hoy . Los enunciados subjetivos miden un  grado de confi

    za personal respecto de algún evento, más que una interpretación de la frecuencia. La inferencia

    yesiana requiere hacer uso de la probabilidad subjetiva para medir nuestro grado de confian

    respecto de un estado de la naturaleza. Es decir, debemos especificar una distribución de probab

    dad para describir nuestro grado de confianza respecto de un parámetro desconocido. Este proce

    miento es totalmente diferente de lo que hemos analizado con anterioridad. Hasta ahora,

    parámetros se han tratado como constantes desconocidas; la inferencia bayesiana requiere consi

    rarlos como

    variables aleatorias

    Suponga que

    f

    j

    es la distribución de probabilidad del parámetro o estado de la naturaleza

     j

    distribución f

    j

    resume nuestra información objetiva de

     j

    antes de obtener los datos de la mues

    Obviamente, si tenemos cierta certeza en relación con el valor de

     j,

    podemos elegir f

    j

    con una

    rianza pequeña, en tanto que si tenemos duda respecto del valor de

     j,

    podemos elegir f

    j

    con

    varianza más grande. Llamamos f 

    j

    la distribución anterior de

     j.

    Ahora consideremos la distribución de la variable aleatoria X. La distribución de X denotada

    f x

      j

    indica que la distribución depende del parámetro desconocido

     j.

    Suponga que tomamos

    muestra aleatoria X, digamos Xl'

    X2 •   X 

    La función de verosimilitud

    conjunta

    de la muestra e

    10 1 4 Inferencia bayesiana

    El estimador en ese ejemplo no siempre genera una estimación compatible con nuestro cono

    miento de la situación. Por ejemplo, si nuestras observaciones de la muestra fueran XI   60, X

    10 y

    x

    5, entonces

     

    50, que no es razonable, puesto que sabemos que

    a

      60.

     7 PRO ILID D Y EST DíSTIC P R INGENIERí

  • 8/18/2019 10. Estimadores de Parámetros

    13/61

    Por tanto, usando la ecuación 10-12, la densidad posterior para íl es

    donde k se debe elegir dependiendo del conocimiento exacto o del grado de confianza que se tiene en relación

    con el valor de íl La densidad conjunta de la muestra y de íles

    f( x l  x2 ... , X n;A )  kílne-A (D ,+ k).

    y la densidad marginal de la muestra es

    f(xl  x2 ... , xn 

    kíl e-A(Lx,+ k) díl

     r n

     

    1

    (LX i

     

    kr

    l

    en otro caso,

     

    íl>

     

    A I x  

    f( x l X2 .. . , xnlíl) = íl ne  = •

    Suponga que, según nuestras consideraciones, la distribución anterior también es exponencial para íl,

    Se sabe que el tiempo de vida útil de un transistor se distribuye de manera exponencial con parámetro

    í

    Pa

    ra una muestra aleatoria de n transistores, la densidad conjunta de los elementos de la muestra, teniendo en

    cuenta íl, es

    Observamos que se ha usado el teorema de Bayes para transformar o actualizar la distribución an

    terior en la posterior. La distribución posterior refleja nuestro grado de confianza de 8 de acuerdo

    con la información proporcionada. Además, la distribución posterior es proporcional al producto de

    la distribución anterior y la verosimilitud. La constante de proporcionalidad está dada por la cons

    tante de normalización de f( x l x2 ... , xn .

    Así, la densidad posterior de e expresa nuestro grado de confianza respecto del valor de e   to

    mando en cuenta el resultado de la muestra.

     10-12

    10-11

    { ~

    f (8 )f (X I x 2 ... , x

    n

    l8 ) d8 , x

    c.ontinua,

    f( x l x2 .••   Xn  -

    Lf(8)f(Xl X2 . .. , xnI8), x discreta.

    e

    En consecuencia, podemos escribir la distribución posterior de 8 como

    El denominador de la ecuación 10-10, que es la distribución marginal de la muestra, es exacta

    nte una constante de normalización obtenida a partir de

    ESTIMACiÓN DE PARÁMETROS

     7

  • 8/18/2019 10. Estimadores de Parámetros

    14/611

    f~e{d XI x2   .. . , xn);O}t x¡, x2   .. . , xn 10)r O)dO

    = f~e  e;o)r x l x2 ... , xn ;O)dO

    =

    f xl, x2   ... , xn ) e e ;o )r O lx¡, x2 ... , x n)d O .

    La función B será minimizada si podemos encontrar una función d que minimice la can

    dentro de las llaves más grandes de la ecuación 10-14 para cada conjunto de valores   Es de

    estimador bayesiano de

    O

    es una función

    d

    de las

    Xi

    que minimiza

    Definimos

    al

    estimad o r d e B a yes del parámetro O ,como una función d de la muestra l X2 ,

    que minimiza el riesgo esperado. 0, intercambiando el orden de integración de la ecuación 10-1

    tenemos

     1

    B d )

     

    E [ R d ;O )]

     

    R d ;O) f O) d O

    = f ~ { f ~   f ~ e{d x), x2   .. . , xn ); O } f X I x 2  .. . , xn l O )dx

    l

    d x2 .. . d X n } f O ) d O .

    R d ; O )

     

    E [e é;O)]

      f ~ f ~ . . .~

    e{d  X I X 2   ... , xn );o } f  xl  X 2   .. . , X n   O )d x) , d X 2 ... d xn ,

    donde la función d xl, x2 ... , xn )  una notación alterna para el estimador e, es simplemente un

    ción de las observaciones. Puesto que O es considerada una variable aleatoria, el riesgo en sí m

    es una variable aleatoria. Nos gustaría encontrar la función d que minimice el riesgo esperado

    cribimos el riesgo esperado como

    10 1 5 Aplicaciones de la estimación

    En esta sección analizaremos la aplicación de la inferencia bayesiana al problema de la estim

    de un parámetro desconocido de una distribución de probabilidad. Sea

    X X

    2  •

    X ;

    una m

    aleatoria de la variable aleatoria X que tiene una densidadf x

    lO

    Queremos obtener un punto

    timación de O . S e a f O ) la distribución anterior de O , y sea e e; O ) la fu n ció n d e p érdid a . La fu

    de pérdida es una función de penalización que refleja el  pago que debe hacerse por no iden

    O como una realización de su estimador puntual e. Elecciones comunes para e e; O ) son  e -

    l 2. Generalmente, entre menor es la precisión de una realización de

    e  

    más se debe pag

    conjunción con una función de pérdida particular, el riesgo se define como el valor esperado

    función de pérdida respecto de las variables aleatorias XI x

    2 ... ,

    X ; que contienen a

    e

    En otr

    labras, el riesgo es

    276

    PROBABILIDAD Y ESTADíSTICAPARAINGENIERíA

  • 8/18/2019 10. Estimadores de Parámetros

    15/61

     

    <

    /l

    <

    =.

     /l _1_

    e- 1/2 ¡.P

    v 2 1 t

    Sea

    XI

    X2, ... , Xn una muestra aleatoria de densidad normal con media /l y varianza 1, donde /l se desconoce.

    Suponga que la densidad anterior para /l es normal con media   y varianza 1; es decir

    Observe que el resultado que produce cada uno de los métodos es diferente. La estimación de Bayes es

    ligeramente más cercana a la estimación anterior que el estimador de máxima verosimilitud.

    A   = _ _

     

    = 0.06667.

    n 1500

      i

    ;=1

    En consecuencia, el estimador de máxima verosimilitud de A,con base en la muestra de datos anterior, es

    Podemos comparar este resultado con los que obtendríamos mediante métodos clásicos. El estimador de

    máxima verosimilitud del parámetro

    A

    en una distribución exponencial es

    1

    x¡ k

    i=1

      n l = 10   1 = 0.06707.

    1500

     

    140

    Suponga que, en el problema del tiempo de vida útil del ejemplo 10-9, una distribución anterior razona

    ble es una exponencial para A que tiene un parámetro k = 140.Esto es equivalente a decir que la estimación

    anterior para

    A

    es 0.07142. Una muestra aleatoria de tamaño n = 10 da por resultado I . } ~ l x¡= 1500. La esti

    mación bayesiana de   es

      1 1  1

    A==

    Considere la situación que se planteó en el ejemplo 10-9, donde se mostró que si la variable aleatoria X está

    distribuida exponencialmente con parámetro A   y si lad istribución anterior para A es exponencial con paráme

    tro k la distribución posterior para A es una distribución gamma con parámetros 1 1  1 YI . ; ~ I X¡  k   Por tan

    to, si se supone una función de pérdida del error cuadrático, el estimador de Bayes para

    A

    es la media de esta

    distribución gamma

    Si la función de pérdida f O ; O es la pérdida del error cuadrático   O - 0 2, podemos mostrar que

    el estimador bayesiano de O,digamos O , es la media de la densidad posterior para O véase el ejer

    cicio 10-78 .

    ESTIMACiÓN DE PARÁMETROS

     

  • 8/18/2019 10. Estimadores de Parámetros

    16/61

    n

    L X i

     

    n X  =

    11

    = = .

    n + 1 n + 1

    Por tanto, la densidad posterior para 1 1es una densidad normal con media nX/ n   1 Yvarianza   n  

    Si la función de pérdida C f l 1 1 )es el error cuadrático, el estimador de Bayes de 11es

      n

     

    1)1/2

    { l

    [2 2n ,i1 1 n

     

    ,i2 )}

    -----,-,-- exp - -   n+

    1

    1 1 - ---   ---

      2 n )

    1/2

    2

    n +

    1

      n + 1 )2

      n  

    1)1/2

    exp{-

    _ _

      n   1) [11-   x ] 2 }

    2 n ) 1/2 2 n + 1

    {

    1( n2,i2)}

    2 n)-n /2 n   1 -112 exp -  2   : x f ; ; : ; : ¡

    2n)- n+I)/2 ex

    p{-

    -i[L x f+ n+

    1 112

    2n.i11]}

    usando el hecho de que el valor de la integral es   21t)1/2/ n  

    1 1/2

     ya que una densidad normalizada se

    gra a 1 .Ahora la densidad posterior para 11es

    1 [ 1 ,i2 )]

    exp--

    2:r---

      n   1)1/2   2n)n/2 2   n + 1

    ¡(XI x 2 ... , x n)

      _1 -

    exp[- _ _(2:x f n2,i2)] x

    [_1_

    f = exp[- _ _   n +

    1 11-

    n ,i   2 ] d l1 ]

      2n) nl2 2 n + 1   2n)1/2 .c.co 2 n+ 1

    Completando el-cuadrado en el exponente dentro de la integral, obtenemos

    ¡(XI X 2 . . . X n 1 exp {- _ _ _ _ _ 2 : X ¡ } f = exp {- _ _ _ _ _ [ e n + 1 1 1 2  

    2 J n X l }

    d u .

      2n) n+I)/2

    2 ~ 2

    La densidad marginal de la muestra es

    Así, la densidad conjunta de la muestra y 1 1es

    ¡ x

     

    1

      ) =__ e - 1 /2 )L x , 11 ) 

    l 2 n  

    2n)n/2

    La densidad condicional conjunta de la muestra dada 1 1es

      8 PROBABILIDAD Y ESTADíSTICAPARA INGENIERíA

  • 8/18/2019 10. Estimadores de Parámetros

    17/61Observe que el error estándar es aproximadamente 0.2 de la media de la muestra, lo que implica que he

    os obtenido una estimación puntual más o menos precisa de la conductividad térmica.

      ¡

    = =

    0.~4

    =

    0.0898.

    v n

    viO

    El error estándar de la media de la muestra es  Ji

     

    J/ln 

    y

    puesto que

     

    se desconoce, podemos sustituir

    a por la desviación estándar de la muestra para obtener el error estándar estimado de  

    x

     

    41.924 Btu/h-ft-°F.

    Una estimación por puntos de la conductividad térmica media a 100°F

    y

    550 W, es la media de la

    , o

    41.60,41.48,42.34,41.95,41.86,

    42.18,41.72,42.26,41.81,42.04.

    n artículo del Journal of Heat Transfer (Trans. ASME, Ses.   96, 1974, p. 59) describe un método para me

    ir la conductividad térmica de hierro Arrnco. Al emplear una temperatura de 100°F

    y

    una entrada de poten

    ia de 550 W, se obtuvieron las siguientes 10 mediciones de conductividad térmica (en Btu/hr-pie-f F):

    Si   o involucra cualesquiera parámetros desconocidos, entonces si sustituimos estimaciones de

    stos parámetros en la ecuación 10-17, obtenemos el

    error estándar estimado de ,

    digamos a { j o Un

    rror estándar pequeño implica que se ha presentado una estimación relativamente precisa.

    (10-17)

    uando presentamos el valor de una estimación puntual, suele ser necesario dar alguna idea de su

    recisión. El error estándar es la medida de precisión más usual. Si () es un estimador de e   el error

    tándar de   es justamente la desviación estándar de (), o

    10 1 6 Precisión de la estimación: el error estándar

    a diferencia entre los dos estimadores es pequeña comparada con 1 I J Y i   En problemas prácticos, una

    uestra de tamaño moderado produce aproximadamente la misma estimación, ya sea usando el mé

    odo de Bayes o el método de máxima verosimilitud si los resultados de la muestra son consistentes

    on la información que se asumió previamente; de lo contrario, la estimación de Bayes puede dife

    ir considerablemente de la estimación de máxima verosimilitud. En tales circunstancias, si los re

    ultados de la muestra se aceptan como correctos, la información previa debe ser errónea. Entonces,

    a mejor estimación a usar es la estimación de máxima verosimilitud.

    Si los resultados de la muestra no están de acuerdo con la información anterior, el estimador de

    s tenderá a producir una estimación que esté entre la estimación de máxima verosimilitud y los

    upuestos previos. Si hay más inconsistencia entre la información anterior y la muestra, habrá una

    an diferencia entre las dos estimaciones. Para analizar una muestra de esto, véase el ejemplo 10-10.

    ESTIM IÓN DE P RÁMETROS   9

  • 8/18/2019 10. Estimadores de Parámetros

    18/61

    100 2

    : ¿ } . , ; -

    0.00551)

    : } . ; -

    X 2

    La media de la distribución exponencial está dada por

    E X)

    = 1/A También se sabe que

    E X)

    =

    l/A.

    estimación razonable para A es entonces }.,=1/x.A partir de los datos de la muestra, encontramos   = 19

    lo que da como resultado}.,= 1/192.44= 0.00520. Se generaron B = 100muestras bootstrap de tamaño n

    usando Minitab conf x;0.00520 = 0.00520e-O·00520x.Algunas estimaciones bootstrap semuestran en

    bla 1O-l. 100

    Se encuentra que el promedio de las estimaciones bootstrap es de

    X

    = I :/100=0.0055l. El error e

    dar de la estimación es i=l

    195.2, 20l.4, 183.0, 175.1,205.1,191.7,188.6,173.5,200.8,210.0.

    Se sabe que los tiempos de falla X de un componente electrónico siguen una distribución exponencial co

    parámetro desconocido A Una muestra aleatoria de 10componentes da como resultado los siguientes tiem

    de falla (en horas):

    En los textos sobre estadística, con frecuencia se reemplaza B - 1 por B; para valores gran

    de   sin embargo, se obtiene una pequeña diferencia práctica en la estimación.

      l

    S{J=

    t {j: -

    e

    i=l

    Cuando la distribución de

    {j

    es desconocida o complicada, puede ser difícil estimar el erro

    tándar de {j usando la teoría de la estadística estándar. En este caso, se puede usar una técnica

    tensiva de cálculo llamada

    bootstrap.

    Efron

    y

    Tibshirani (1993) hicieron una excelente introducc

    a ella.

    Suponga que el error estándar de {j se denota por

     J{J

    Además, suponga que la función de

    sidad de probabilidad de la población está dada por f x;8). A partir de estos datos, se puede c

    truir fácilmente la estimación bootstrap de  J {J

    1.

    Dada una muestra aleatoria de f x;   j),

    Xl

    X2 •.. , x

    n

    estime 8 denotado por {j.

    2. Usando la estimación   j, genere una muestra de tamaño n de la distribución j (x.é). Ést

    la muestra bootstrap.

    3. Usando la muestra bootstrap, estime 8. Esta estimación se denota por {j:.

    4. Genere muestras bootstrap

    B

    para obtener las estimaciones bootstrap,

    {j:

    para

    i

     

    1, 2, .

    (con frecuencia se usa

    B  

    100 o 200).

    B

    5. Sea e ~{j: l B la representación de la media de la muestra de las estimaciones bootst

    6. El error bootstrap estándar de e se encuentra con la fórmula usual de desviación están

     8 PROBABILIDAD   ESTADíSTICA PARA INGENIERíA

  • 8/18/2019 10. Estimadores de Parámetros

    19/61

    se llama intervalo de confianza de 1

     

    1 -

    para el parámetro desconocido

     

    A L YU se les de

    nomina límites de confianza inferior y superior, respectivamente, y 1-

     

    recibe el nombre de coefi-

    ciente de confianza  La interpretación del intervalo de confianza es que, si se recopilan muchas

    muestras aleatorias y se calcula un intervalo de confianza de 100 1 - a  en   de cada muestra,

    100 1- a de estos intervalos contendrán el valor verdadero de   La situación se ilustra en la fi

    gura 10-4, la cual muestra varios intervalosde confianza de 100 1- a  para la media J i de una dis

    tribución. Los puntos en el centro de cada intervalo indican la estimación puntual de

    J i

     en este caso,

    X

    Observe que uno de los 15 intervalos no contiene el valor verdadero de

    J i 

    Si éste fuera un inter

    valo de confianza de 95 , a la larga sólo 5  de los intervalos no contendrían

    J i

    Ahora bien, en la práctica obtenemos sólo una muestra aleatoria y calculamos un intervalo de

    confianza. Puesto que este intervalo contendrá o no el valor verdadero de

     

    no es razonable atri

    buir un nivel de probabilidad a este evento específico. El enunciado apropiado sería que   se en

    cuentra en el intervalo observado [L,

    U]

    con confianza de 100 1 - a . Este enunciado tiene una

    interpretación de frecuencia: esto es, no sabemos si el enunciado es verdadero para esta muestra es

    pecífica, pero el método utilizado para obtener el intervalo [L U] produce enunciados correctos el

    100 1-

    a

    de las veces.

    El intervalo de confianza en la ecuación 10-19podría llamarse con mayor propiedad un

    interva-

    lo de confianza de dos lados  en cuanto a que especifica tanto un límite inferior como uno superior

     10-1 9)

    :::;

    e

    U

    El intervalo resultante

     10-18 )

    {L:::;

    e

    U } =  

    En muchas situaciones, una estimación puntual no proporciona suficiente información acerca del pa

    rámetro de interés. Por ejemplo, si nos interesa estimar la resistencia media del concreto a la com

    presión, tal vez un solo número no tenga mucho significado. Una estimación del intervalo de la

    forma L :::;

    i :::;

    U podría resultar más útil. Los puntos extremos de este intervalo serán variables alea

    torias, puesto que son funciones de datos de muestra.

    En general, para construir un estimador de intervalo del parámetro desconocido

     

    debemos en

    contrar dos estadísticas, L y U tales que

    1 2 EST IM AC iÓ N D EL IN TER VALO DE C O NF IAN ZA D E U N A SO LA M UESTR A

    0 00489

    04 390

    00

    0 00411

    0 00650

    0 00790

    243 407

    153 821

    126 554

    2

    3

    I

    edia de la muestra

    uestra

    Tabla 10 1

    Estimaciones bootstrap del ejemplo 10 13

    ESTIMACiÓN DE PARÁMETROS 281

  • 8/18/2019 10. Estimadores de Parámetros

    20/61

    La longitud de un intervalo-de confianza observado de ambos lados es una medida impor

    te de la calidad de la información obtenida de la muestra. La longitud de medio intervalo  J -

    U-  J se denomina precisión del estimador. Cuanto más largo sea el intervalo de confianza, m

    confianza tendremos de que el intervalo contiene en realidad el verdadero valor de

     J .

    Por otra

    te, cuanto más largo sea el intervalo, tanto menor será la información que tenemos en tomo al v

    00

    {  J  5 U} =  

    donde el límite de confianza superiorU se elige de manera que

     10

    De manera similar, un intervalo de confianza superior de 100 1 - a de un lado para  J

    dado por el intervalo

     10

    {L 5

    J} = 1

    donde el límite de confianza inferior

     

    se elige de modo que

     10

    5 J

    en

     J .

    En ocasiones, un intervalo de confianza

    de un l do

    podría ser más apropiado. Un interval

    confianza inferior de 1OO1 - a de un lado para  J está dado por   intervalo

    Figura 1 4  onstrucción repetid de un interv lo de confi nz p r 1  

    282 PROBABILIDAD Y ESTADíSTICAPARAINGENIERíA

  • 8/18/2019 10. Estimadores de Parámetros

    21/61

    z

    a

    Considere los datos de conductividad térmica del ejemplo 10-12.Suponga que deseamos encontrar un interva

    lo de confianza de 95  en la conductividad térmica media de hierroArmco. Imagine que conocemos que la

     10-25)

    Al comparar las ecuaciones 10-24y 10-18,vemos que el intervalo de confianza de dos lados de

    100 1-

    a)

    en

     

    es

     10-24)

    Esto puede reacomodarse como

    p { X ZoJ  a/m  

    X

      ZaJ a/m} =

    1

    a

    o

    se toma como una distribución normal estándar.

    La distribución de

    Z

    =

     X-

    1l / a/.J1i

    se muestra en la figura 10-5.Al examinar esta figura ve

    mos que

    X-Il

    z=  r

    a¡vn

    Sea X una variable aleatoria normal con media desconocida

     

    y varianza conocida

     2

    y suponga

    que se toma una muestra aleatoria de tamaño

    n

    Xl

    X

    2, •• . ,

    Xn

    Puede obtenerse un intervalo de con

    fianza de 100 1-

    a)

    en

     

    considerando la distribución muestral de la media de la muestra

     

    En

    la sección 9-3 se dijo que la distribución muestral de

     

    es normal si X es normal

    y

    aproximadamen

    te normal si las condiciones del Teoremadel Límite Central se cumplen. La media de  es   y la va

    rianza es

    o- ».

    Por tanto, la distribución de la estadística

    10 2.1 Intervalo de confianza sobre la media de una

    distribución normal conocida la varianza

    ESTIMACiÓN DE PARÁMETROS

     8

  • 8/18/2019 10. Estimadores de Parámetros

    22/61

    El intervalo de confianza de 99 es más largo que el intervalo de confianza de 95 . Est

    porque tenemos un nivel más alto de confianza en el intervalo de confianza de 99 . En general

    ra una muestra fija de tamaño n y una desviación estándar a entre más alto es el nivel de conf

    za, más largo será el intervalo de confianza resultante.

    Puesto que la longitu del intervalo de confianza mide la pre isión de la estimación, vemos

    la precisión se relaciona inversamente con el nivel de confianza. Como se comentó antes, es m

    2 2.58a/vn 5.l5a/-Jii.

    en tanto que la longitud del intervalo de confianza de 99 es

    2 1.96alJri 3.92a/Fn

    Nivel de confianza y precisión de la estimación

    Observe que, en el ejemplo previo, nuestra elección de 95 del nivel de confianza fue, en esen

    arbitraria. ¿Qué habría sucedido si hubiéramos elegido un nivel de confianza más alto, digamo

    99 ? De hecho, ¿no es razonable desear un nivel de confianza más alto? Para

    a  

    0.01, encon

    mos Za/2 =

    ZO.01l2

    =

    ZO.005

    = 2.58, en tanto que para a = 0.05,

    ZO.025

    = 1.96. En consecuencia, la

    gitud del intervalo de confianza de 95 es

    41.862 ~

      ~

    41.986.

    Éste es nuestro intervalo de valores razonables para la conductividad térmica media con una confianz

    95 por ciento.

    Por consiguiente, el límite de confianza de 95 de los dos lados es

    u

    = i   Za/2   j /J n

     

    41.924

     

    1.96 0.1O)/JTo

      41.924   0.062

    =

    41.986.

    y el límite de confianza superior es

     

    = i   Za/2

      j / I f i

     41.924 - 1.96 0.1O)/JTo

      41.924 - 0.062

     41.862

    desviación estándar de la conductividad térmica a 100°F Y550W es o  0.10Btu h pie  F Si suponemo

    la conductividad térmica se distribuye normalmente o que las condiciones del Teorema del Límite Cent

    cumplen), podemos utilizar la ecuación 10-25para construirel intervalode confianza. Un intervalo de 95 

    plica que 1 - a   0.95, así que a   0.05 y, de acuerdo con la tabla II del apéndice Za/2   ZO 05/2   ZO 025  

    El límite de confianza inferior es

     8 PROBABILIDAD y ESTADíSTICAPARA INGENIERíA

  • 8/18/2019 10. Estimadores de Parámetros

    23/61

     10-27)

    1s

    X  

    z;  J . .¡n,

    y el intervalo de confianza inferior de 100 1 - a para )1 es

    Intervalos

    de confianza de un lado

    También es posible obtener intervalos de confianza de un lado para )1, ajustando L

      00

    o U

      00

    y reemplazando

    ZaJ2

    por Zu. El intervalo de confianza superior de 100 1 - a para

    )1

    es

    Observe cómo, en general, el tamaño de la muestra se comporta como una función de la longi

    tud del intervalo de confianza  E el nivel de confianza como 100 1 - a  , y la desviación estándar

     J

    como sigue:

    • cuando la longitud deseada del intervalo   E se reduce, el tamaño de la muestra requerida n

    aumenta para un valor fijo de  Jy una confianza especificada;

    • cuando  Jaumenta, el tamaño de la muestra requerida

    n

    aumenta para una longitud fija   E

    y

    una confianza especificada,

    y

    • cuando el nivel de confianza aumenta, el tamaño de la muestra requerida

    n

    se incrementa pa

    ra una longitud fija

      Ey

    una desviación estándar

     J.

     

    ZaJ2 J 2

    [ 1.96)0.10]2

    n= = =15.37=16.

    E 5

    Si el lado derecho de la ecuación 10-26 no es un entero, debe redondearse hacia arriba. Observe

    que   E es la longitud del intervalo de confianza resultante.

    Para ilustrar el empleo de este procedimiento, suponga que deseamos que el error en la esti

    mación de la conductividad térmica media del hierro Armco del ejemplo 10-14 sea menor a 0.05

    Btu/h-pie-c f con confianza de 95 . Puesto que

     J

    = 0.10 YZO.025 1.96, podemos encontrar que

    el tamaño de muestra requerido a partir de la ecuación 10-26 es

     10-26 )

    Elección del tamaño de la muestra

    La precisión del intervalo de confianza en la ecuación 10-25 es ZaJ2  J lJii . Esto significa que al

    usar

     

    para estimar

    11 ,

    el error

    E

    =  x 111es menor que

    ZaJ2  J /F n

    con confianza de 100 1- a .Es

    to semuestra gráficamenteen la figura 10-6.En situacionesdonde el tamañode la muestra puede con

    trolarse, podemos elegirncomo 100 1- a confiablede que el error al estimar serámenor que un

    error especificadoE El tamaño de muestra apropiadoes

    Figura 1 6 Error al estimar J con

     

    u   x +

    Za 

    a vn

      x  

    Za 

    a vn

    E   error   x ¡ J

    1----+1

    ESTIMACiÓN DE PARÁMETROS

     8

  • 8/18/2019 10. Estimadores de Parámetros

    24/61

    o

    P{  

    aJ

    n ] ::;t::; t

    aJ

    n ]}   1 - a

    es la distribución

    t

    con   1 grados de libertad. Mostraremos ahora cómo se obtiene el interva

    confianza en

    f l .

    La distribución de

    t

    =

     X

    f l )/ ( S / v r i ) semuestra en la figura 10-7.Al dejar que

    t

    aJ

    n ]

    sea el p

    to porcentual superior Ctl de la distribución t con n 1 grados de libertad, observamos en la fi

    10-7 que

    t

      _ X - - - ; - - . . . . . . f l _

    S v n

    Suponga que deseamos determinar un intervalo de confianza o la media de una distribución, pe

    desconoce la varianza. Se dispone, de manera específica, de una muestra aleatoria de tamañon

    X2 ••. X

    n

    y X y S 2 son la media y la varianza de la muestra, respectivamente. Una posibilida

    ría reemplazar aen las fórmulas del intervalo de confianza para

    f l

    con varianza conocida ecu

    nes 10-25, 10-27Y10-28 con la desviación estándar s de la muestra. Si el tamaño de muestra,

    relativamente grande, digamos

    n  

    30, éste es un procedimiento aceptable. En consecuencia, lla

    mos a menudo a los intervalos de confianza en las secciones 10·2.1 y 10-2.2intervalos de conf

    za de muestra grande debido a que son aproximadamente válidos, incluso si las varianza

    población desconocidas se reemplazan por las varianzas de muestra correspondientes.

    Cuando los tamaños de muestra son pequeños, este enfoque no funciona y debemos utilizar

    procedimiento. Para producir un intervalo de confianza válido, debemos hacer una suposición

    fuerte relativa a la población base. La suposición usual es que la población base se distribuye

    malmente.

    Esto conduce a intervalos de confianza basados en la distribución

    t.

    Específicamente

    X ] , X 2 ... X; una muestra aleatoria de una distribución normal con media f l y varianza o? desc

    cidas. En la sección 9-4 se mencionó que la distribución muestral de la estadística

    10 2 2 Intervalo de confianza sobre la media de una

    distribución normal con varianza desconocida

     8

    PROB BILID D Y EST DíSTIC P R INGENIERí

  • 8/18/2019 10. Estimadores de Parámetros

    25/61

    x

     

    9.8475,

    s

     

    0.0954.

    Deseamos encontrar un intervalo de confianza de 95  respecto de la media del tiempo residual de flama.

    La media

     

    la desviación estándar de la muestra son

    9.85, 9.93, 9.75, 9.77, 9.67,

    9.87, 9.67,

    9.94,

    9.85,

    9.75,

    9.83,

    9.92, 9.74, 9.99, 9.88,

    9.95,

    9.95, 9.93, 9.92,

    9.89.

    Un artículo del Joumal ofTesting and Evaluation   ol. 10,núm . 4, 1982,p. 133)presenta las siguientes20 me

    diciones del tiempo residual de flama en segundos) en muestras tratadas de ropa de dormir para niños:

    Recuerde que estos procedimientos suponen que estarnos realizando el muestreo en una pobla

    ción normal. Esta suposición es importante para muestras pequeñas. Por fortuna, la suposición de

    normalidad se cumple en muchas situaciones prácticas, Cuando ese no es el caso, debernos utilizar

    intervalos de confianza de

    distribución libre

    o

    no paramétricos.

    Los métodos no paramétricos se es

    tudian en el capítulo 16, Sin embargo, cuando la población es normal, los intervalos de distribución

    t son los intervalos de confianza de 100 1 - a más cortos posibles, y por ello son superiores a los

    métodos no paramétricos.

    La selección del tamaño demuestra

    n

    requerido para brindar un intervalo de confianza de la lon

    gitud necesaria no es tan fácil como en el caso de la

     

    conocida, porque la longitud del intervalo de

    pende del valor de   desconocido antes de recopilar los datos) y de

    Además,

    n

    entra al intervalo

    de confianza a través de

    1 / v n

    y de t

    aJ2 n-l

    En consecuencia, la

    n

    requerida debe determinarse me

    diante ensayo y error.

     1 0-32)

    y   intervalo de confianza superior de 100 1-

    a

    en

    J i

    es

    J i   ;

     

    t

    an 

    S / v n

    10-31)

    Un intervalo de confianza inferior de 100 1 -

    en

    J i

    está dado por

      tan S / v n : : : ; J i  

    10-30)

     

    t

    aJ2 n-l

    S / . . ¡ n : : : ; i ;

     

    t

    aJ2 n-l

    S / J i i

    Al comparar las ecuaciones 10-29 y 10-18, vernos que el intervalo de confianza de dos lados de

    100 1- a en J i es

     1 0-29)

    { X -

    taJ2 n-l S / J ñ : : : ; J i ;

     

    taJ2 n-l S /   J ñ }   a

    Al reacomodar esta última ecuación se obtiene

    ESTIMACIÓN DE PARÁMETROS 8

  • 8/18/2019 10. Estimadores de Parámetros

    26/61X~/2 

    n

    Xf a/2 n

    a/2

     

    2

     

    2

     

    2 } - 1 _

    X l  aJ2 n 1 X XaJ2 n l a

    es ji cuadrada con n 1 grados de libertad. Esta distribución se ilustra en la figura 10-8.

    Para desarrollar el intervalo de confianza, observamos en la figura 10-8 que

    SupongaqueX se distribuyenormalmenteconmedia   l y varianza

     j2

    desconocidas.SeaXl

    2, ... ,

    una muestra aleatoria de tamaño

    n,

    y

    S 2

    la varianza de la muestra. En la sección 9-3 se mostró q

    la distribución muestral de

    10 2 3 Intervalo de confianza sobre la varianza de una distribución norma

    Tenemos una confianza de 95  de que la media del tiempo residual de flama está entre 9.8025   9.8

    segundos.

    9.8029 seg ~

      l ~

    9.8921 seg

    Por tanto, el intervalo de confianza de 95 es

      x   ta/2,n-1 s / J ñ

     

    9.8475

     

    2.093 0.0954 /50

     

    9.8921 seg

    y

    L   x ta/2,n-1 s / J ñ

     

    9.8475 -

    2.093 0.0954 /50

     

    9.8029 seg.

    De acuerdo con la tabla IV del apéndice, encontramos que

    tO 025 19  

    2.093. Los límites de confianza i

    rior

     

    superior de 95 son

    288 PROB BILID D

     

    EST DíSTIC P R INGENIERí

  • 8/18/2019 10. Estimadores de Parámetros

    27/61

    a 0.21 onzas de líquido

    Este último enunciado puede convertirse en un intervalo de confianza en la desviación estándar

    a,

    toman

    do la raíz cuadrada en ambos lados, lo que resulta en

    o? -:;(19)0,0225  0.0423 (onzas de líquidoj-.

    10.117

     

    2   n  

    S

    a -

    2

    XO 95  9

    Un embotellador de refrescos está interesado en el funcionamiento uniforme de la máquina que se utiliza pa

    ra llenar latas, En particular, le interesa que la desviación estándar adel proceso de llenado sea menor de 0,2

    onzas de líquido; en otro caso, habrá un porcentaje más alto que el tolerable de latas que no estarán comple

    tamente llenas, Supondremos que el volumen de llenado sedistribuye aproximadamente en forma normal. Una

    muestra aleatoria de 20 latas resulta con una varianza de S 0.0225 (onzas de líquidoj-. Un intervalo de con

    fianza superior de 95  se encuentra a partir de la ecuación 10-36, del siguiente modo:

    (10-36)

    n

    1)52

    2  

    Xl-a n-l

    El intervalo de confianza superior a 100(1 - a se encuentra asignando L = Oy sustituyendo

    2 2

    1 bti

    Xl-a 2 n-l con X

    l-a n-l

    con o que se o tiene

    (10-35)

    n  

    1)52

     

    2

    2 s rr .

    Xa n-l

    (10-34)

    n-l S2<   n-l 52

    2 _ J 2  

    X

    a 2  n-

    1

    X

    1-

    a 2 n -

    1

    Para determinar un intervalo de confianza inferior a 100(1 - a en a2, determinamos U   y

    reemplazamos

    X~2 n-l

    con

    X~ n-l 

    lo que resulta en

    Al comparar la ecuaciones 10-33 y 10-18, vemos que el intervalo de confianza de dos lados de

    100(1 - a en a2 es

    (10-33)

    n

    1)52 )

     

    1 _ a,

    Xta 2 n-l

    Esta última ecuación puede reacomodarse para producir

    (

    2

    <

     n

    1)52<

    2 ) _

    p

    Xl-a 2 n-l - a2 -

    X

    a 2 n-l -

     

    a

    o

    ESTIMACiÓN DE PARÁMETROS

      9

  • 8/18/2019 10. Estimadores de Parámetros

    28/61 

    el intervalo de confianza de los dos lados de 1

    O O  

    1 -

    a

    aproximado en

    p

    es

    (1

     

    JPO-P J P l -P

    P

    p

    -Z aJ2 . n ~

    p ~p  

    ZaJ2 n

      1 -

    Reconocemos la cantidad .. j

    1 - P /n como el error estándar del estimador puntual p. De

    tunadamente los límites superior e inferior del intervalo de confianza obtenido a partir de la

    ción 10-37 contendrían el parámetro desconocido p. Sin embargo, una solución satisfacto

    sustituir p por p en el error estándar, lo que resulta en un error estándar estimado. Por tanto,

    0

     

    J p O - P l - J p I - P l  

    P p -ZaJ2 n  ~p ~p   ZaJ2 n   a 

    Esta expresión puede reacomodarse como

     

    p

     p

    P -Za12 S   p I n-  Za12 ~ I

    a .

    o

    P{-ZaJ2 ~

    Z~

    ZaJ2 }  

    a

    es aproximadamente normal estándar. .

    Para construir el intervalo de confianza en p, observe que

    z

     

    ~p---=-p

    {P l

    n-

    P

    10 2 4 Intervalo de confianza sobre una proporción

    A menudo es necesario construir un intervalo de confianza de 1000 - a en una proporción

    ejemplo, suponga que se ha tomado una muestra aleatoria de tamaño n de una gran población

    siblemente infinita),   que X ~ n  observaciones en esta muestra pertenecen a la clase de interé

    tonces p   X /n es el estimador puntual de la proporción de la población que pertenece a esta

    Observe que n  

    p

    son los parámetros de la distribución binomial. Además, en la sección 7-5

    que la distribución de p es aproximadamente normal con media p   varianza muestral p (1 - p

    p no está demasiado cerca de

    O

    o 1,   si n es relativamente grande. De tal modo, la distribuci

    Por tanto, en el nivel de confianza de 95 , los datos no soportan el requerimiento de que la des

    estándar del proceso sea menor de 0.20 onzas de líquido.

     9 PROBABILIDAD Y ESTADíSTICA PARA INGENIERíA

  • 8/18/2019 10. Estimadores de Parámetros

    29/61

    Esta función es relativamente plana de p   0.3 a p   0.7. Se requiere una estimación de p para uti

    izar la ecuación 10-42. Si se dispone de una estimación p de una muestra previa, podría sustituirse

    on ella la

    p

    en la ecuación 10-42, o quizá sería posible realizar una estimación subjetiva. Si estas al

    ernativas no son satisfactorias, podría tomarse una muestra preliminar, calcularse

    p

    y

    emplearse lue

    o la ecuación 10-42 para determinar cuántas observaciones adicionales se requieren para estimar

     10-42 )

    Defina el error al estimar p por medio de p como E

     

    Ip p l Observe que tenemos una confian

    a de aproximadamente

    IODO

    a)  de que este error es menor que

    ZaJ

    .Jp 1 - p)/n. Por tanto, en

    situaciones en las que puede seleccionarse el tamaño de la muestra, podemos elegir n de manera que

    xista una confianza de 100 1 -

    a) 

    de que el error sea menor que algún valor especificado

    E.

    El

    amaño de muestra apropiado es

    0.08

     p  

    0.24.

    la cual se simplifica a

    0.16 -1.96

    0.16 0.84  ::::p:: : :

    0.16

     

    1.96 0.16 0.84)

    75 75

    o

      p l - p p l -

     

    p ZO  25

    n::::

    P ::::P   ZO  25

    n

    En una muestra aleatoria de 75 ejes de árbol, 12 tienen un acabado superficial más rugoso que lo permitido

    por las especificaciones. Por tanto, una estimación puntual de la proporción de los ejes en la población que ex

    cede las especificaciones de rugosidad pes   x/n   12/75 0.16. Un intervalo de confianza de 95  de dos

    lados parap se calcula a partir de la ecuación 10-39 como

     10-41)

    A Z   p 1 fJ)

      n .

    y un intervalo de confianza superior de 100 1 - a) aproximado es

     10-40 )

     z

     PO-P

  • 8/18/2019 10. Estimadores de Parámetros

    30/61

    0.16 0.84)

    --- -----

    75

    0.16+ 1.96)2   1.96

    2 75

    p 1- p

    Z~

    ; ___ =

    --

      2

    A Z~ Z

    p --± aJ2

    2n

    Los autores se refieren a esto como elpuntaje del intervalo de confianza. Los intervalos de

    fianza de un lado se pueden construir reemplazando simplementeZaJ2con Za

    Para ilustrar este intervalo de confianza, reconsidere el ejemplo 10-17, en el que se anal

    acabado superficial de un eje deárbol con n = 75 Y  0.16. Los límites inferior y superior d

    intervalo de confianza de 95 usando el enfoque deAgresti y Coull son

    Z~ 

    1+-

    n

    p 1- p ZaJ2

     

    2

    A

    Z~J

    p --±ZaJ2

    2n

    El procedimiento desarrollado en esta sección depende de la aproximación normal a la bino

    En situaciones en las que esta aproximación es inapropiada, particularmente en casos donde n e

    queña, deben utilizarse otros métodos. Podrían emplearse, por ejemplo, tablas de la distribució

    -nomial para obtener un intervalo de confianza para

    p.

    Si

    n

    es grande pero

    p

    es pequeña, podría u

    la aproximación de Poisson a la binomial para construir intervalos de confianza. Duncan 1986

    tra estos procedimientos.

    Agresti y Coull 1998) presentaron una forma alternativa de un intervalo de confianza en l

    porción de una poblaciónp, basada en una prueba de hipótesis de grandes muestras enp véase

    pítulo 11).Agresti y Coull mostraron que los límites superior e inferior de un intervalo de conf

    aproximado de 1OO1 - a enp son

     

    Z 2  196) 2

    .025 A l_A)= _._ 0.16 0.84)=207.

    E p p 0.05

    Considere los datos del ejemplo 10-17. ¿Qué tan grande se requiere que sea la muestra si deseamos

    una confianza de 95 de que el error al emplearp para estimar

    p

    es menor que 0.05?Al usarp

     

    0.16 com

    estimación inicial de

    p,

    encontramos, de acuerdo con la ecuación 10-42,que el tamaño de muestra requeri

    Con la finalidad demantener al menos un nivel de confianza de 100 1- a , el valor de n

    pre se redondea al entero siguiente.

      )

    2

    ZaJ2

    n=

     

    0.25 .

    en n. En otras palabras, tenemos al menos una confianza de 100 1- a de que el error al es

    p

    por medio de

    p

    es menor que

    E

    si el tamaño de la muestra es

    292 PROBABILIDAD Y ESTADíSTICA PARAINGENIERíA

  • 8/18/2019 10. Estimadores de Parámetros

    31/61

    normal estándar si   y  

    2

    son normales o aproximadamente normales estándar si se aplican las

    ndiciones del Teorema del Límite Central, respectivamente. De acuerdo con la figura 10-5, esto

    plica que

    0 3 1 Intervalo de confianza de la diferencia entre las medias

    ~

    de dos distribuciones normales con varianzas conocidas

    f l

    sidere dos variables aleatorias independientes,

    XI

    con media desconocida /11

    y

    varianza conoci-H

    O I   y X2 con media desconocida  lzy varianza conocida O ~ . Deseamos encontrar un intervalo de

    nfianza de 100 1- a de la diferencia entre las medias

    /11 -

     lz· Sea XII  X

    12, ... ,

    X  n  una mues-

    a aleatoria de nl_obs~vaciones de

    XI  y

    sea

    X

    21,  

    22 2n2

    una muestra aleatoria de

    n2

    observa-

    ones de  

    Si XI YX2 son medias de la muestra, la estadística

    EST IM AC iÓ N D EL IN TER VALO D E C ON FIAN ZA D E D OS M UESTR AS

      3

    Los límites de confianza inferior   superior resultantes son 0.094   0.260, respectivamente.

    Agresti y Coull argumentan que el intervalo de confianza más complicado tiene varias ventajas

    obre el intervalo estándar más grande de la muestra  dado en la ecuación 10-39). Una ventaja es

    sus intervalos de confianza tienden a conservar el nivel indicado de confianza mejor que el in

    rvalo estándar más grande de la muestra. Otra ventaja es que el límite de confianza inferior siem

    será no negativo. El intervalo de confianza más grande de la muestra puede dar como resultado

    es de confianza inferiores negativos, que el profesionista en general determina como cero. Un

    todo que podemos reportar como límite inferior negativo de un parámetro que es inherentemen

    no negativo   tal como una proporción, p se considera con frecuencia un método inferior. Por úl

    , los requisitos de que   no esté cercano a   o 1

     

    de que   sea relativamente grande, no son

    isitos para el enfoque sugerido por Agresti y Coull. En otras palabras, su enfoque da como re

    ultado un intervalo de confianza apropiado para cualquier combinación de n y p

    0.186

    ±

    0.087

     

    1.051

     

    0.177 ± 0.083.

    ESTIMACiÓN DE PARÁMETROS  9

  • 8/18/2019 10. Estimadores de Parámetros

    32/61 1.0) 2  1.5) 2

    - - ~2

      x

    1  x2  Za 2

     

    13.1 - 0.88

    =

    12.22 kg/mm-,

     1.0 )2  1.5 )2

     87.6 -74.5 -1.645 --

     

    lO

    12

    Se realizaron pruebas de tensión en dos barras de aluminio de diferente calidad, usadas en la fabricación d

    avión de transporte comercial. Con base en experiencias anteriores en el proceso de fabricación de barras

    la fase de pruebas, supondremos que se conoce la desviación estándar de la tensión. En la tabla 10-2sem

    tran los datos obtenidos.

    Si f 1 1  

    f i

    denotan la media de las tensiones para las dos calidadesde las barras, podemos encontrar u

    tervalo de confianza de 90  en la diferencia de la media de la tensión f 1 1 f i como sigue:

     10-4

    y un intervalo de confianza inferior a 1OO 1 - a es

     10-4

    Los intervalos de confianza unilaterales de

    1 1 1  

    J z

    también se pueden obtener. Un intervalo

    confianza superior a 100 1 - a en 1 1 1 J z es

     10-4

      J  

    - JI  J2 - - JI  J2

    XI - X

    2 -

    Z a J 2  

    ~

    1 1 1

    J z ;

    XI - X

    2  

    Z a J 2  

    .

    ni n2 ni n2

    Comparando las ecuaciones 10-43 y 10-18, observamos que el intervalo de confianza 100 1 -

    para   J z es

     10-4

    J2  J2

    I  

    =1-a.

    ni n2

    Esta ecuación se puede reacomodar como

     9 PROBABILIDAD Y ESTADíSTICAPARA INGENIERíA

  • 8/18/2019 10. Estimadores de Parámetros

    33/61

    nsidere dos variables aleatorias independientes normales, digamos Xl con media f . 1 1 y varianza

    I

    y

    X

    2

    con media

    f . 1 2

    y

    varianza

    a~ 

    Tanto las medias

    f 1 1

    y

    f . 1 2

    como las varianzas

    aI

    y

    a~

    son des

     

    aso

    J1

     

    J2

     

    J

    ora ampliaremos los resultados de la sección 10-2.2al caso de dos poblaciones con medias y va

    nzas desconocidas, y deseamos encontrar los intervalos de confianza en la diferencia de las me

    f . 1 1   f . 1 2 .

    Si ambos tamaños de muestra,

     

    Y

    n 2

    exceden a 30, se pueden usar los intervalos de

    distribuciónnormalde varianzaconocidade la sección 10-3.1.Sinembargo, cuando se tomanmues

    s pequeñas,debemos suponerque laspoblacionessubyacentesson distribuidasnormalmentecon va

    as desconocidasy con base en los intervalos de confianza en la distribución

    t

    0 3 2 Intervalo de confianza de la diferencia entre las medias de

    dos distribuciones normales con varianzas desconocidas

    Recuerde redondear hacia arriba si n no es un entero.

    (10-47)

    Si se conocen las desviaciones estándar  l Ya (al menos de manera aproximada) y si los tama

    s de lamuestra  Yn 2 soniguales (digamos,  n 2   n , podemosdeterminarel tamañode lamues

    requerida, de manera que elerror en la estimación f 1 1   f . 1 2 usando

    X l - 1 2

    será menor que   en

    0(1 -

    a

    de confianza. El tamaño de la muestra requerida de cada población es

    n   2 ; 2 f a a~ .

    Media de la

    Calidad de Tamaño de

    muestra de la Desviación estándar

    la barra la muestra tensión kg/mm2 

    kg/mm2

    1

      1 x

    1

      87 6

    <

    = = 1

    2

     

    = = 12

    x

      = = 74 5

    <

    = = 1 5

    bla 1 2 Resultados de la prueba de tensión en barras de aluminio

    12.22 kg/mrn?~   -112s 13.98kg/mm  .

    Tenemos 90  de confianza de que la media de la tensión de la barra de aluminio (calidad 1)excede a la

    e la barra de aluminio (calidad 2) entre 12.22

    y

    13.98 kg/mm-,

    Por tanto, el intervalo de confianza de 90  sobre la diferencia de la media de la tensión es

      13.1+ 0.88

      13.98 kg/mm-,

    ESTIMACiÓN DE PARÁMETROS   95

  • 8/18/2019 10. Estimadores de Parámetros

    34/61

    Un intervalo de confianza inferior con 100 1 - a unilateral para 1 1 1   2 es

     10

    Por tanto, un intervalo de confianza con 1OO1-

    a

    de dos lados para la diferencia entre las

    dias 1 1 1

    2

    es

     10

    Esta ecuación se puede reacomodar como

    o

    es la distribución t con

    nI

     

    nz  

    2 grados de libertad. Por tanto,

    tica

    Para desarrollar el intervalo de confianza para 1 1 1 1 1 2   observe que la distribución de la est

     10

    z

     

    nI  

    l Si

      nz   l S~ 

    P nI   n2 - 2

    Las muestras aleatorias de tamaño

    nI   nz

    se toman en X  y X

     

    respectivamente. Se denota

    medias de las muestras medianteXI y X  y las varianzas de la muestra con s i y  ~ Yaque s i y S

    estimaciones de la varianza común a  podemos obtener un estimador combinado  mezclado  d

     9 PROBABILIDAD   ESTADíSTICAPARAINGENIERíA

  • 8/18/2019 10. Estimadores de Parámetros

    35/61

    1.76minutos  fl¡ -

    J : : ;

    3.24 minutos.

    Esto es, el intervalo de confianza de 95 en la diferencia de la media de los tiempos de inmersión es

    = 3.24minutos.

      f F ; 1

     

    XI - X2   taJ2•

    n n

    -2 sp

    2   n2

    y

    = 1.76minutos

    1

      f F ;

    XI - x2 taJ 2 2 

    .n¡ n,-

     

    nI n2

    La desviación estándar compartida es

    sp

      J

    0.8557

    =

    0.925. Yaque

    taJ2•

    n¡ n

    2 2

    =

    tO.025 .25

    =

    2.060, podemos

    calcular 95 de los límites de confianza superior e inferior como

    12   15 - 2

     

    0.8557.

    11 0.85)2  14 0.98)2

     

    nI

    l sf  

    n2

    l si

     

    n2 -

    2

    En un proceso químico por lotes usado para imprimir tarjetasde circuitería, se han comparado dos diferentesca

    talizadorespara determinar si requieren diferentes tiempos de inmersión para eliminar cantidades idénticas de

    material fotorresistente. Se analizaron 12 lotes con el catalizador 1 y se obtuvo como resultado una media

    del tiempo de inmersión de la muestra de   ¡ = 24.6 minutos

    y

    una desviación estándar de s¡ = 0.85 minutos.

    Se analizaron 15 lotes con el catalizador 2 y se obtuvo como resultado una media del tiempo de inmersión de

    la muestra de

     

    = 22.1 minutos   una desviación estándar de s2 = 0.98 minutos. Encontraremos un intervalo

    de confianza de 95 en la diferencia entre las medias fl¡ - fl2 suponiendo que la desviación estándar o va

    rianza) es igual en las dos poblaciones. La estimación compartida de la varianza común se encuentra usando

    la ecuación 10-48 como se indica a continuación:

     lO-52)

    y

    un intervalo de confianza superior a 100 1 -

    a

    unilateral para / 1 1 z es

    ESTIMACiÓN DE PARÁMETROS

     9

  • 8/18/2019 10. Estimadores de Parámetros

    36/61

    En las secciones 10-3.1 y 10-3.2 desarrollamos intervalos de confianza para las diferencias de

    dias cuando se han seleccionadolas dos muestras aleatorias independientes de las dos poblacion

    interés.Es decir, se han seleccionadonI observacionesaleatoriamentede laprimera población y se

    seleccionadocompletamenteindependientesn2 observacionesaleatoriamentede la segundapobla

    Hay también un número d e casos experimentales en donde sólo hay n unidades experimentales

    rentes y los datos se han reunido en

    parejas;

    así, se han hecho dos observacionesde cada unidad

    Por ejemplo, en la revista

    Human Factors

     1962, p. 375) se reporta un estudio en el que se p

    a 14 personas estacionar dos autos con diferentes distancias entre ejes y radios de giro. Se reg

    el tiempo en segundos para cada auto y persona; en la tabla 10-3 se muestran los datos obten

    Observe que cada persona es la unidad experimental a la que nos referimos anteriormente. De

    mos obtener un intervalo de confianza de la diferencia entre las medias de los tiempos en que s

    tacionan los dos autos, digamos J . 1 112.

    En general, suponga que los datos consisten en n parejas  Xli X21),  X I2, X

    22  ...  

    X n X2n

    supone que tanto X¡ comoX2 están distribuidos normalmente con medias

    J i ]

    y 112,respectivam

    Las variables aleatorias con

    parejas diferentes

    son

    independientes 

    Sin embargo, ya que hay dos

    didas de la misma unidad experimental, las dos medidas dentro del mismo par pueden no ser i

    10 3 3 Intervalo de confianza en J L ¡  

    J l l

    para observaciones pareadas

    El límite de confianza superior inferior) se puede encontrar reemplazando el límite de con

    za inferior superior) por -

    00  00)

    y cambiando

    aJ2

    por

     

    lO

    En consecuencia,un intervalode confianza aproximadode dos lados de 100 1-

    para J i ,

    cuando   J f *   J i es

    - - { sr si - - { S r si

    XI - X 2 - tC J i 2 ,v n

     

    n ::; J i , - 112::;XI - X 2

     

    tC J i 2 ,v n

     

    n

    , 2 , 2

     lO

    está distribuida aproximadamente como t con grados de libertad dados por

      x \ -

    X

    2 -   J i , - J i2 )

    V S¡jn Syn2

    En muchos casos no es razonable suponer que   J f   J i   Aun cuando no se cumpla esta suposi

    podemos encontrar un intervalo de confianza de 100 1 - a  para u, - 112usando el hecho de

    la estadística

    Caso

    j f   j i

     9 PROB BILID D Y EST DíSTIC P R INGENIERí

  • 8/18/2019 10. Estimadores de Parámetros

    37/61

    Volvamos ahora a la tabla 10-3, que contiene los datos del tiempo para 11

     

    14 personas que estacionan para

    lelamente dos automóviles. A partir de la columna de diferencias observadas, di calculamos J = l.21 Y

    sd

    =

    12.68.De acuerdo con la ecuación 10-55,el intervalo de confianza de 90  para

    J . l D

    =

    J .l 1

    J . l 2 se encuentra co

    mo se indica a continuación:

    donde   y   son la media de la muestra y la desviación estándar de las diferencias   i  respec

    tivamente. Este intervalo de confianza es válido para el caso en que ( J i  

    J~

    ya que s b estima

    ( J b = V X¡ - X

    2 .

    Asimismo, para muestras grandes digamos n ~ 30 pares), la condición de norma

    lidad es innecesaria.

     lO -55)

    ya que el valor esperado de XI X 2 es la diferencia en los valores esperados sin considerar siXI   X 2

    son independientes.En consecuencia,podemos construir un intervalo de confianza para u¡ J 1 2 exac

    tamente como se encuentra un intervalo de confianza para

      1D 

    Debido a que las diferencias   i están

    distribuidas normalmente y son independientes, podemos usar el mismo procedimiento que emplea

    mos en la distribución   de la sección 10-2.2para encontrar el intervalo de confianza en   1D   Por ana

    logía con la ecuación 10-30, el intervalo de confianza de 100 1 - a en  1D   11  

    J 1 2

    es

    Automóvil

    Persona

    1

    2

    Diferencia

    37 0

    17 8 19 2

    2 25 8

    20 2 5 6

    3

    16 2

    16 8 0 6

    4 24 2

    41 4  17 2

    5

    22 0

    21 4 0 6

    6

    33 4

    38 4  5 0

    7 23 8

    16 8 7 0

    8

    58 2

    32 2 26 0

    9

    33 6

    27 8 5 8

    10 24 4

    23 2 1 2

    11 23 4

    29 6 6 2

    12 21 2

    20 6 0 6

    13

    36 2

    32 2 4 0

    14 29 8

    53 8

     24 0

     1D = E D = E X

    I -

    X

    2

    = E X

    1   -

    E X

    =  1 1

    J 1 2  

    Tabla 1 3 Tiempo en segundos para estacionar paralelamente dos automóviles

    ESTIM CiÓN DE P RÁMETROS 299

  • 8/18/2019 10. Estimadores de Parámetros

    38/61

    a/2

    ¡

    s i / a i

    P F1_ aJ2 n2-I n¡-1   5 . ~ 2   5 .F aJ2 n2-J n¡-1

    =

      a.

    S

    al

    o

    P{FI-aJ2n-In-l 5.F 5.FaJ2 I_In_l}

    =

     

    ~2   2  

    es F con n2 - 1Yn 1 grados de libertad. En la figura 10-9se muestra la distribución. A part

    ella, vemos que

    Suponga que

    X

    y

    X

    2 son variables aleatorias normales independientes con medias desconocid

    y fl2 y varianzas desconocidas   y

    a i

    respectivamente. Deseamos encontrar un intervalo de

    fianza de 100 1 - a  de la razón a r / a i . Sean dos muestras aleatorias de tamaños n Y

     2

    tom

    de

    X

    y  

    2

    y sean   y si las varianzas de la muestra. Para encontrar el intervalo de confianza

    servamos que la distribución muestral de

    10 3 4 Intervalos de confianza de la razón de varianzas

    de dos distribuciones normales

    Observe que, cuando se parean los datos, se pierden grados de libertad en comparación co

    intervalos de confianza de las dos muestras, pero normalmente se logra un aumento en la prec

    de estimación, ya que

    S d

    es más pequeño que

    S p -

    Observe que el intervalo de confianza en

      u D

    incluye al cero. Esto implica que a un nivel de confian

    90 , los datos no soportan la demanda de que los dos autos tengan medias de tiempo de estacionamien

    y

      u 2  

    Es decir, el valor

      u D   ,ul - ,u2   O

    es consistente con los datos observados.

    1.21 - 1.771  12 .68)/.JT4

    : S ; u D  s

    1.21   1.771 12.68)/.JT4,

    -4.79:S;,uD:S; 7.21.

    3

    PROBABILIDADY ESTADíSTICAPARA INGENIERíA

  • 8/18/2019 10. Estimadores de Parámetros

    39/61

    0 2

    o

      0 . 8 5 )2   l  0 .8 5 )2

    --0.39~-~--2.74,

      0 . 9 8 )2 a i 0 .9 8 )2

    S 2 0 2 s 2

     

    F

  • 8/18/2019 10. Estimadores de Parámetros

    40/61

    Considere los datos del ejemplo 10-17. Suponga que se efectúa una modificación en el proceso de a

    0

    y un intervalo de confianza superior de 1000 -

    a

    aproximado para PI - P2 es

     1

    Un intervalo de confianza inferior de 100 1- a aproximado para PI -

    P 2

    es

     

    I  l P

     

    P 2   l - P 2 )

     

    se distribuye aproximadamente en forma normal estándar. Al emplear un planteamiento anál

    de la sección previa, resulta que un intervalo de confianza de dos lados de 1000 - a  apro

    do para PI - P2 es

    PI -

    P 2 -  PI - P2

    z

     

    ; = = = = = = = = = = = _

    pIO -

    P I) P 2 1 - P 2 )

     

    Si hay dos proporciones de interés, digamos

    PI

    y

    P2

    es posible obtener un intervalo de confia

    100 1 - a respecto de su diferenciaPI - P2  Si dos muestras independientes de tamaños n

    se toman de poblaciones infinitas, de manera que X¡ y X

     

    sean variables aleatorias binomiale

    pendientes con parámetros   ni PI) y   n2 P2)  respectivamente, donde

    X I

    representa el número

    servaciones de muestra de la primera población que pertenece a una clase de interés, y X

    2

    repr

    el número de observaciones de muestra de la segunda población que pertenece a una clase d

    rés, entonces PI

      X¡fn l

    y

    P 2   X 2 / n 2

    son estimadores independientes de

    P I

    y

    P 2

    respectiva

    Además, bajo la suposición de que se aplica la aproximación normala la binomial, la estadís

    10 3 5 Intervalo de confianza sobre la diferencia entre dos proporciones

    usando el hecho de que F

    O .9 5 ,14,¡¡  

    IIF

    O .0 5, 1 1 ,1 4  

    1/2.58

     

    0.39. Yaque este intervalo de confianza inclu

    dades, no podríamos exigir que las desviaciones estándar de los tiempos de inmersión para los dos cata

    res sean diferentes al nivel de confianza de 90 .

    3 PROB BILID D Y EST DíSTIC P R INGENIERí

  • 8/18/2019 10. Estimadores de Parámetros

    41/61

    Recuerde el ejemplo 10-3, donde se mostró que el estimador de máxima verosimilitud del parámetro P de una

    distribución de Bemoulli es

    P

     

    lIn I.7:¡

     

    Al emplear la cota inferior de Cramér-Rao, podemos com

    probar que la cota inferior para la varianza de

     

    es

    Usualmente, V

    j

    es una función del parámetro desconocido  J En estos casos, sustituya  J por

    {j

    10-64)

    Si se utiliza el método de máxima verosimilitud para la estimación de parámetros, pueden emplear

    se las propiedades asintóticas de estos estimadores para obtener intervalos de confianza aproxima

    dos. Sea

    {j

    el estimador de máxima verosimilitud de

     J

    En muestras grandes,

    {j

    se distribuye

    aproximadamente de manera normal con media  J y varianza

    V j

    dada por la cota inferior de Cra

    mér-Rao ecuación 10-4). Por consiguiente, un intervalo de confianza aproximado de 100 1-

    a

    para  J es

    1 4 IN TE RV ALO SD E C ON FIA NZA A PR OX IM AD OS

    E N LA E STIM AC iÓ N D E M ÁX IM A V ER OS IM IL IT UD

    Este intervalo incluye el cero, de modo que, con base en los datos de la muestra, parece poco probable

    que los cambios realizados en el proceso de acabado de la superficie hayan reducido la proporción de los ejes

    de árbol defectuosos que se están produciendo.

    - 0.07

    ~p¡ -

    P   ~ 0.15.

    Esto se simplifica a

    ~p¡ -

    P ~ 0.16 - 0.12   1.96

    0.16 0.84) 0.12 0.88)

      .

    75 85

    0.16 0.84) 0.12 0.88)

     

    75 85

    0.16 - 0.12 - 1.96

    o

    Piel-PI fiz l-P2 

    p ¡

    P2 -

    ZO.025

    P¡ l-PI P2 1-P2

    n¡ n2

    P2   10/85   0.12, podemos obtener un intervalo de confianza aproximado de 95  en la diferencia de la pro

    porción de defectos producidos bajo los dos procesos, utilizando la ecuación 10-61 como

    ESTIMACiÓN DE PARÁMETROS

  • 8/18/2019 10. Estimadores de Parámetros

    42/61 10

    m

    P

    {todos los enunciados

    m

    son simultáneamente correctos}

     

    1 -

    a ~

    1 -

    La;

    ;=1

    En ocasiones es necesario construir varios intervalos de confianza respecto de más de un parám

    y deseamos que haya una probabilidad de 1 - a de que la

    tot li

    de tales intervalos de con

    za produzca de manera simultánea enunciados correctos. Por ejemplo, suponga que estamos tom

    do una muestra de una población normal con media y varianza desconocidas, y que desea

    construir intervalos de confianza para J y 0 2, tales que la probabilidad de que ambos intervalos

    duzcan simultáneamente conclusiones correctas sea l a . Puesto que   y S son independie

    podríamos asegurar este resultado construyendo intervalos de confianza de

    100 1- a)I/2

    par

    da parámetro por separado, y ambos intervalos producirían de manera simultánea conclusione

    rrectas con probabilidad

     1 - a)I/2 1 -

    a I 2   1 -

    a).

    Si las estadísticas de la muestra en las cuales sebasan los intervalos de confianza no son v

    bles aleatorias independientes, los intervalos de confianza no son independientes y deben emp

    se otros métodos. En general, suponga que se requieren m intervalos de confianza. La desigua

    de Bonferroni establece que

    IN TE RV ALO S D E C O NF IA NZ A S IM U LT ÁN EO S

      5

    ~ Z  P l-P < < A Z  P l-P

    p- aJ2 -p-p+ aJ2 .

    n n

    Este resultado no debe ser sorprendente, ya que sabemos directamente que para la distribución deBe

    lli V X)   V X¡)In   p l - p)/n. En cualquier caso, reemplazando p por P en V P), el intervalo de conf

    aproximado con 100 1 - a para p se encuentra a partir de la ecuación 10-64 como

    p l

    p

    n

     P) ~

    1

    n [ ~

      - -1 __P ]

    De acuerdo con la distribución de Bernoull