27
EYP2214 Estadística para Construcción Civil 1 Inferencia Estadística El campo de la inferencia estadística está formado por los métodos utilizados para tomar decisiones o para obtener conclusiones sobre una población. Estos métodos utilizan la información contenida en una muestra de la población para obtener conclusiones. La inferencia estadística puede dividirse en dos grandes áreas: estimación de parámetros y prueba de hipótesis.

Inferencia Estadística - mat.uda.cl · Una aplicación muy importante de la estadística es obtener estimaciones puntuales de ... Propiedades de los Estimadores : Estimadores Insesgados

  • Upload
    lamhanh

  • View
    232

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Inferencia Estadística - mat.uda.cl · Una aplicación muy importante de la estadística es obtener estimaciones puntuales de ... Propiedades de los Estimadores : Estimadores Insesgados

EYP2214 Estadística para Construcción Civil 1

Inferencia Estadística

El campo de la inferencia estadística está formado por los métodos utilizados para tomar

decisiones o para obtener conclusiones sobre una población. Estos métodos utilizan la

información contenida en una muestra de la población para obtener conclusiones. La

inferencia estadística puede dividirse en dos grandes áreas: estimación de parámetros y

prueba de hipótesis.

Page 2: Inferencia Estadística - mat.uda.cl · Una aplicación muy importante de la estadística es obtener estimaciones puntuales de ... Propiedades de los Estimadores : Estimadores Insesgados

EYP2214 Estadística para Construcción Civil 2

Ejemplo de un problema de estimación de parámetros :

Supóngase que un ingeniero de estructuras analiza la resistencia a la tensión de un

componente empleado en la carrocería de un automóvil. Puesto que la variabilidad existe

de manera natural en la resistencia a la tensión entre distintos componentes, debido a

diferencias en los lotes de la materia prima, en el proceso de fabricación y en los

procedimientos de medición (por ejemplo), el ingeniero está interesado en estimar la

resistencia a la tensión promedio de los componentes.

Page 3: Inferencia Estadística - mat.uda.cl · Una aplicación muy importante de la estadística es obtener estimaciones puntuales de ... Propiedades de los Estimadores : Estimadores Insesgados

EYP2214 Estadística para Construcción Civil 3

Una aplicación muy importante de la estadística es obtener estimaciones puntuales de

parámetros tales como la media y la varianza de la población. El objetivo de la

estimación puntual es seleccionar un número, con base en los datos de la muestra, que sea

el valos más plausible de θ . El valor numérico de alguna estadística de la muestra es el

que será utilizado como estimación puntual.

En general, si X es una variable aleatoria con distribución de probabilidad )(xf ,

caracterizada por el parámetro no conocido θ , y si nXX ,...,1 es una muestra aleatoria de

X de tamaño n , entonces la estadística ),...,(ˆ1 nXXh=θ recibe el nombre de estimador

puntual de θ . Nótese que θ es una variable aleatoria, ya que es una función de variables

aleatorias.

Page 4: Inferencia Estadística - mat.uda.cl · Una aplicación muy importante de la estadística es obtener estimaciones puntuales de ... Propiedades de los Estimadores : Estimadores Insesgados

EYP2214 Estadística para Construcción Civil 4

Definición

Un estimador es una medida estadística que especifica cómo utilizar los datos de la

muestra para estimar un parámetro desconocido de la población.

Propiedades de los Estimadores :

Estimadores Insesgados

Un estimador debe estar “próximo” en algún sentido al valor verdadero del parámetro

desconocido. De manera formal, se dice que θ es un estimador insesgado de θ si el valor

esperado de θ es igual a θ . Esto equivale a afirmar que la media de la distribución de

probabilidad de θ (o la media de la distribución de muestreo de θ ) es igual a θ .

Page 5: Inferencia Estadística - mat.uda.cl · Una aplicación muy importante de la estadística es obtener estimaciones puntuales de ... Propiedades de los Estimadores : Estimadores Insesgados

EYP2214 Estadística para Construcción Civil 5

Definición

Un estimador θ es un estimador insesgado para estimar a θ si

θθ )ˆ( =E

Si el estimador no es insesgado, entonces la diferencia

θθ −)ˆ(E

es conocida como sesgo del estimador θ .

Ejemplo 1

Supóngase que X es una variable aleatoria con media µ y varianza 2σ . Sea nXX ,...,1

una muestra aleatoria de tamaño n tomada de una población representada por X .

Demuéstrese que la media muestral X y la varianza muestral 2S son estimadores

insesgados de µ y 2σ , respectivamente.

Page 6: Inferencia Estadística - mat.uda.cl · Una aplicación muy importante de la estadística es obtener estimaciones puntuales de ... Propiedades de los Estimadores : Estimadores Insesgados

EYP2214 Estadística para Construcción Civil 6

En ocasiones existen varios estimadores insesgados del parámetro de la población

muestral. Puesto que no hay un estimador insesgado único, no es posible depender

exclusivamente de esta propiedad para seleccionar el estimador. Se necesita un método

para seleccionar uno de entre varios estimadores insesgados.

Varianza y error cuadrático medio de un estimador puntual

Supóngase que 1θ y 2θ son estimadores insesgados de θ . Esto indica que la distribución

de cada estimador está centrada en el verdadero valor de θ . Sin embargo, las varianzas de

estas distribuciones pueden ser diferentes. Cuando se elige uno de entre varios

estimadores, un principio lógico de estimación es seleccionar el estimador que tenga la

menor varianza.

Page 7: Inferencia Estadística - mat.uda.cl · Una aplicación muy importante de la estadística es obtener estimaciones puntuales de ... Propiedades de los Estimadores : Estimadores Insesgados

EYP2214 Estadística para Construcción Civil 7

Definición

Si se consideran todos los estimadores insesgados de θ , el que tiene la menor varianza

recibe el nombre de estimador insesgado de varianza mínima.

Otro método es el error cuadrático medio.

Definición (Error Cuadrático Medio)

El error cuadrático medio de un estimador θ del parámetro θ está definido como

2)ˆ()ˆ( θθθ −= EECM

Obs.

El error cuadrático medio puede reescribirse de la siguiente manera:

2)sesgo()ˆ()ˆ( += θθ VarECM

Page 8: Inferencia Estadística - mat.uda.cl · Una aplicación muy importante de la estadística es obtener estimaciones puntuales de ... Propiedades de los Estimadores : Estimadores Insesgados

EYP2214 Estadística para Construcción Civil 8

El error cuadrático medio es un criterio importante para comparar dos estimadores. Sean

1θ y 2θ dos estimadores del parámetro θ , y )ˆ( 1θECM y )ˆ( 2θECM los errores cuadráticos

medios de 1θ y 2θ . Entonces, la eficiencia relativa de 2θ con respecto a 1θ se define

como

)ˆ(

)ˆ(

2

1

θθ

ECM

ECM

si la eficiencia relativa es menor que uno, entonces puede concluirse que 1θ es un

estimador más eficiente de θ que 2θ , en el sentido que tiene un error cuadrático medio

más pequeño.

Page 9: Inferencia Estadística - mat.uda.cl · Una aplicación muy importante de la estadística es obtener estimaciones puntuales de ... Propiedades de los Estimadores : Estimadores Insesgados

EYP2214 Estadística para Construcción Civil 9

Ejemplo 2

Supóngase que se desea estimar la media µ de una población. Se tiene una muestra

aleatoria de n observaciones nXX ,...,1 y se quiere comparar dos estimadores posibles de

µ : la media muestral X y una observación de la muestra, por ejemplo iX . ¿Cuál

estimador se utilizaría, y por qué?

Ejemplo 3

Supóngase que 51,..., XX representa una muestra aleatoria de alguna población para la

cual µ=)( iXE y 2)( σ=iXVar , 5,...,1=i . Se proponen como estimadores de µ a los

siguientes: )(5

1ˆ ),2(2

1ˆ ),(2

1ˆ ,ˆ51451351211 XXXXXXXX ++==+=+== θθθθ .

¿Cuál estimador se utilizaría, y por qué?

Page 10: Inferencia Estadística - mat.uda.cl · Una aplicación muy importante de la estadística es obtener estimaciones puntuales de ... Propiedades de los Estimadores : Estimadores Insesgados

EYP2214 Estadística para Construcción Civil 10

Método de Máxima Verosimilitud

Uno de los métodos para obtener un estimador puntual de un parámetro es el método de

máxima verosimilitud. Tal como su nombre lo implica, el estimador será el valor del

parámetro que maximiza la función de verosimilitud.

Supóngase, por ejemplo, que una caja contiene cuatro pelotas, de las cuales un número

desconocido θ son blancas y )4( θ− no son blancas. Se extraen al azar dos pelotas y se

cuenta X , el número de pelotas blancas en la muestra. La distribución de probabilidad de

X está dada por

−−

===

2

42

4

)()(xx

xpxXP

θθ

Page 11: Inferencia Estadística - mat.uda.cl · Una aplicación muy importante de la estadística es obtener estimaciones puntuales de ... Propiedades de los Estimadores : Estimadores Insesgados

EYP2214 Estadística para Construcción Civil 11

Ahora supóngase que se observa que 1=X . ¿Qué valor de θ hará máxima la

probabilidad de este evento?. De acuerdo con la distribución anterior se tienen que

0)41(2

1)31(

3

2)21(

2

1

6

3

2

41

3

1

1

)11(

0)01(

==

==

==

==

==

==

θ

θ

θ

θ

θ

p

p

p

p

p

Page 12: Inferencia Estadística - mat.uda.cl · Una aplicación muy importante de la estadística es obtener estimaciones puntuales de ... Propiedades de los Estimadores : Estimadores Insesgados

EYP2214 Estadística para Construcción Civil 12

Por lo tanto, 2=θ hace máxima la probabilidad de la muestra observada, así que se

escogería este valor, 2, como el estimador de máxima verosimilitud de θ , dado que se ha

observado que 1=X .

Definición

Supóngase que X es una variable aleatoria con distribución de probabilidad ),( θxf ,

donde θ es un parámetro desconocido. Sean nxx ,...,1 los valores observados en una

muestra aleatoria de tamaño n . La función de verosimilitud de la muestra es

),(),(),()( 21 θθθθ nxfxfxfL ⋅⋅⋅=

Nótese que la función de verosimilitud es ahora una función del parámetro desconocido

θ . El estimador de máxima verosimilitud de θ es el valor de θ que maximiza la

función de verosimilitud )(θL .

Page 13: Inferencia Estadística - mat.uda.cl · Una aplicación muy importante de la estadística es obtener estimaciones puntuales de ... Propiedades de los Estimadores : Estimadores Insesgados

EYP2214 Estadística para Construcción Civil 13

Nota :

El método de máxima verosimilitud puede emplearse en situaciones donde esxisten

varios parámetros desconocidos (por ejemplo, kθθθ ,,, 21 ), que es necesario estimar. En

tales casos, la función de verosimilitud es una función de los k parámetros desconocidos

kθθθ ,,, 21 , y los estimadores de máxima verosimilitud ˆ iθ se obtienen al igualar a cero

las k derivadas parciales kiL ik ,,2,1 ,),,,( 21 =∂∂ θθθθ , y resolver el sistema de

ecuaciones resultante.

Ejemplo 4

Supóngase que en una sucesión de n intentos Bernoulli independientes, se observan Y

éxitos. Determinar el estimador de máxima verosimilitud de p , la probabilidad de éxito

en cualquier intento dado.

Page 14: Inferencia Estadística - mat.uda.cl · Una aplicación muy importante de la estadística es obtener estimaciones puntuales de ... Propiedades de los Estimadores : Estimadores Insesgados

EYP2214 Estadística para Construcción Civil 14

Ejemplo 5

Supóngase que se observan n mediciones independientes de vida útil nXXX ,,, 21 , de

componentes de los que se sabe que sus vidas útiles siguen un modelo Weibull

representado por

0 ,)( /1

>= −−

xex

xf x θγγ

θγ

Suponiendo que se conoce γ , determinar el estimador de máxima verosimilitud de θ .

Ejemplo 6

Sea nXXX ,,, 21 una muestra aleatoria de tamaño n con distribución normal, media µ

y varianza 2σ , donde µ y 2σ son desconocidas. Determinar el estimador de máxima

verosimilitud de µ y 2σ .

Page 15: Inferencia Estadística - mat.uda.cl · Una aplicación muy importante de la estadística es obtener estimaciones puntuales de ... Propiedades de los Estimadores : Estimadores Insesgados

EYP2214 Estadística para Construcción Civil 15

Observaciones :

1. Los estimadores de máxima verosimilitud no son necesariamente insesgados.

2. El estimador de máxima verosimilitud es insesgado para n grande. Esto implica que el

estimador de máxima verosimilitud θ es, de manera aproximada, el estimador

insesgado de varianza mínima de θ para n grande ( ∞→n ).

3. Los estimadores de máxima verosimilitud también tienen una propiedad de invarianza.

Esto es, si kθθθ ˆ,,ˆ,ˆ21 , son los estimadores de máxima verosimilitud de los parámetros

kθθθ ,,, 21 , entonces el estimador de máxima verosimilitud de cualquier función

),,,( 21 kh θθθ de estos parámetros, es la misma función )ˆ,,ˆ,ˆ( 21 kh θθθ de los

estimadores kθθθ ˆ,,ˆ,ˆ21 .

Page 16: Inferencia Estadística - mat.uda.cl · Una aplicación muy importante de la estadística es obtener estimaciones puntuales de ... Propiedades de los Estimadores : Estimadores Insesgados

EYP2214 Estadística para Construcción Civil 16

Ejemplo 7

Sea X una variable aleatoria igual al número de clientes que solicitan información a una

empresa constructora durante un día. Se quiere saber el número esperado de clientes que

solicitan información en un día y para esto se tomó una muestra aleatoria durante 50 días

de la cantidad de clientes que llegaron por día, obteniéndose:

Además se sabe que la función de probabilidad de esta variable aleatoria es Poisson(λ ).

En base a los datos, encuentre el estimador de máxima verosimilitud de la probabilidad

de que no hayan clientes en un día.

Número de clientes por día 0 1 2 3 4 Cantidad de días observados 17 22 7 3 1

Page 17: Inferencia Estadística - mat.uda.cl · Una aplicación muy importante de la estadística es obtener estimaciones puntuales de ... Propiedades de los Estimadores : Estimadores Insesgados

EYP2214 Estadística para Construcción Civil 17

Distribuciones de Muestreo

La distribución de muestreo de una estadística depende de la distribución de la población,

del tamaño de la muestra y del método utilizado para seleccionar ésta.

Definición

La distribución de probabilidad de una estadística recibe el nombre de distribución de

muestreo. Por ejemplo, la distribución de probabilidad de X se conoce como

distribución de muestreo de la media.

Page 18: Inferencia Estadística - mat.uda.cl · Una aplicación muy importante de la estadística es obtener estimaciones puntuales de ... Propiedades de los Estimadores : Estimadores Insesgados

EYP2214 Estadística para Construcción Civil 18

Distribución de Muestreo de la Media

Supóngase que se toma una muestra aleatoria de tamaño n de una población normal con

media µ y varianza 2σ . Cada observación de esta muestra (por ejemplo, nXXX ,,, 21 )

es una variable aleatoria distribuida normal e independientemente, con media µ y

varianza 2σ . Entonces se tiene que la media muestral X tiene una distribución normal

con media µ y varianza n/2σ (es decir, )/,( ~ 2 nNX σµ ).

Si se muestrea una población que tiene una distribución de probabilidad desconocida, la

distribución de muestreo de la media muestral seguirá siendo aproximadamente normal

con media µ y varianza n/2σ , si el tamaño de la muestra n es grande. Éste es uno de los

teoremas más útiles en estadística; se le conoce como teorema central del límite.

Page 19: Inferencia Estadística - mat.uda.cl · Una aplicación muy importante de la estadística es obtener estimaciones puntuales de ... Propiedades de los Estimadores : Estimadores Insesgados

EYP2214 Estadística para Construcción Civil 19

Teorema central del límite

Si nXXX ,,, 21 es una muestra aleatoria de tamaño n tomada de una población con

media µ y varianza finita 2σ , y si X es la media muestral entonces la forma límite de la

distribución de

n

XZ

/σµ−=

cuando ∞→n , es la distribución normal estándar.

Ejemplo 8

Una compañía de electrónica fabrica resistores que tienen una resistencia promedio de

Ω00 y una desviación estándar de Ω0 . La distribución de la resistencia es normal.

Encuéntrese la probabilidad de que al tomar una muestra de 25=n resistores, la

resistencia promedio de éstos será menor que Ω95 (Rpta. 0.0062).

Page 20: Inferencia Estadística - mat.uda.cl · Una aplicación muy importante de la estadística es obtener estimaciones puntuales de ... Propiedades de los Estimadores : Estimadores Insesgados

EYP2214 Estadística para Construcción Civil 20

Definición

El error estándar de una estadística es la desviación estándar de su distribución de

muestreo. Si el error estándar involucra parámetros desconocidos cuyos valores pueden

estimarse, la sustitución de estas estimaciones en el error estándar da como resultado un

error estándar estimado.

Obs.

El error estándar da alguna idea sobre la precisión de la estimación. Por ejemplo, si la

media muestral X se utiliza como estimador puntual de la media poblacional µ , el error

estándar de X mide cuán precisamente X estima a µ .

Page 21: Inferencia Estadística - mat.uda.cl · Una aplicación muy importante de la estadística es obtener estimaciones puntuales de ... Propiedades de los Estimadores : Estimadores Insesgados

EYP2214 Estadística para Construcción Civil 21

Ejemplo 9

Un artículo publicado en el Journal of Heat Transfer (Trans. ASME, Ses. C, 96, 1974, pág.

59) describe un nuevo método para medir la conductividad térmica del hierro Armco. Al

utilizar una temperatura de 00 F y una potencia de entrada de 550 W, se obtienen las diez

mediciones siguientes de conductividad térmica (en Btu/hr-ft-F):

41.60 41.48 42.34 41.95 41.86 42.18 41.72 42.26 41.81 42.04

Una estimación puntual de la conductividad térmica promedio a 00 F y 550 W es la media

muestral, X =41.924 Btu/hr-ft-F. El error estándar de la media muestral es nX /σσ = , y

dado que σ es desconocido, puede reemplazarse por la desviación estándar muestral

284.0=s para obtener el error estándar estimado de X como == nX /ˆ σσ

0898.010/284.0 == , el cual es alrededor de 0.2% de la media muestral, lo que implica que

se ha obtenido una estimación puntual relativamente precisa de la conductividad térmica.

Page 22: Inferencia Estadística - mat.uda.cl · Una aplicación muy importante de la estadística es obtener estimaciones puntuales de ... Propiedades de los Estimadores : Estimadores Insesgados

EYP2214 Estadística para Construcción Civil 22

Distribuciones importantes en inferencia estadística

Distribución Chi-Cuadrado

Sean kZZZ ,,, 21 variables aleatorias distribuidas normal e independientemente, con

media 0=µ y varianza 12 =σ . Entonces, la variable aleatoria

222

21 kZZZX +++=

tiene la función de densidad de probabilidad

0 para ,)2/(2

1)( 2/1)2/(

2/>

Γ= −− xex

kxf xk

k

y se dice que sigue una distribución chi-cuadrado con k grados de libertad, lo

que se abrevia 2)(kχ .

Page 23: Inferencia Estadística - mat.uda.cl · Una aplicación muy importante de la estadística es obtener estimaciones puntuales de ... Propiedades de los Estimadores : Estimadores Insesgados

EYP2214 Estadística para Construcción Civil 23

Propiedades : kX =E y kX 2Var =

Propiedad de aditividad de la distribución chi-cuadrado

Sean pYYY ,,, 21 variables aleatorias chi-cuadrado independientes con pkkk ,,, 21

grados de libertad, respectivamente. Entonces

pYYYY +++= 21

sigue una distribución chi-cuadrado con grados de libertad igual a

∑==

p

iikk

1

Ejemplo 10

Supóngase que nXXX ,,, 21 es una muestra aleatoria tomada de una distribución

normal, con media µ y varianza 2σ . Entonces 2

2)1(

σSn −

está distribuida como 2)1( −nχ .

Page 24: Inferencia Estadística - mat.uda.cl · Una aplicación muy importante de la estadística es obtener estimaciones puntuales de ... Propiedades de los Estimadores : Estimadores Insesgados

EYP2214 Estadística para Construcción Civil 24

Distribución t

Sea Z una variable aleatoria con distribución )1,0(N y V una variable aleatoria con

distribución chi-cuadrado con k grados de libertad. Si Z y V son independientes, la

variable aleatoria

kV

ZT

/=

tiene la función de densidad de probabilidad

[ ][ ] ∞<<∞−

+⋅

Γ+Γ= + x

kxkk

kxf

k

1)/(

1

)2/(

2/)1()(

2/)1(2π

y se dice que sigue la distribución t con k grados de libertad, lo que se abrevia como kt .

Propiedades : 0E =X , y 2 para )2/(Var >−= kkkX .

Page 25: Inferencia Estadística - mat.uda.cl · Una aplicación muy importante de la estadística es obtener estimaciones puntuales de ... Propiedades de los Estimadores : Estimadores Insesgados

EYP2214 Estadística para Construcción Civil 25

Ejemplo 11

Supóngase que nXXX ,,, 21 es una muestra aleatoria tomada de una distribución

normal, con media µ y varianza 2σ . Entonces nS

XT

/

µ−= sigue una distribución )1( −nt .

Distribución F

Sean W e Y variables aleatorias independientes con distribución chi-cuadrado con

grados de libertad u y v respectivamente. Entonces el cuociente

vY

uWF

/

/=

tiene la función de densidad de probabilidad :

Page 26: Inferencia Estadística - mat.uda.cl · Una aplicación muy importante de la estadística es obtener estimaciones puntuales de ... Propiedades de los Estimadores : Estimadores Insesgados

EYP2214 Estadística para Construcción Civil 26

∞<<

+

Γ

Γ

= +

x

xv

uvu

xv

uvu

xfvu

uu

0 ,

1 22

2)(2/)(

1)2/(2/

y se dice que sigue la distribución F con u y v grados de libertad. Usualmente, esto se

denota como ),( vuF .

Propiedades

2 para )2/(E >−= vvvX , y

4 ,)4()2(

)2(2Var

2

2

>−−

−+= vvvu

vuvX

Page 27: Inferencia Estadística - mat.uda.cl · Una aplicación muy importante de la estadística es obtener estimaciones puntuales de ... Propiedades de los Estimadores : Estimadores Insesgados

EYP2214 Estadística para Construcción Civil 27

Relaciones importantes

1. Si ),(~ qpFX entonces ),(~/ pqFX .

2. Si qtX ~ entonces ),1(2 ~ qFX .

Ejemplo 11

Supóngase que se tienen dos poblaciones normales con varianzas 21σ y 2

2σ ,

respectivamente. Se toman dos muestras aleatorias independientes de tamaños 1n y 2n de

las poblaciones 1 y 2, respectivamente, y sean 21S y 2

2S las varianzas muestrales.

Entonces, el cuociente

22

22

21

21

/

/

σσ

S

SF =

tiene una distribución )12,11( −− nnF .