30
Distribuciones Muestrales y Teorema Central del L´ ımite Mall´ en Arenas Departamento de Estad´ ıstica Facultad de Ciencias F´ ısicas y Matem´ aticas Universidad de Concepci´ on Mall´ en Arenas (Dpto. Estad´ ıstica) Distribuciones Muestrales y Teorema Central del L´ 1 / 30

Clase 07 - Distribuciones Muestrales y Teorema Central del Límite

Embed Size (px)

Citation preview

Page 1: Clase 07 - Distribuciones Muestrales y Teorema Central del Límite

Distribuciones Muestrales y Teorema Central del Lımite

Mallen Arenas

Departamento de EstadısticaFacultad de Ciencias Fısicas y Matematicas

Universidad de Concepcion

Mallen Arenas (Dpto. Estadıstica) Distribuciones Muestrales y Teorema Central del Lımite 1 / 30

Page 2: Clase 07 - Distribuciones Muestrales y Teorema Central del Límite

1 Propiedad reproductiva de la distribucion normal

2 Teorema Central del Lımite

3 Distribuciones muestrales

4 Distribucion de la media muestral

5 Distribucion Chi-cuadrado(χ2)

6 Distribucion de la varianza muestral

7 Distribucion t de Student

8 Distribucion F

Mallen Arenas (Dpto. Estadıstica) Distribuciones Muestrales y Teorema Central del Lımite 2 / 30

Page 3: Clase 07 - Distribuciones Muestrales y Teorema Central del Límite

Propiedad reproductiva de la distribucion normal

Propiedad reproductiva de la distribucion normal

Teorema

Sean X1, X2, . . . , Xn, n variables aleatorias independientes dondeXi ∼ N(µi, σ2

i ), para i = 1, 2, . . . , n. Si

Y =n∑i=1

Xi = X1 +X2 + · · ·+Xn.

Entonces la variable aleatoria Y se distribuye normal con media,∑n

i=1 µi yvarianza

∑ni=1 σ

2i . Es decir:

Y ∼ N(n∑i=1

µi,

n∑i=1

σ2i ).

Mallen Arenas (Dpto. Estadıstica) Distribuciones Muestrales y Teorema Central del Lımite 3 / 30

Page 4: Clase 07 - Distribuciones Muestrales y Teorema Central del Límite

Propiedad reproductiva de la distribucion normal

El resultado anterior se puede generalizar a una combinacion lineal devariables aleatorias normales independientes X1, X2, . . . , Xn de lasiguiente forma: Si tomamos X0 = 1 sea

Y =n∑i=0

aiXi = a0 + a1X1 + a2X2 + · · ·+ anXn,

donde las ai son constantes entonces:

Y ∼ N(a0 +n∑i=1

aiµi,

n∑i=1

a2iσ

2i ).

Mallen Arenas (Dpto. Estadıstica) Distribuciones Muestrales y Teorema Central del Lımite 4 / 30

Page 5: Clase 07 - Distribuciones Muestrales y Teorema Central del Límite

Teorema Central del Lımite

Teorema Central del Lımite

Teorema (Teorema central del lımite)

Sea X1, X2, . . . , Xn, . . . una sucesion de variables aleatoriasindependientes con E(Xi) = µi y varianza V (Xi) = σ2

i (ambas finitos).Si

Y =n∑i=1

Xi = X1 +X2 + · · ·+Xn.

,entonces bajo ciertas condiciones generales, la variable aleatoria Z definidapor

Z =∑n

i=1Xi −∑n

i=1 µi√∑ni=1 σ

2i

tiene una distribucion aproximadamente normal estandar (N(0, 1)), cuandon es suficientemente grande.

Mallen Arenas (Dpto. Estadıstica) Distribuciones Muestrales y Teorema Central del Lımite 5 / 30

Page 6: Clase 07 - Distribuciones Muestrales y Teorema Central del Límite

Teorema Central del Lımite

Las condiciones generales mencionadas anteriormente, se pueden resumirinformalmente como sigue: los terminos Xi tomados individualmente,contribuyen con una cantidad despreciable a la variacion de la suma, y noes probable que un simple termino haga una gran contribucion a la suma.Observe que la variable Y =

∑ni=1Xi puede ser aproximada a la

distribucion normal, cualquiera sea la distribucion de Xi.

Mallen Arenas (Dpto. Estadıstica) Distribuciones Muestrales y Teorema Central del Lımite 6 / 30

Page 7: Clase 07 - Distribuciones Muestrales y Teorema Central del Límite

Teorema Central del Lımite

Teorema

Sean X1, X2, . . . , Xn, n variables aleatorias independientes identicamentedistribuidas con E(Xi) = µ y varianza V (Xi) = σ2 (con media y varianzacomun y ambas finitas). Si

Y =n∑i=1

Xi = X1 +X2 + · · ·+Xn,

entonces la variable aleatoria:

Z =∑n

i=1Xi − nµσ/√n

=√n(X − µ)

σ,

donde X = 1n

∑ni=1Xi, tiene una distribucion aproximadamente normal

con media cero y varianza uno (N(0, 1)).

Mallen Arenas (Dpto. Estadıstica) Distribuciones Muestrales y Teorema Central del Lımite 7 / 30

Page 8: Clase 07 - Distribuciones Muestrales y Teorema Central del Límite

Distribuciones muestrales

Distribuciones muestrales

Definicion (muestra aleatoria (m.a.))

Sea X una variable aleatoria, con funcion de densidad f(x) si X es unav.a. continua y funcion de probabilidad p(x) si X es una v.a. discreta, conmedia µ y varianza σ2. Una muestra aleatoria de tamano n, de X, es unconjunto de n v.a. X1, X2, . . . , Xn que cumplen las siguientes condiciones:

Cada Xi(i = 1, 2, , n) , tiene la misma distribucion que X. Es decir,FXi(x) = FX(x) ∀x, para i = 1, 2, . . . , n.

Las v.a. Xi son independientes.

Mallen Arenas (Dpto. Estadıstica) Distribuciones Muestrales y Teorema Central del Lımite 8 / 30

Page 9: Clase 07 - Distribuciones Muestrales y Teorema Central del Límite

Distribuciones muestrales

Consecuencias:

Cada Xi tiene la misma distribucion, es decir, son identicamentedistribuidas. Entonces

E(Xi) = E(X) = µ

V ar(Xi) = V ar(X) = σ2

La funcion de probabilidad conjunta de la m.a. X1, X2, . . . , Xn estadada por:

P (X=x1, . . . , Xn = xn) =∏ni=1 P (Xi = xi),

(si X es discreta)fX1,...,Xn(x1, . . . , xn) =

∏ni=1 fXi(xi),

(si X es continua)

.

Mallen Arenas (Dpto. Estadıstica) Distribuciones Muestrales y Teorema Central del Lımite 9 / 30

Page 10: Clase 07 - Distribuciones Muestrales y Teorema Central del Límite

Distribuciones muestrales

Notas:

La definicion anterior se cumple, cuando la muestra proviene de unapoblacion infinita discreta o continua y cuando la muestra se extraecon reemplazo de una poblacion finita.

Cuando la muestra se extrae sin reemplazo de una poblacion finita,evidentemente no se cumple la definicion anterior pues las variablesaleatorias no son independientes. Sin embargo , si el tamano de lamuestra es muy pequeno comparado con el tamano de la poblacion,se cumple aproximadamente la definicion.

Mallen Arenas (Dpto. Estadıstica) Distribuciones Muestrales y Teorema Central del Lımite 10 / 30

Page 11: Clase 07 - Distribuciones Muestrales y Teorema Central del Límite

Distribuciones muestrales

Veremos las distribuciones de ciertas funciones de los elementos de unam.a. tales como

X = 1n

∑ni=1Xi, la media muestral;

S2 = 1n−1

∑ni=1(Xi −X)2,, la varianza muestral;

seran muy utiles en inferencia estadıstica.

Mallen Arenas (Dpto. Estadıstica) Distribuciones Muestrales y Teorema Central del Lımite 11 / 30

Page 12: Clase 07 - Distribuciones Muestrales y Teorema Central del Límite

Distribuciones muestrales

Definicion

Cualquier funcion de los elementos de una m.a. que no dependa de algunparametro desconocido se llama estadıstico. Los estadısticos son, por lotanto, v.a. , cuyos valores observados pueden ser evaluados despues quelos valores observados para X1, X2, . . . , Xn son conocidos. Lasdistribuciones de estas v.a. son conocidas como distribuciones muestrales.

Mallen Arenas (Dpto. Estadıstica) Distribuciones Muestrales y Teorema Central del Lımite 12 / 30

Page 13: Clase 07 - Distribuciones Muestrales y Teorema Central del Límite

Distribuciones muestrales

Teorema

Si X1, X2, . . . , Xn es una m.a. de una poblacion X que tiene media µ yvarianza σ2, entonces, X tiene valor esperado µ y varianza σ2/n.

Teorema

Si X1, X2, . . . , Xn es una muestra extraıda sin reemplazo de una poblacionfinita de N elementos, con media µ y varianza σ2, entonces X tiene valoresperado µ y varianza σ2/n((N − n)/(N − 1)).El factor (N − n)/(N − 1) se llama factor de correccion para poblacionesfinitas.

Mallen Arenas (Dpto. Estadıstica) Distribuciones Muestrales y Teorema Central del Lımite 13 / 30

Page 14: Clase 07 - Distribuciones Muestrales y Teorema Central del Límite

Distribucion de la media muestral

Distribucion de la media muestral

Teorema

Si X1, X2, . . . , Xn es una m.a. de una poblacion X que tiene media µ yvarianza σ2, entonces, X tiene distribucion aproximadamente Normal conparametros µ y σ2/n (por el teorema central del lımite).

Mallen Arenas (Dpto. Estadıstica) Distribuciones Muestrales y Teorema Central del Lımite 14 / 30

Page 15: Clase 07 - Distribuciones Muestrales y Teorema Central del Límite

Distribucion de la media muestral

Ejemplo:Suponga que el numero de barriles de petroleo crudo que produce un pozodiariamente es una variable aleatoria con una distribucion no especificada.Si se observa la produccion en 64 dıas, seleccionados en forma aleatoria ysse sabe que la desviacion estandar del numero de barriles por dıa esσ = 16, determine la probabilidad de que la media muestral se encuentre ano mas de cuatro barriles del verdadero valor de la produccion por dıa.

Mallen Arenas (Dpto. Estadıstica) Distribuciones Muestrales y Teorema Central del Lımite 15 / 30

Page 16: Clase 07 - Distribuciones Muestrales y Teorema Central del Límite

Distribucion Chi-cuadrado(χ2)

Distribucion Chi-cuadrado(χ2)

La distribucion χ2 es un caso especial de la distribucion gamma.

Definicion

Se dice que X es una variable aleatoria chi-cuadrado con r grados delibertad (o que tiene una distribucion chi-cuadrado con r grados delibertad) si su funcion de densidad esta dado por:

f(x) =

{1

2r/2Γ( r2

)xr2−1e−

r2 , x > 0

0, e.o.c.,

donde Γ representa la funcion gamma.

Mallen Arenas (Dpto. Estadıstica) Distribuciones Muestrales y Teorema Central del Lımite 16 / 30

Page 17: Clase 07 - Distribuciones Muestrales y Teorema Central del Límite

Distribucion Chi-cuadrado(χ2)

Teorema

Sean Z1, Z2, . . . , Zr variables aleatorias independientes distribuıdasnormalmente, cada una con media 0 y varianza 1. La variable aleatoria:

X = Z21 + Z2

2 + · · ·+ Z2r

tiene distribucion chi-cuadrado con r grados de libertad.

Mallen Arenas (Dpto. Estadıstica) Distribuciones Muestrales y Teorema Central del Lımite 17 / 30

Page 18: Clase 07 - Distribuciones Muestrales y Teorema Central del Límite

Distribucion Chi-cuadrado(χ2)

Los grados de libertad r, es el numero de variables aleatoriasindependientes que se suman. Tambien el grado de libertad se puedeconcebir como un parametro asociado con la distribucion de probabilidad ocomo al numero de variables que pueden variar libremente.La media y la varianza de la variable aleatoria chi-cuadrado con r gradosde libertad son:

µ = E(X) = r y σ2 = V ar(X) = 2r

Mallen Arenas (Dpto. Estadıstica) Distribuciones Muestrales y Teorema Central del Lımite 18 / 30

Page 19: Clase 07 - Distribuciones Muestrales y Teorema Central del Límite

Distribucion Chi-cuadrado(χ2)

La funcion de distribucion F (x) esta tabulada, para distintos valores de r.

Ejemplo

Si X es una variable aleatoria chi-cuadrado con 17 grados de libertad.Calcular:

a) P (X < 7.564)b) P (X > 27.59)c) P (6.408 < X < 7.59)

Ejemplo

Sea X1, X2, . . . , X10 una muestra aleatoria de tamano 10 de una variablealeatoria con distribucion chi cuadrado. Hallar la probabilidad de queexactamente dos de los diez valores muestrales excede a 30.14.

Mallen Arenas (Dpto. Estadıstica) Distribuciones Muestrales y Teorema Central del Lımite 19 / 30

Page 20: Clase 07 - Distribuciones Muestrales y Teorema Central del Límite

Distribucion Chi-cuadrado(χ2)

Teorema

Si X es una variable aleatoria que tiene una distribucion chi-cuadrado conr grados de libertad. Entonces para r suficientemente grande, la variablealeatoria

√2X, tiene aproximadamente una distribucion Normal. Es decir,

si X es χ2(r) , con r grande, entonces:

√2X ∼ aprox.N(

√2r − 1, 1)

Mallen Arenas (Dpto. Estadıstica) Distribuciones Muestrales y Teorema Central del Lımite 20 / 30

Page 21: Clase 07 - Distribuciones Muestrales y Teorema Central del Límite

Distribucion Chi-cuadrado(χ2)

Teorema

Sea X1, X2, . . . , Xn una muestra aleatoria de una variable aleatoria normalX con media µ y varianza σ2. Entonces, la variable aleatoria

Y =n∑i=1

(Xi − µ)2

σ2

tiene una distribucion χ2n.

Mallen Arenas (Dpto. Estadıstica) Distribuciones Muestrales y Teorema Central del Lımite 21 / 30

Page 22: Clase 07 - Distribuciones Muestrales y Teorema Central del Límite

Distribucion Chi-cuadrado(χ2)

Teorema (PROPIEDAD ADITIVA DE LA CHI-CUADRADO)

Sea X21 , X

22 , . . . , X

2p variables aleatorias chi-cuadrados independientes con

grados de libertad r1, r2, . . . , rp respectivamente, entonces la variablealeatoria

X2 =p∑i=1

X2i

Sigue una distribucion chi-cuadrado con∑p

i=1 ri grados de libertad.

Mallen Arenas (Dpto. Estadıstica) Distribuciones Muestrales y Teorema Central del Lımite 22 / 30

Page 23: Clase 07 - Distribuciones Muestrales y Teorema Central del Límite

Distribucion de la varianza muestral

Distribucion de la varianza muestral

Teorema

Si X1, X2, . . . , Xn es una m.a. de una poblacion X que tiene media µ yvarianza σ2, entonces, la varianza muestral

S2 =1

n− 1

n∑i=1

(Xi −X)2

tiene valor esperado igual a σ2.

Mallen Arenas (Dpto. Estadıstica) Distribuciones Muestrales y Teorema Central del Lımite 23 / 30

Page 24: Clase 07 - Distribuciones Muestrales y Teorema Central del Límite

Distribucion de la varianza muestral

Teorema

Sea X1, X2, . . . , Xn una m.a. de una poblacion X con distribucion normalque tiene media µ y varianza σ2, entonces,

La media muestral X y la varianza muestral S2 son variablesaleatorias independientes.

(n− 1)S2

σ2=

∑ni=1(Xi −X)2

σ2

es una variable aleatoria con distribucion chi-cuadrado (χ2) con n− 1grados de libertad.

Mallen Arenas (Dpto. Estadıstica) Distribuciones Muestrales y Teorema Central del Lımite 24 / 30

Page 25: Clase 07 - Distribuciones Muestrales y Teorema Central del Límite

Distribucion t de Student

Distribucion t de Student

Definicion

Sea Z una variable aleatoria normal con media 0 y varianza 1. Sea Y unavariable que tiene una distribucion chi-cuadrado con r grados de libertad,y si Z e Y son independientes, entonces la variable aleatoria

T =Z√Y/r

=Z√r√Y

se dice que tiene una distribucion t de student (o simplemente tiene unadistribucion t), con r grados de libertad, y su funcion de densidad estadado por

f(t) =Γ( r+1

2 )Γ( r2)

1√rπ

1(1 + ( t2r ))(r+1)/2

,

−∞ < t <∞.

Mallen Arenas (Dpto. Estadıstica) Distribuciones Muestrales y Teorema Central del Lımite 25 / 30

Page 26: Clase 07 - Distribuciones Muestrales y Teorema Central del Límite

Distribucion t de Student

Observe que la distribucion de la variable aleatoria T , esta completamentedeterminada solo por el parametro r. Entonces hay una distribucion tcorrespondiente a cada grado de libertad. La media y la varianza de ladistribucion t con r grados de libertad estan dados por:

µ = E(X) = 0, r > 1 y σ2 = V ar(X) =r

r − 2, r > 2.

Mallen Arenas (Dpto. Estadıstica) Distribuciones Muestrales y Teorema Central del Lımite 26 / 30

Page 27: Clase 07 - Distribuciones Muestrales y Teorema Central del Límite

Distribucion t de Student

Tabulacion de la distribucion t:Debido a la importancia de la distribucion t, en inferencia estadıstica y ladificultad para evaluar la funcion de distribucion de la variable aleatoria T ,estas se dan en una tabla

Mallen Arenas (Dpto. Estadıstica) Distribuciones Muestrales y Teorema Central del Lımite 27 / 30

Page 28: Clase 07 - Distribuciones Muestrales y Teorema Central del Límite

Distribucion t de Student

Teorema

Sea X1, X2, . . . , Xn es una m.a. de una poblacion X con distribucionnormal que tiene media µ y varianza σ2, entonces

√n(X − µ)S

tiene distribucion t-student con n− 1 grados de libertad, donde S =√S2

y S2 es la varianza muestral.

Mallen Arenas (Dpto. Estadıstica) Distribuciones Muestrales y Teorema Central del Lımite 28 / 30

Page 29: Clase 07 - Distribuciones Muestrales y Teorema Central del Límite

Distribucion F

Distribucion F

Definicion

Sea U y V dos variables aleatorias independientes que tienendistribuciones chi-cuadrado con, r1 y r2 grados de libertad,respectivamente. Entonces, la variable aleatoria

F =U/r1

V/r2

tiene una distribucion F con r1 y r2 grados de libertad.

Su funcion de densidad esta dada por:

f(z) =Γ( r1+r2

2 )Γ( r12 )Γ( r22 )

(r1

r2)r1/2

zr1/2−1

(1 + ( r1r2 )z)(r1+r2)/2,

0 < z <∞, r1, r2 = 1, 2, . . . .

Mallen Arenas (Dpto. Estadıstica) Distribuciones Muestrales y Teorema Central del Lımite 29 / 30

Page 30: Clase 07 - Distribuciones Muestrales y Teorema Central del Límite

Distribucion F

La media y la varianza de la variable aleatoria F estan dados por:

µ = E(F ) =r2

r2 − 2, r2 > 2 y σ2 = V ar(F ) = 2(

r2

r2 − 2)2 r1 + r2 − 2r1(r2 − 4)

, r2 > 4.

La probabilidad que la variable aleatoria F sea menor o igual que unaconstante fα esta dada por

P (F ≤ fα) =∫ fα

0fF (z)dz = α

La distribucion F cumple con la siguiente propiedad:

f1−α,r2,r1 =1

fα,r1,r2y

fα,r1,r2 =1

f1−α,r2,r1.

Mallen Arenas (Dpto. Estadıstica) Distribuciones Muestrales y Teorema Central del Lımite 30 / 30