30
BIOMETRÍA 242203 242317 17 de abril de 2012 Sergio Neira Hugo Arancibia

Biometria clase 6

Embed Size (px)

Citation preview

BIOMETRÍA

242203 242317

17 de abril de 2012

Sergio Neira – Hugo Arancibia

• Distribuciones de probabilidad = frecuencias teóricas.

• Nos permiten hacer predicciones, hacer juicios o tomar decisiones.

• Las usamos porque se ajustan a observaciones.

• Cuando la data (obs) no se ajustan a la teoría (esp), estaremos frente a la

presencia de algún mecanismo biológico causando esta discrepancia (o

desviación).

• TLC: Independiente de la distribución subyacente, si las sumas o

promedios de muestras grandes e independientes son estandarizadas,

entonces seguirán una distribución normal.

• TLC apoya el uso de pruebas estadísticas que suponen distribución

normal.

µ -1σ -2σ -3σ 1σ 2σ 3σ

50%

68.27%

95.45%

99.73%

• Comportamiento de las muestras

• La distribución de la media muestral

• La distribución de la proporción muestral

• Distribuciones muestrales e inferencia estadística

Supongamos que tenemos un censo (e.g. conocemos la

población completa y sus parámetros poblacionales µ y σ.

Unos años después queremos indagar nuevamente sobre los

parámetros, pero no podemos muestrear nuevamente toda la

población. Entonces, tomamos una muestra y obtenemos los

parámetros muestrales y s.

¿Cuál es la conexión entre la muestra poblacional y la

muestral?

x

Población de langostino amarillo

µ

Población de

langostino amarillo

x

Muestra

(30 indv.)

Media

muestral

?

Población de

langostino amarillo

x

?

x

x

Si tomamos una muestra mañana, tendremos otra media y

varianza, distintas muestras tendremos distintas medias y

varianzas.

De hecho, podemos tener múltiples medias dependiendo del

número de muestras que tengamos.

Entonces ¿Por qué debemos confiar en una media muestral

específica?

1. Las medias muestrales varían, pero lo hacen alrededor de la

media poblacional.

2. Aunque varían, no varían mucho. De hecho cualquier media

muestral no se ubicará muy lejos de la media poblacional (media

verdadera).

Si tenemos una población (universo) existe una población

completa de medias muestrales, esta población es conocida

como .

Y la probabilidad de la es la distribución de probabilidad que

describe .

El estudio de la distribución de la media muestral nos permite:

1. Estudiar como se “comportan las muestras”.

¿Qué medias muestrales encontraremos?

¿Cuál es su verosimilitud?

¿Cuál es su variabilidad?

X

XX

MM1 MM2

MM1 y MM2 constituyen el conjunto , y tiene su propia distribución:

La Distribución de la Media Muestral.

X

X

Como ya vimos, la distribución de la media muestral se

distribuye alrededor de la media poblacional µ.

1. Entonces, la media de la distribución de la media muestral

es igual a la media poblacional µ.

2. Las medias muestrales no varían demasiado, entonces si X

tiene una desviación estándar σ y tamaño muestral n,

entonces:

La desviación estándar de

=> Mientras más grande es n, menor es σ. Esto es, menor

variación alrededor de µ.

nX

Si la distribución de x es normal, es normal.

Si la distribución de x no es normal, aún será normal si la muestra es suficientemente grande.

La distribución muestral de la media es la distribución principal que obtendremos de variables numéricas.

Si tenemos una variable categórica, entonces nos enfocamos en la distribución muestral de la proporción.

X

X

X

Si la variable x es categórica, esto significa que sus valores son categorías (cualidades).

Supongamos que queremos conocer el sabor favorito de las personas (chocolate, vainilla, pasas al ron) .

Estos tres sabores serán las tres categorías de x.

En general, nos interesaremos por la(s) proporción(es) de una o más de estas categorías.

Proporción de chocolate=50% (π= 50%)

Tal como en el caso de , podemos tomar distintas muestras y cada muestra nos arrojará un valor distinto de π. π1= 39%

π2= 41% π3= 40% π4= 38% . . . Definimos la variable P como la distribución muestral de π.

X

Tal como en el caso de , esperamos que las proporciones muestrales varíen alrededor de la π de la población.

Supongamos entonces que tenemos una variable categórica X, y que estamos interesados en la proporción de una de las categorías dentro de X, cuya distribución de la proporción muestral es π.

Sea P la distribución de π.

X

P se distribuirá aproximadamente normal con

2

1

)1(

n

Usamos todo lo que hemos visto para realizar Inferencia estadística:

1. Recolectar una muestra

2. Concluir cosas respecto de la población

Supongamos que tenemos dos poblaciones:

X: µ = 50 y σ=5

Y : µ = 55 y σ=20

Tenemos una muestra cuya media muestral es = 52.

¿A qué población corresponde?

X~N(50, 5)

Y~N(55, 20)

Media muestra = 52

X~N(50, 5)

Y~N(55, 20)

Media muestra = 52

La media de la muestra se acerca más a 50 que a 55. Pertenece a X?

X~N(50, 0.5)

Y~N(55, 2)

Media muestra = 52

Miremos ahora las distribuciones muestrales.

X~N(50, 0.5)

Media muestra = 52

El valor de la media parece

extremo en X

Media muestra = 52

El valor de la media parece

extremo en X, pero no en Y.

Y~N(55, 2)

Media muestra = 52

El valor de la media parece

extremo en X, pero no en Y.

Entonces, inferimos que la

muestra vino de Y

Y~N(55, 2)

Existen dos campos principales en la inferencia estadística:

• Estimación

• Pruebas

Inferencia: Una conclusión que surge de forma lógica a partir de

observaciones o premisas

• Tomamos una muestra

• Calculamos la media y, de acuerdo a ella,

• Damos un rango de valores para la media poblacional

Una muestra de las notas del primer test de BIOMETRIA arrojó lo siguiente:

“Confío que el promedio del curso está entre y ”.

Calculamos la media para entregar un rango

de valores para el parámetro poblacional.

95.0)96.196.1( xx sxsxP Aleatorio X

24 6.0

17 4.0

30 5.5

32 2.0

7 2.0

8 6.5

3 2.0

14 4.0

5 4.5

13 5.5

media 4.2

desv. Estándar 1.7

n 10.0

sx 0.5

1. Proponemos un valor para el parámetro poblacional

2. Tomamos una muestra 3. Probamos nuestro supuesto contra la muestra.

Supuesto sobre el chocolate Proporción poblacional: 40% Tomamos una muestra La proporción muestral: 32% Conclusión Nuestro supuesto sobre la proporción poblacional fue errado (πpoblacional ≠ 40%) En este caso la muestra se usa como evidencia para probar un supuesto sobre la población.