23
BIOMETRÍA 242203 242317 02 de Mayo de 2012 Sergio Neira Hugo Arancibia

Biometria clase 8

Embed Size (px)

Citation preview

BIOMETRÍA

242203 242317

02 de Mayo de 2012

Sergio Neira – Hugo Arancibia

• Inferencia estadística (intervalos de confianza y

prueba de hipótesis)

• Hipótesis nula e hipótesis alternativa

• Nivel de significancia y valor crítico del estadístico

de prueba

• Error Tipo I y Error Tipo II

Nuestro objetivo es hacer inferencias sobre una población (ej. los parámetros que la caracterizan) a partir de la información contenida en una muestra elegida al azar.

El procedimiento de prueba de hipótesis es muy similar al método científico.

Inferencia: Una conclusión que surge de forma lógica a partir de

observaciones o premisas

Método científico:

- Observar la naturaleza de un fenómeno

- Formular una teoría

- Confrontar la teoría con la evidencia observada

Si lo observado difiere de la teoría, se rechaza la hipótesis. En caso contrario, podemos concluir:

i) La teoría es verdadera, o

ii) La muestra no detectó diferencias importantes o significativas entre los valores reales y los postulados por la hipótesis planteada.

¿Qué puede hacer la estadística en lo que se refiere a pruebas de hipótesis?

¿Cómo decidimos si la información contenida en una muestra dada está en desacuerdo con la teoría?

¿Es adecuado el tamaño de la muestra?

¿En qué circunstancias deberíamos rechazar/aceptar la hipótesis?

¿Cómo emitir una conclusión?

Definición: una hipótesis estadística es una afirmación o conjetura sobre los parámetros de la distribución de probabilidades de una o más variables aleatorias.

Una Hipótesis estadística simple especifica completamente la distribución, de lo contrario hablamos de Hipótesis estadística compuesta.

Denominamos Hipótesis nula, H0 a la hipótesis a ser probada. A la hipótesis nula contraponemos una segunda hipótesis que llamaremos Hipótesis alternativa, H0.

Todas las pruebas de hipótesis trabajan en base a ciertos principios los que se pueden resumir en los siguientes elementos: 1. Una hipótesis nula H0 2. Una hipótesis alternativa HA

3. Un estadístico de prueba 4. Una zona de rechazo 5. Regla de decisión 6. Conclusión

El estadístico de prueba, al igual que un estimador, es una función de la muestra. Nos interesa que contenga el máximo de información sobre la H0 planteada. Es en base a la información contenida en esta función que se tomará la decisión respecto de la aceptación o rechazo de H0 .

La zona de rechazo (ZR), también llamada región crítica (RC), define los valores del estadístico de prueba para los cuales la información muestral contradice la hipótesis nula. Estos valores permitirán adoptar una regla de decisión consistente.

Regla de decisión. Si para una muestra particular el estadístico de prueba (valor calculado) cae dentro de la ZR o RC, rechazaremos H0 en favor de HA . Si el valor no cae dentro de ZR no podremos rechazar H0 .

El criterio para delimitar los límites de la ZR o RC es similar al utilizado para los límites de los intervalos de confianza. Esto es, deseamos rechazar la H0 en aquellos casos en que el parámetro de interés esté fuera del intervalo de confianza.

Definición: el nivel de significancia ( ) es la probabilidad que

el valor observado del estadístico de prueba esté en la región

crítica o zona de rechazo.

El nivel de significancia también se conoce como “valor-p” de

la prueba de hipótesis y representa la cantidad de evidencia en

contra de H0 encontrada en la muestra bajo el supuesto que H0

es verdadera.

Si es mayor que p: se rechaza H0.

Si es menor que p: se acepta H0.

Una probabilidad de 5% (0.05) o menos se considera un buen

criterio para rechazar H0.

1) H0: µ=10.00 mg/m3 y HA: µ≠10.00 mg/m3

2) Estadístico Z

3) Zona de rechazo

4) Regla de decisión

5) Conclusión

1.96 -1.96 0

Imaginemos que tenemos 25 jaibas del inter-mareal de

Bahía Coliumo que fueron expuestas a temperatura

ambiente a 24.3°C. Deseamos saber si la temperatura

corporal de los miembros de esta especie de jaiba es la

misma que la temperatura del aire (24.3°C).

H0: µ=24.3°C

HA: µ≠24.3°C

X

XZ

Es una variable normal; es útil para

determinar la probabilidad de

obtener una muestra con media

desde una población con una media

específica µ.

El cálculo de Z requiere conocer

el error estándar de la media, que normalmente no es el caso.

La mejor alternativa es calcular

Si n es muy, pero muy pequeño entonces no es un buen estimado

de y no podemos calcular Z usando este estimado.

X

Xs

Xs

Xt

Como sucede con muchas

distribuciones estadísticas, la

distribución t tiene diferentes formas

las que dependen de lo que se

conoce como grados de libertad

(denotado por v).

donde :

Recordemos que n es el número es el tamaño de la muestra

1nv

Ejemplo de test t de dos colas para la diferencia entre una

media poblacional y una media poblacional hipotética.

Individuo Temperatura corporal

1 25.8

2 24.6

3 26.1

4 22.9

5 25.1

6 27.3

7 24.0

8 24.5

9 23.9

10 26.2

11 24.3

12 24.6

13 23.3

14 25.5

15 28.1

16 24.8

17 23.5

18 26.3

19 25.4

20 25.5

21 23.9

22 27.0

23 24.8

24 22.9

25 25.4

Promedio 25.03

varianza 1.80

desv. Est. 1.34

Error est. 0.27

1) H0: µ=24.3°C; HA: µ≠24.3°C

2) Estadístico t

3) Zona de rechazo

4) Regla de decisión

5) Conclusión

Considere: =0.05; n=25; Promedio=25.03°C; v=24;

704.227.0

3.2403.25

C

CC

s

Xt

X

2.064 -2.064 0

064.224),2(05.0t

24),2(05.0|| tt

Rechazamos H0 y concluimos que la muestra de 25 temperaturas corporales

viene de una muestra cuya media no es 24.3°C

Cuando en una prueba de hipótesis consideramos un valor de

t tan extremo en cualquier dirección respecto de µ que

causará rechazar H0 , decimos que consideramos una prueba

de “dos colas” (o “de dos lados”).

En general, para una prueba t de dos colas rechazamos H0 si:

vtt ),2(||

Cambio de peso de 12 ratas sometidas a un régimen de

ejercicio forzado. Cada cambio en peso (en gramos) es el

peso después del ejercicio menos el peso antes del ejercicio.

Cambio de peso

1.7

0.7

-0.4

-1.8

0.2

0.9

-1.2

-0.9

-1.8

-1.4

-1.8

-2.0

Promedio -0.7

Varianza 1.6

Desv. Est. 1.3

Muchas veces el valor

hipotético de las hipótesis

nula y alternativa es cero.

H0: µ=0; HA: µ≠0

En muchos casos nuestro interés es saber si la media de

la muestra es significativamente mayor (o

significativamente menor) que µ0.

A esto lo denominaremos prueba de una cola (o prueba

de un lado).

Por ejemplo, consideremos un caso en que se prueba

una droga (derivada de un alga) que causa disminución

del peso en humanos. El investigador está interesado

sólo en si la el peso disminuye después de que se

administra la droga.

Individuo cambio en peso

1 0.2

2 -0.5

3 -1.3

4 -1.6

5 -0.7

6 0.4

7 -0.1

8 0

9 -0.6

10 -1.1

11 -1.2

12 -0.8

-1.796 0

796.111),1(05.0t

H0: µ 0; HA: µ<0

Si estamos interesados que la media de la muestra sea

significativamente mayor que algún valor µ0

H0: µ≤µ0 ; HA: µ> µ0 ; rechazamos H0 si

La situación contraria (que la media de la muestra sea

significativamente menor que algún valor µ0 )

H0: µ µ0 ; HA: µ< µ0 ; rechazamos H0 si

vtt ),1(

vtt ),1(

Hipótesis para la diferencia de dos medias

Hipótesis relacionadas con la varianza

Distribución X2