34
La Distribución La Distribución Normal. Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales esperados para la población en estudio. SOLUCIÓN: Medir características de un individuo y, si los valores encontrados son los habituales para otras estimaciones realizadas es posible decir que son valores normales. Estadística Biología Marina 200 3

La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

Embed Size (px)

Citation preview

Page 1: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

La Distribución Normal.La Distribución Normal.

• Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales esperados para la población en estudio.

SOLUCIÓN: Medir características de un individuo y, si los valores encontrados son los habituales para otras estimaciones realizadas es posible decir que son valores normales.

Estadística Biología Marina 2003

Page 2: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

Para establecer los límites entre lo habitual y lo raro, es necesario conocer

la distribución de la variable en estudio, en individuos normales.

• Si presentamos la distribución de una variable en un histograma de frecuencias, es posible fijar los límites entre los que se encuentra la mayoría de los datos, y fuera de estos límites se encontrarían muy pocos datos (no normales).

Estadística Biología Marina 2003

En la Práctica:

Page 3: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

Ejemplo:Ejemplo:• Datos del nivel de glucosa de

salmones en un cultivo son comparados con la distribución de ya conocida de esta variable.

• Fijamos límites donde podemos discriminar individuos sanos, fuera de estos límites se encuentran muy pocos.

Estadística Biología Marina 2003

Fre

qu

en

cy

Category/class

- Datos Observados

- Datos Esperados en base a una distribución normal

Page 4: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

““La distribución Normal, La distribución Normal, considerarse como modelo considerarse como modelo

adecuado para la distribución de adecuado para la distribución de un gran número de variables en un gran número de variables en

el campo biológicoel campo biológico “ “

Estadística Biología Marina 2003

Page 5: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

Características:Características:

• Su grafico semeja una campana simétrica, cuyas colas se extienden hacia el infinito tanto en dirección negativa como en la positiva (es asintótica con respecto al eje horizontal).

Estadística Biología Marina 2003

Page 6: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

• El promedio, la mediana, el la moda de la distribución tienen el mismo valor.

• Las distribución queda completamente definida por el promedio y la desviación estándar.

• Cualesquiera sean los valores de μ y σ, el área bajo la curva comprendida entre el promedio más y menos 1, 2 y 3 desviaciones estándar es aproximadamente:

1 = 0.6826 2 = 0.9546 3 = 0.9973

Estadística Biología Marina 2003

Page 7: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

Estadística Biología Marina 200

3

• Su una población de 1000 pesos corporales de cangrejos, está distribuida de forma normal, tiene una de 70 Kg, la mitad de la población (500) es mayor a 70 Kg, y la otra es menor a 70 Kg.

• Esto es cierto debido a que la distribución normal es SIMÉTRICA.

Proporciones de la Curva NormalProporciones de la Curva Normal

Page 8: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

• De esta forma para cualquier valor de Xi de una población normal con media y desviación estándar , el valor de :

• Nos dice cuantas desviaciones estándar desde la media se encuentra nuestro valor Xi buscado.

Este cálculo es llamado “NORMALIZACIÓN o ESTANDARIZACIÓN”

Estadística Biología Marina 2003

Xi

Z

Page 9: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

Así quedan nuestros datos:Así quedan nuestros datos:

Estadística Biología Marina 2003

Pro

bab

ilit

y

-3 -2 -1 0 1 2 3

Z

Zx

Normalizados (Z-transformados)

no- normalizados

La distribución resultante tiene = 0, 2 = 1

Page 10: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

• La media de un set de valores estándares normales es 0 y la varianza en 1.

• La tabla B.2 (de Zar 1999), nos indica que proporción de una distribución normal cae más allá un valor dado de Z.

Estadística Biología Marina 2003

Ejemplo: para un valor de Z = 0.78.

El valor de la tabla es…

Page 11: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

Para un valor de Z = 0.78.

El valor de la tabla es 0.2177, valor que representa la proporción de la curva que se encuentra mas “alla” de 0.78.

Page 12: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

Otro Ejemplo:Otro Ejemplo:

• Una distribución normal del largo de fémures de leopardo tiene: = 60mm y = 10mm.

• ¿Qué proporción de la población de huesos presenta un largo mayor a 66mm

Estadística Biología Marina 2003

Z = 66mm-60mm = 0.60

10mm

Vemos la Tabla…

P (Xi>66mm) = P (Z>0.60) = 0.2743 o 27.43 %

Page 13: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

• Si la población esta compuesta por 2000 huesos, ¿cuántos de ellos van a ser mayores que 66mm?

(0.2743) (2000) = 549

• ¿Que proporción de la población es menor que 66mm?

P (Xi < 66mm)= 1.000-P(Xi>66mm)

= 1.000 – 0.2743 = 0.7257

Estadística Biología Marina 2003

Page 14: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

Test estadístico para la NormalidadTest estadístico para la Normalidad

• Tiene como objetivo determinar si los datos provienen de una distribución normal.

• También es llamado “test de bondad de ajuste para Normalidad”.

Estadística Biología Marina 2003

0

2

4

6

8

10

12

61 64 67 70 73 76 79

Largo de la lengua (mm)

Frec

uenc

ia a

bsol

uta

¿ Los valores observados se distribuyen de manera normal?

Page 15: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

Un adelanto…Un adelanto…

En todo test estadístico se plantean 2 hipótesis:• Ho o Hipótesis Nula.• Ha o Hipótesis Alternativa.

En este caso:• Ho: Los datos de la muestra se distribuyen de

forma normal• Ha: Los datos de la muestra se no distribuyen de

forma normal

Estadística Biología Marina 2003

Page 16: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

Para decidir con que hipótesis nos Para decidir con que hipótesis nos quedamos, tener en cuenta:quedamos, tener en cuenta:

1. Cada test estadístico produce un valor determinado

2. Este valor tiene asociado una probabilidad

3. La probabilidad (P) se compara con un valor prefijado ( = 0.05), de esta forma:

Estadística Biología Marina 2003

Si P Rechazamos Ho

Si P > Fallamos en rechazar Ho

Page 17: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

Existen diferentes test de Existen diferentes test de normalidad… normalidad…

• Test de Kolmogorov-Smirnov:– Se fija en la distribución y no en la ubicación con el

eje X– Convierte Frecuencias Relativas observadas a

valores de Z– Luego determina si la distribución es normal

Es también es conocido como test de Lilliefors

Estadística Biología Marina 2003

Page 18: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

Veamos como se aplica:Veamos como se aplica:

Estadística Biología Marina 2003

Se realizaron mediciones del largo de la lengua (mm) de pumas salvajes capturados en la Pampilla

Page 19: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

Pasos a seguir:Pasos a seguir:1. Inspección de Datos

Estadística Biología Marina 2003

Comparar la distribución absoluta con una

distribución normal.

La distribución acumulada observada se compara con la

distribución acumulada esperada

Page 20: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

Los datos individuales se grafican v/s los

valores esperados de la distribución de Z

Estadística Biología Marina 2003

Page 21: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

2. Test de bondad de ajuste para normalidad

a) Organizar los datos en una tabla de frecuencia

Estadística Biología Marina 2003

Intervalo Xi fi Fi

< 62.5 62 0 0

62.5 – 63.5 63 2 2

63.5 – 64.5 64 2 4

64.5 – 65.5 65 3 7

65.5 – 66.5 66 5 12

66.5 – 67.5 67 4 16

67.5 – 68.5 68 6 22

68.5 – 69.5 69 5 27

69.5 – 70.5 70 8 35

70.5 – 71.5 71 7 42

71.5 – 72.5 72 7 49

72.5 – 73.5 73 10 59

73.5 – 74.5 74 6 65

74.5 – 75.5 75 3 68

75.5 – 76.5 76 2 70

76.5 – 77.5 77 0 70

> 77.5 78 0 70

Page 22: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

b) Calcular la frecuencia relativa acumulada

relFi=(Fi*1)/n

Estadística Biología Marina 2003

Intervalo Xi fi Fi rel Fi

< 62.5 62 0 0 0.0000

62.5 – 63.5 63 2 2 0.0286

63.5 – 64.5 64 2 4 0.0571

64.5 – 65.5 65 3 7 0.1000

65.5 – 66.5 66 5 12 0.1714

66.5 – 67.5 67 4 16 0.2286

67.5 – 68.5 68 6 22 0.3143

68.5 – 69.5 69 5 27 0.3857

69.5 – 70.5 70 8 35 0.5000

70.5 – 71.5 71 7 42 0.6000

71.5 – 72.5 72 7 49 0.7000

72.5 – 73.5 73 10 59 0.8429

73.5 – 74.5 74 6 65 0.9286

74.5 – 75.5 75 3 68 0.9714

75.5 – 76.5 76 2 70 1.0000

76.5 – 77.5 77 0 70 1.0000

> 77.5 78 0 70 1.0000

Page 23: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

c) Calcular la frecuencia relativa acumulada esperada relFi (esp):

Estadística Biología Marina 2003

-Calculo de Zi

-P asociada a Z

-Calculo de la relFi

esperada con P(Z)

Intervalo Xi fi Fi rel Fi Z P(Z) rel Fi

< 62.5 62 0 0 0.0000 -2.32 0.0102 0.0102

62.5 – 63.5 63 2 2 0.0286 -2.02 0.0115 0.0217

63.5 – 64.5 64 2 4 0.0571 -1.71 0.0219 0.0436

64.5 – 65.5 65 3 7 0.1000 -1.41 0.0357 0.0793

65.5 – 66.5 66 5 12 0.1714 -1.11 0.0542 0.1335

66.5 – 67.5 67 4 16 0.2286 -0.81 0.0755 0.2090

67.5 – 68.5 68 6 22 0.3143 -0.50 0.0995 0.3085

68.5 – 69.5 69 5 27 0.3857 -0.20 0.1122 0.4207

69.5 – 70.5 70 8 35 0.5000 0.10 0.1191 0.5398

70.5 – 71.5 71 7 42 0.6000 0.40 0.1156 0.6554

71.5 – 72.5 72 7 49 0.7000 0.70 0.1026 0.7580

72.5 – 73.5 73 10 59 0.8429 1.01 0.0858 0.8438

73.5 – 74.5 74 6 65 0.9286 1.31 0.0611 0.9049

74.5 – 75.5 75 3 68 0.9714 1.61 0.0414 0.9463

75.5 – 76.5 76 2 70 1.0000 1.91 0.0256 0.9719

76.5 – 77.5 77 0 70 1.0000 2.21 0.0145 0.9864

> 77.5 78 0 70 1.0000 2.52 0.0136 1.0000

DSInterSup

Zi).(lim

Page 24: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

d) Calcular las diferencias entre las frecuencias relativas acumuladas.

Intervalo Xi fi Fi rel Fi Z P(Z) rel Fi Di Di'

< 62.5 62 0 0 0.0000 -2.32 0.0102 0.0102 0.0102 0.0102

62.5 – 63.5 63 2 2 0.0286 -2.02 0.0115 0.0217 0.0069 0.0217

63.5 – 64.5 64 2 4 0.0571 -1.71 0.0219 0.0436 0.0135 0.0150

64.5 – 65.5 65 3 7 0.1000 -1.41 0.0357 0.0793 0.0207 0.0222

65.5 – 66.5 66 5 12 0.1714 -1.11 0.0542 0.1335 0.0379 0.0335

66.5 – 67.5 67 4 16 0.2286 -0.81 0.0755 0.2090 0.0196 0.0376

67.5 – 68.5 68 6 22 0.3143 -0.50 0.0995 0.3085 0.0058 0.0799

68.5 – 69.5 69 5 27 0.3857 -0.20 0.1122 0.4207 0.0350 0.1064

69.5 – 70.5 70 8 35 0.5000 0.10 0.1191 0.5398 0.0398 0.1541

70.5 – 71.5 71 7 42 0.6000 0.40 0.1156 0.6554 0.0554 0.1554

71.5 – 72.5 72 7 49 0.7000 0.70 0.1026 0.7580 0.0580 0.1580

72.5 – 73.5 73 10 59 0.8429 1.01 0.0858 0.8438 0.0009 0.1438

73.5 – 74.5 74 6 65 0.9286 1.31 0.0611 0.9049 0.0237 0.0620

74.5 – 75.5 75 3 68 0.9714 1.61 0.0414 0.9463 0.0251 0.0177

75.5 – 76.5 76 2 70 1.0000 1.91 0.0256 0.9719 0.0281 0.0005

76.5 – 77.5 77 0 70 1.0000 2.21 0.0145 0.9864 0.0136 0.0136

> 77.5 78 0 70 1.0000 2.52 0.0136 1.0000 0.0000 0.0000

)(relFirel espFiDi )(i1 relFrel espiFDi

Page 25: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

Estadística Biología Marina 200

3

• El test estadístico es D=max…

• El valor crítico para este test es D,n y se encuentra en la Tabla B9 de Zar (1999).

• SI D D,n entonces se rechaza Ho.

– En este ejemplo Dmax = 0.1580

D0.05,70=0.15975

“Los datos de largo de lengua de Pumas capturados en la Pampilla se ajustan a una

distribución normal (test de lilliefors P >0.05)”

Page 26: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

Presentación gráfica del test K-SPresentación gráfica del test K-S

Estadística Biología Marina 2003

62 64 66 68 70 72 74 76 78Largo de la lengua (mm)

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1.0F

recu

enci

a re

lativ

a ac

umul

ada

Observada

Esperada

Di = 0.0580Di’ = 0.1580

rel Fi - 1 = 0.6000

rel Fi(esp) = 0.7580

rel Fi = 0.7000

Page 27: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

Concepto de Sesgo y CurtosisConcepto de Sesgo y Curtosis

• Al analizar los polígonos de frecuencia poner atención en dos elementos esenciales:

– Su Simetría

– Su apuntamiento

Estadística Biología Marina 2003

Page 28: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

Sesgo o Asimetría (g1)Sesgo o Asimetría (g1)

• Nos permite conocer cuanto se parece nuestra distribución a una distribución normal

• Constituye un indicador del lado de la curva donde se agrupan los datos.

Estadística Biología Marina 2003

Page 29: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

• Si es 0 la curva es simétrica

• Si es positivo existen más valores agrupados a la izquierda

• Si es negativo existen más valores agrupados a la derecha

Estadística Biología Marina 2003

g1 = 0g1 = 0

g1 < 1g1 < 1

g1 > 1g1 > 1

Page 30: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

La Curtosis (g2)La Curtosis (g2)

• Es un indicador del grado de apuntamiento de nuestra curva.

Estadística Biología Marina 2003

Page 31: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

• Si es 0 la curva es normal

• Si es positivo la curva es las levantada o apuntada

• Si es negativo la curva es más plana

Estadística Biología Marina 2003

g2 = 0g2 = 0

g2 < 1g2 < 1

g2 > 1g2 > 1

Page 32: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

Utilidad del Sesgo y la CurtosisUtilidad del Sesgo y la Curtosis

• Generalmente estos estadísticos no son informados.

• Pero en ecología, en estudios de depredación, competencia y efectos de factores físicos o químicos, pueden ser útiles

Veamos el siguiente caso:

Estadística Biología Marina 2003

Page 33: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

SesgoSesgo• Distribución de tallas de anfípodos Hyale sp

La tallas se distribuyen de forma normal

Media = 75.5mm

g1 = - 0.03

n = 5000

Estadística Biología Marina 2003

0

5

10

15

20

25

30

0 25 50 75 100 125 150 175 200

Talla (mm)

Fre

cuen

cia

rela

tiva

0

5

10

15

20

25

30

0 25 50 75 100 125 150 175 200

Talla (mm)

Fre

cuen

cia

rela

tiva

• Llegada de nuevo depredador que come selectivamente individuos de talla superior a 140mm.

La distribución se vuelve asimétrica aumentado el sesgo

Media = 125.5mm

g1 = - 0.27

n = 4330

Page 34: La Distribución Normal. Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales

CurtosisCurtosis

Estadística Biología Marina 2003

0

5

10

15

20

25

30

0 25 50 75 100 125 150

Talla (mm)F

recu

enci

a re

lativ

a

0

5

10

15

20

25

30

0 25 50 75 100 125 150

Talla (mm)

Fre

cuen

cia

rela

tivaDistribución de tallas de anfípodos Hyale sp

La tallas se distribuyen de forma normal

Media = 75.5mm

g2 = - 0.02

n = 5000

• El nuevo depredador come selectivamente individuos de tallas entre 45 a 120mm.

• Los anfípodos mas chicos y grandes no son afectados.

La curtosis declina y la distribución se hace más plana

Media = 75.5mm

g2 = - 1.15

n = 1800