19
SEMINARIO 8: Análisis bivariado con variables cuantitativas. Normalidad y linealidad. Diagrama de dispersión. Coeficientes de correlación de Pearson y Rho de Spearman

Seminario 8

Embed Size (px)

Citation preview

Page 1: Seminario 8

SEMINARIO 8: Análisis bivariado con variables cuantitativas.

Normalidad y linealidad. Diagrama de dispersión. Coeficientes de correlación de Pearson y Rho de Spearman

Page 2: Seminario 8

Ejercicio:

•Determina si existe relación entre las variables altura y peso del fichero de datos “activos en salud” y si existe determina cómo de fuerte es.

Page 3: Seminario 8

1º ¿Ante qué nos encontramos?•En primer lugar comprobamos que se

trata de dos variables cuantitativas.•El ejercicio pide una correlación.•Por tanto debemos de emplear para su análisis y relación la Correlación de Pearson o Rho de

Spearman.

• Para averiguar cual de las dos debemos de aplicar hemos de tener en cuenta una serie de características entre las variables.

• Se trata de un análisis de dos variables, es decir, bivariada.

• Sabiendo que la correlación es el grado o fuerza de relación entre dos variables.

Page 4: Seminario 8

2º ¿Qué prueba debemos de usar?•Tenemos que tener en cuenta si se puede

usar una prueba paramétrica o no paramétrica:PRUEBAS

PARAMÉTRICASPRUEBAS NO PARAMÉTRICAS

Para estimar un parámetro •con al menos una variable cuantitativa • las variables siguen una distribución normal –Si se comparan dos muestras »Homocedasticidad ó igualdad de las varianzas

PEARSON

Cuando los datos se han recogido con escala nominal u ordinal –No implican suposición de normalidad –Son menos sensibles, son más robustos, que los test paramétricas

SPEARMAN

Page 5: Seminario 8

2º ¿Qué prueba debemos de usar?•En definitiva, según si las variables

siguen o no una distribución normal emplearemos una prueba u otra:

•Si sigue una DISTRIBUCIÓN NORMAL usaremos PEARSON.

•Si NO sigue una DISTRIBUCIÓN NORMAL usaremos por tanto SPEARMAN.

Page 6: Seminario 8

3º Comprobar la normalidad de los datos.•Para ello vamos a emplear dos métodos

diferentes. En este caso ambos para asegurarnos de que nuestras observaciones son correctas:

•A) MÉTODOS GRÁFICOS (histogramas, Box-plot y gráfico QQ).

•B) PRUEBAS DE NORMALIDAD (Siendo el test de Shapiro Wilk el más usado)

Page 7: Seminario 8

a) Métodos gráficos: PESO (En R)GRÁFICO QQ:Seleccionamos la variable peso Y DISTRIBUCIÓN NORMAL.

Page 8: Seminario 8

a) Métodos gráficos:PESOHISTOGRAMA

Page 9: Seminario 8

a) Métodos gráficos: PESO

GRÁFICO BOX-PLOT O DIAGRAMA DE CAJA

Page 10: Seminario 8

a) Métodos gráficos: PESO •Podemos observar que no sigue una distribución normal.

Distribución normal

Distribución del peso

Page 11: Seminario 8

b) Pruebas de normalidad: PESO

No sigue una distribución normal

Page 12: Seminario 8

a) Métodos gráficos: ALTURA

Observamos que tampoco se sigue una distribución normal

Page 13: Seminario 8

b) Pruebas de normalidad: ALTURA

•No sigue una distribución normal.

Page 14: Seminario 8

4º Elegir la prueba en base a lo que hemos observado

•Ninguna de las variables sigue una distribución normal, por tanto es NO PARAMÉTRICA y aplicamos Rho de Spearman.

Page 15: Seminario 8

5º Ver el tipo de relación y cómo de fuerte es:

•Se trata de ver la regresión (tipo de relación entre ambas variables) y la

•Correlación ( si existe una relación fuerte y cómo es).

•Para ello:•A) Estudiamos la linealidad entre las variables.•B) Obtenemos los coeficientes de correlación.

Page 16: Seminario 8

a) Linealidad de las variables:

Page 17: Seminario 8

A partir del diagrama obtenido no podemos determinar que existe relación entre ambas variables, debemos de obtener los datos numéricos

No se aprecia con suficiente claridad, mejor comparar con los resultados

numéricos

Page 18: Seminario 8

b) Coeficientes de correlación

Seleccionar ambas

variables

Page 19: Seminario 8

6º Interpretar los resultados de la prueba

• Los valores se sitúan en torno a -1 y 1. Valores cercanos al -1 nos muestran correlación negativa, los cercanos al 1 positiva; pero los que son igual a 0 no tienen correlación.

• Hay una correlación buena.

0.622