Upload
noegonbae
View
103
Download
1
Embed Size (px)
Citation preview
SEMINARIO 8: Análisis bivariado con variables cuantitativas.
Normalidad y linealidad. Diagrama de dispersión. Coeficientes de correlación de Pearson y Rho de Spearman
Ejercicio:
•Determina si existe relación entre las variables altura y peso del fichero de datos “activos en salud” y si existe determina cómo de fuerte es.
1º ¿Ante qué nos encontramos?•En primer lugar comprobamos que se
trata de dos variables cuantitativas.•El ejercicio pide una correlación.•Por tanto debemos de emplear para su análisis y relación la Correlación de Pearson o Rho de
Spearman.
• Para averiguar cual de las dos debemos de aplicar hemos de tener en cuenta una serie de características entre las variables.
• Se trata de un análisis de dos variables, es decir, bivariada.
• Sabiendo que la correlación es el grado o fuerza de relación entre dos variables.
2º ¿Qué prueba debemos de usar?•Tenemos que tener en cuenta si se puede
usar una prueba paramétrica o no paramétrica:PRUEBAS
PARAMÉTRICASPRUEBAS NO PARAMÉTRICAS
Para estimar un parámetro •con al menos una variable cuantitativa • las variables siguen una distribución normal –Si se comparan dos muestras »Homocedasticidad ó igualdad de las varianzas
PEARSON
Cuando los datos se han recogido con escala nominal u ordinal –No implican suposición de normalidad –Son menos sensibles, son más robustos, que los test paramétricas
SPEARMAN
2º ¿Qué prueba debemos de usar?•En definitiva, según si las variables
siguen o no una distribución normal emplearemos una prueba u otra:
•Si sigue una DISTRIBUCIÓN NORMAL usaremos PEARSON.
•Si NO sigue una DISTRIBUCIÓN NORMAL usaremos por tanto SPEARMAN.
3º Comprobar la normalidad de los datos.•Para ello vamos a emplear dos métodos
diferentes. En este caso ambos para asegurarnos de que nuestras observaciones son correctas:
•A) MÉTODOS GRÁFICOS (histogramas, Box-plot y gráfico QQ).
•B) PRUEBAS DE NORMALIDAD (Siendo el test de Shapiro Wilk el más usado)
a) Métodos gráficos: PESO (En R)GRÁFICO QQ:Seleccionamos la variable peso Y DISTRIBUCIÓN NORMAL.
a) Métodos gráficos:PESOHISTOGRAMA
a) Métodos gráficos: PESO
GRÁFICO BOX-PLOT O DIAGRAMA DE CAJA
a) Métodos gráficos: PESO •Podemos observar que no sigue una distribución normal.
Distribución normal
Distribución del peso
b) Pruebas de normalidad: PESO
No sigue una distribución normal
a) Métodos gráficos: ALTURA
Observamos que tampoco se sigue una distribución normal
b) Pruebas de normalidad: ALTURA
•No sigue una distribución normal.
4º Elegir la prueba en base a lo que hemos observado
•Ninguna de las variables sigue una distribución normal, por tanto es NO PARAMÉTRICA y aplicamos Rho de Spearman.
5º Ver el tipo de relación y cómo de fuerte es:
•Se trata de ver la regresión (tipo de relación entre ambas variables) y la
•Correlación ( si existe una relación fuerte y cómo es).
•Para ello:•A) Estudiamos la linealidad entre las variables.•B) Obtenemos los coeficientes de correlación.
a) Linealidad de las variables:
A partir del diagrama obtenido no podemos determinar que existe relación entre ambas variables, debemos de obtener los datos numéricos
No se aprecia con suficiente claridad, mejor comparar con los resultados
numéricos
b) Coeficientes de correlación
Seleccionar ambas
variables
6º Interpretar los resultados de la prueba
• Los valores se sitúan en torno a -1 y 1. Valores cercanos al -1 nos muestran correlación negativa, los cercanos al 1 positiva; pero los que son igual a 0 no tienen correlación.
• Hay una correlación buena.
0.622