COEFICIENTE DE CORRELACIÓN DE PEARSON Y SPEARMAN - DR. ENRIQUE SIERRA

Preview:

Citation preview

Coeficiente de correlación

Coeficiente de correlación de Pearson: Paramétrico Permite medir la correlación o asociación entre dos variables

cuando se trabaja con variables numéricas con distribución normal. Es calculado en función de las varianzas y la covarianza entre ambas

variables

Coeficiente de correlación de Spearman:

No Paramétrico. Es un coeficiente que permite medir la correlación o asociación

entre dos variables cuando las mediciones se realizan en una escala ordinal, o cuando no existe distribución normal.

Se calcula en base a una serie de rangos asignados.

INTERPRETACIÓN

Tanto el coeficiente de correlación de Pearson como el de Spearman, siguen las mismas normas de interpretación:

Solamente toma en cuenta valores entre 1 y -1.

El 0 indica que no existe correlación.

El valor numérico indica la magnitud de la correlación.

El coeficiente de correlación cuantifica la correlación entre dos variables, cuando esta realmente existe.

El hecho de que exista correlación entre las variables no implica que exista causalidad o dependencia entre ellas.

El signo indica la dirección de la correlación.

Los valores cercanos a 1 nos indican una correlación muy buena y los cercanos a cero una correlación mínima o nula.

INTERPRETACIÓN

Tabla 16. Interpretación de los valores de los coeficientes de correlación según el rango de valores

Coeficiente Interpretación

0 Relación nula

0 – 0,2 Relación muy baja

0,2 – 0,4 Relación baja

0,4 – 0,6 Relación moderada

0,6 – 0,8 Relación alta

0,8 - 1 Relación muy alta

1 Relación perfecta

Cuando el signo es positivo refleja una correlación directa.

Mientras mas altos sean los valores de la variable independiente mas altos serán los de la variable dependiente.

Cuando el signo es negativo refleja una correlación inversa.

Mientras más altos sean los valores de la variable independiente mas bajos serán los de la variable dependiente.

Nivel de significancia

Para interpretar el coeficiente de correlación de Pearson y Spearman el valor de p debe ser menor a 0.05

Por ejemplo, si el coeficiente de correlación resultante fuera 0.56,

existiría una correlación moderada y se representaría de la siguiente manera:

Pearson r = 0.56 (p< 0.05).

Spearman rho= 0.56 (p< 0.05)

COEFICIENTE DE CORRELACIÓN DE PEARSON

El coeficiente de correlación de Pearson es un índice que mide el grado de variación entre distintas variables relacionadas linealmente

Esta fórmula representa al coeficiente de correlación de Pearson:

Donde:

σxy = Covarianza de X,Y

σx = Desviación típica de la variable X

σy =Desviación típica de la variable Y

Pasos para obtener el coeficiente de correlación de Pearson con el software SPSS

Analizar – Correlaciones - Bivariadas

Se seleccionan las variables que nos interesa correlacionar y se pasan al cuadro del lado derecho. Selecciona la opción de coeficiente de correlación de Pearson.

Podemos entrar a opciones y seleccionar medias y desviaciones típicas y después continuar.

Obtenemos de esta manera el estadístico descriptico de las variables de nuestro interés.

En el siguiente cuadro podemos ver las correlaciones entre las variables que introdujimos al programa.

INTERPRETACIÓN: °ANL–ANB: 0.425 (p 0.003). Correlación directa moderada °ANL-LSVV: -0.652 (p < 0.001). Correlación inversa alta °ANB-PgBVV:-0.848 (p < 0.001). Correlación inversa muy alta °EDAD-ANB: 0.230 (P 0.134). *En este caso no es posible interpretar la correlación ya que la significancia es mayor a 0.05.

Seleccioné los cuadros seleccionados a color para ejemplificar la interpretación del coeficiente de correlación de Pearson

Gráficos de disperción

Para obtener los gráficos de dispersión de puntos hay que seguir los siguientes pasos:

Gráficos – Cuadros de diálogo antiguos – Dispersión/puntos

Dispersión simple - Definir

Seleccionar las variables de las que nos interesa obtener el gráfico y pasarlas a Eje Y y Eje X – Aceptar.

Gráfico ANL–ANB: r = 0.425 (p 0.003).

Correlación directa moderada

Gráfico ANL-LSVV:

r = -0.652 (p < 0.001). Correlación inversa alta

GráficoANB-PgBVV: r = -0.848 (p < 0.001).

Correlación inversa muy alta

Gráfico EDAD-ANB: r = 0.230 (P 0.134).

*En este caso no es posible interpretar la correlación ya que la

significancia es mayor a 0.05.

Esta fórmula representa al coeficiente de correlación por rangos de Spearman:

Donde:

N = Número de casos

ΣD2 = Sumatoria de la diferencia de los rangos elevada

al cuadrado.

COEFICIENTE DE CORRELACIÓN DE SPEARMAN

Se ordenan todos los casos para cada una de las variables de interés y se les asigna un rango consecutivo.

Si la asociación entre ambas variables fuera perfecta se esperaría que el rango de ambas variables fuera exactamente igual.

El coeficiente de correlación se calcula en base a las diferencias registradas en los rangos entre ambas variables.

Para evitar que las diferencias positivas anulen a las negativas, el estadístico se calcula en función de las diferencias elevadas al cuadrado.

Metodología

Pasos para obtener el coeficiente de correlación de Spearman con el software SPSS

Analizar – Correlaciones - Bivariadas

Se seleccionan las variables que nos interesa correlacionar y se pasan al cuadro del lado derecho - Se selecciona la opción de coeficiente de correlación de Spearman – Aceptar.

En este caso el coeficiente de correlación de Spearman es: rho = 0.579 (p 0.003). Existe una correlación moderada.

El programa realiza la asignación de rangos a las variables y la aplicación de la fórmula de manera automática pero para entender como realiza este proceso lo explicaremos por partes:

Por ejemplo:

Si quiero ver si existe correlación entre la edad de los pacientes en años y el grado de movilidad dentaria si quisiéramos hacerlo paso a paso, esto es lo que tendríamos que realizar:

Asignar un rango a las variables.

Transformar – Asignar rangos a casos.

Añadir al cuadro de variables las variables que nos interesa asignar un rango y aceptar.

Así en la segunda columna podemos ver la edad de los pacientes y en la quinta columna “REDAD” la edad pero con un rango asignado y de igual manera en la tercer columna observamos el grado de movilidad dentaria y en la cuarta columna “RMOVILID” vemos el grado de movilidad pero con un rango asignado

Después de asignar los rangos a las variables se obtiene la diferencia de las variables y después se suman las diferencias y se elevan al cuadrado. Esta sumatoria es la que se introduce en la formula.

Muchas Gracias!!

Recommended