Regresión múltipleMétodos
Tabachnick, B. G., Fidell, L. S., & Osterlind, S. J. (2001). Using multivariate statistics. Boston MA: Allyn & Bacon.
Miles, J., & Shevlin, M. (2011). Applying regression and correlation: A guide for students and researchers. Los Angeles CA: Sage.
Nazira Calleja
Propósito de la regresión múltiple
La regresión estadística se usa comúnmente
para:
desarrollar un subconjunto de VIs que
predigan la VD, y
eliminar las VIs que no proporcionen una
predicción adicional respecto de las VIs
que ya están en la ecuación.
Propósito de la regresión múltiple
Se trata de encontrar el modelo más parsimonioso:
MÁS R2 CON MENOS VIs
Existen estrategias que permiten determinar la
utilidad de cada VI.
Para ello utilizan:
criterios de teoría psicológica, o
criterios estadísticos.
Estrategias analíticas
1. Regresión múltiple estándar
2. Regresión secuencial (jerárquica)
3. Regresión estadística (paso a paso / stepwise)
La elección depende de:
a) El traslapamiento de la variabilidad debido a las
correlaciones entre las VI con la VD
b) Quién determina el orden de entrada de las variables
en la ecuación
a
VD
VI1
cVD VI2
e
VD
VI3
b
d
VD
VI1
VI2
VI3
a
b
c
e
d
VD
VI1
VI2
VI3
a
b
c
e
d
VD
VI1
VI2
VI3
r VI1 – VD:
alta
r VI2 – VD:
alta
r VI3 – VD:
media
r VI1 – VI2 :
alta
r VI1 – VI3 :
nula
r VI2 – VI3 :
baja
a → VI1
b → VI1 y VI2
Traslape
c → VI2
d → VI2 y VI3
Traslape
e → VI3
R2 = a + b + c + d + e
1. REGRESIÓN MÚLTIPLEESTÁNDAR
Regresión múltiple estándar
Modelo estándar o simultáneo
Todas las VI entran en la ecuación al mismo
tiempo:
cada una se evalúa como si hubiera entrado a
la regresión después de que entraran todas
las demás.
Cada VI se evalúa en términos de lo que
agrega a la predicción de la VD, que es
diferente a la predictibilidad lograda por todas
la otras VIs.
a
c
e
VD
VI1
VI2
VI3
Para cada VI se asigna sólo el área de su contribución única.
Las áreas de traslape no se asignan a ninguna VI.
La VI2 podría aparecer como sin importancia, aunque su r con la VD es alta, por su baja contribución única.
Por tanto, en la interpretación deben considerarse tanto la correlación como la contribución única.
SPSS: Método Introducir
Regresión múltiple estándar
2. REGRESIÓN MÚLTIPLESECUENCIAL O JERÁRQUICA
Regresión múltiple secuencial
Regresión secuencial o jerárquica
Las VIs entran a la ecuación en el orden
especificado por el investigador con criterios
teóricos.
Cada VI se evalúa en términos de lo que
agrega a la ecuación en su propio punto de
entrada.
a
c
e
VD
VI1
VI2
VI3
b
Regresión múltiple secuencial
Supóngase que el investigador asigna, de acuerdo con consideraciones teóricas y lógicas:a VI1 la 1ª entrada, a VI2 la 2ª entrada ya VI3 la 3ª entrada.
VI1“se queda con” a y b,VI2 “se queda con” c y d, y VI3 “se queda con” e.
A cada VI se le asigna la variabilidad, tanto única como de traslape, como su propio punto de entrada.
SPSS: Método Introducir, uno para cada modelo.
d
Regresión múltiple secuencial
Una vez obtenidos los análisis de regresión para los dos modelos, se comparan los valores de R2. Para ello, se efectúa una prueba de significancia (F) a fin de determinan si el incremento es estadísticamente significativo.
El valor de F obtenido se compara contra los valores
críticos de tablas.
Regresión múltiple secuencial
: Para el modelo más grande
: Para el modelo más pequeño
: Número de VIs para el modelo más pequeño: Número de VIs para el modelo más pequeño
3. REGRESIÓN ESTADÍSTICAO PASO POR PASO
Regresión estadística
Regresión estadística o paso por paso
(stepwise)
El orden de entrada de las VIs (cuáles son
incluidas y cuáles excluidas de la ecuación) se
da con base en criterios estadísticos.
Diferencias mínimas en las estadísticas
pueden tener profundos efectos en la
importancia aparente de una VI.
a
c
e
VD
VI1
VI2
VI3
b
Regresión estadísticaLa elección entre la VI1 y la VI2
se basa en cuál tiene la r total más alta (con décimas o centésimas) con la VD.
Si la VI1 tuviera la mayor r con la VD: entra en el 1er. paso y “se queda con” a y b.En el 2º paso, se comparan VI2 y VI3;VI2 tiene c y d disponibles para agregar a la predicción, y VI3 tiene d y e. Como VI3 contribuye más fuertemente a la R2 y entra a la ecuación.En el 3er. paso, VI2 se evalúa para determinar si el área restante, c, contribuye significativamente a R2. Si no, no entra.
SPSS: 3 métodos: hacia adelante, hacia atrás o paso a paso.
d
Regresión estadísticaTres métodos:
Regresión selección hacia adelante
La ecuación inicia vacía y las VIs se van incorporando una por una, siempre y cuando alcancen el criterio estadístico para entrar. Se recomienda usar un criterio más liberal de p (.15-.20) para los predictores.
Regresión eliminación hacia atrás
La ecuación inicia con todas las VIs incorporadas, y se van eliminando una por una si no contribuyen significativamente a la regresión.
Regresión paso por paso
Combina los dos procedimientos: la ecuación inicia vacía y las VIs se incorporan una por una, pero pueden ser eliminadas en cualquier paso si no contribuyen significativamente a la regresión.
Regresión estadísticaProblemas:
Produce valores de R2 falsamente altos
Rastrea un número de VIs potencialmente grande y selecciona
las que son predictores significativos. Algunas de ellas
resultarán significativas al azar y cada una el valor de R2.
La R2 ajustada no compensa este efecto porque no toma en
cuenta cuántas estaban potencialmente en el modelo y fueron
rechazadas.
Regresión estadística
Problemas:
Los valores de significancia tanto de la R2 como de
las betas individuales son incorrectos.
Debido a que el cálculo de los valores de p depende del
número de variables que se están evaluando, quitar una
variable del análisis alterará los valores de p.
Regresión estadísticaProblemas:
Carece de solidez teórica
Se dará un avance en las ciencias conductuales cuando los investigadores, armados con teorías, proporcionen hipótesis causales derivadas de un orden teórico, no cuando las computadoras ordenen a posteriori las VIs y las ajusten a una muestra determinada (Cohen, Cohen, West y Aiken, 2013).
Además, es probable que los mismos investigadores que recolectan los mismos datos de la misma población no encuentren los mismos resultados con el método step wise.
Cohen, J., Cohen, P., West, S. G., & Aiken, L. S. (2013). Applied multiple regression/correlation analysis for the behavioral sciences. Mahwah, N. J.: Erlbaum.