54
Ignacio Cascos Depto. Estadística, Universidad Carlos III 1 Regresión lineal simple Tema 1

regresion lineal simple

Embed Size (px)

Citation preview

Page 1: regresion lineal simple

Depto. Estadística, Universidad Carlos III 1Ignacio Cascos

Regresión lineal simpleTema 1

Page 2: regresion lineal simple

Depto. Estadística, Universidad Carlos III 2Ignacio Cascos

Descripción breve del tema1. Introducción2. El modelo de regresión simple3. Hipótesis del modelo

Linealidad, homogeneidad, homocedasticidad, independencia y normalidad

4. Estimación de los parámetros Mínimos cuadrados, Máxima Verosimilitud

5. Propiedades de los estimadores Coeficientes de regresión, varianza residual

6. Inferencia y predicción7. Diagnosis

Page 3: regresion lineal simple

Depto. Estadística, Universidad Carlos III 3Ignacio Cascos

Objetivos Construcción de modelos de regresión Métodos de estimación para dichos modelos Inferencia acerca de los parámetros Aprendizaje de utilización de gráficos para

detectar el tipo de relación entre dos variables Cuantificación del grado de relación lineal

Page 4: regresion lineal simple

Depto. Estadística, Universidad Carlos III 4Ignacio Cascos

Descripción breve del tema1. Introducción2. El modelo de regresión simple3. Hipótesis del modelo

Linealidad, homogeneidad, homocedasticidad, independencia y normalidad

4. Estimación de los parámetros Mínimos cuadrados, Máxima Verosimilitud

5. Propiedades de los estimadores Coeficientes de regresión, varianza residual

6. Inferencia y predicción7. Diagnosis

Page 5: regresion lineal simple

Depto. Estadística, Universidad Carlos III 5Ignacio Cascos

Introducción Estudio conjunto de dos variables Relación entre las variables Regresión lineal Historia del concepto de regresión lineal

uxy 10

Page 6: regresion lineal simple

Depto. Estadística, Universidad Carlos III 6Ignacio Cascos

Descripción breve del tema1. Introducción2. El modelo de regresión simple3. Hipótesis del modelo

Linealidad, homogeneidad, homocedasticidad, independencia y normalidad

4. Estimación de los parámetros Mínimos cuadrados, Máxima Verosimilitud

5. Propiedades de los estimadores Coeficientes de regresión, varianza residual

6. Inferencia y predicción7. Diagnosis

Page 7: regresion lineal simple

Depto. Estadística, Universidad Carlos III 7Ignacio Cascos

Ejemplo: Pureza del oxígeno en un proceso de destilación

Page 8: regresion lineal simple

Depto. Estadística, Universidad Carlos III 8Ignacio Cascos

Ejemplo: Pureza del oxígeno en un proceso de destilación

Page 9: regresion lineal simple

Depto. Estadística, Universidad Carlos III 9Ignacio Cascos

El modelo de regresión simple n pares de la forma (xi,yi) Objetivo: valores aproximados de Y a partir de X X: variable independiente o explicativa Y: variable dependiente o respuesta (a explicar)

pendiente

intercepto

regresión de escoeficient y

1

0

10

10

iii uxy

Page 10: regresion lineal simple

Depto. Estadística, Universidad Carlos III 10Ignacio Cascos

El modelo de regresión simple

Page 11: regresion lineal simple

Depto. Estadística, Universidad Carlos III 11Ignacio Cascos

Descripción breve del tema1. Introducción2. El modelo de regresión simple3. Hipótesis del modelo

Linealidad, homogeneidad, homocedasticidad, independencia y normalidad

4. Estimación de los parámetros Mínimos cuadrados, Máxima Verosimilitud

5. Propiedades de los estimadores Coeficientes de regresión, varianza residual

6. Inferencia y predicción7. Diagnosis

Page 12: regresion lineal simple

Depto. Estadística, Universidad Carlos III 12Ignacio Cascos

Linealidad: datos con aspecto recto

Plot of Y1 vs X1

0 40 80 120 160 200

X1

0

200

400

600

800

Y1

Plot of Y2 vs X2

0 40 80 120 160 200 240

X2

0

100

200

300

400

500

600

Y2

Page 13: regresion lineal simple

Depto. Estadística, Universidad Carlos III 13Ignacio Cascos

Homogeneidad El valor promedio del error es cero,

0][ iuE

Page 14: regresion lineal simple

Depto. Estadística, Universidad Carlos III 14Ignacio Cascos

Homocedasticidad:Var[ui]=s2 Varianza de errores constante

Page 15: regresion lineal simple

Depto. Estadística, Universidad Carlos III 15Ignacio Cascos

Independencia: Observaciones independientes, en particular E[uiuj]= 0

Page 16: regresion lineal simple

Depto. Estadística, Universidad Carlos III 16Ignacio Cascos

Normalidad: ui~N(0, s2)

Page 17: regresion lineal simple

Depto. Estadística, Universidad Carlos III 17Ignacio Cascos

Descripción breve del tema1. Introducción2. El modelo de regresión simple3. Hipótesis del modelo

Linealidad, homogeneidad, homocedasticidad, independencia y normalidad

4. Estimación de los parámetros Mínimos cuadrados, Máxima Verosimilitud

5. Propiedades de los estimadores Coeficientes de regresión, varianza residual

6. Inferencia y predicción7. Tansformaciones

Page 18: regresion lineal simple

Depto. Estadística, Universidad Carlos III 18Ignacio Cascos

Método de Mínimos Cuadrados

Valor observado Dato (y)

Recta de regresiónestimada

Valor observado Dato (y)

Recta de regresiónestimada

Page 19: regresion lineal simple

Depto. Estadística, Universidad Carlos III 19Ignacio Cascos

Mínimos Cuadrados (Gauss, 1809) Objetivo: Buscar los valores de b0 y b1 que

mejor se ajustan a nuestros datos. Ecuación:

Residuo:

Minimizar:

iiiii xyyye 10ˆˆˆ

n

iie

1

2

ii xy 10ˆˆˆ

Page 20: regresion lineal simple

Depto. Estadística, Universidad Carlos III 20Ignacio Cascos

Mínimos Cuadrados (Gauss, 1809) Resultado:

xS

Sy

X

YX2,

xxyy ii 1ˆˆ

2,

X

YX

S

S

Page 21: regresion lineal simple

Depto. Estadística, Universidad Carlos III 21Ignacio Cascos

Ajuste regresión simple:Datos pureza oxígeno

Page 22: regresion lineal simple

Depto. Estadística, Universidad Carlos III 22Ignacio Cascos

Ajuste regresión simple:Datos pureza oxígeno

xy

xyS

S

SS

yxn

x

xy

xyx

95142874

287419619514169295146810

17710

177106810

20

1021

2

..ˆ

..).(.ˆˆ ..

. .

92.16 1.196

Page 23: regresion lineal simple

Depto. Estadística, Universidad Carlos III 23Ignacio Cascos

Ajuste regresión simple:Datos pureza oxígeno

xy 95142874 ..ˆ

Page 24: regresion lineal simple

Depto. Estadística, Universidad Carlos III 24Ignacio Cascos

Ajuste regresión simple:Datos pureza oxígeno

0

Page 25: regresion lineal simple

Depto. Estadística, Universidad Carlos III 25Ignacio Cascos

Ajuste regresión simple:Datos pureza oxígeno

1

Page 26: regresion lineal simple

Depto. Estadística, Universidad Carlos III 26Ignacio Cascos

Método de Máxima Verosimilitud Mismo resultado. Estimación de la varianza:

INSESGADO 2

ˆ Residual Varianza

insesgado no EMV ˆ

22

22

n

eS

n

e

iR

i

Page 27: regresion lineal simple

Depto. Estadística, Universidad Carlos III 27Ignacio Cascos

Ajuste regresión simple:Datos pureza oxígeno

2RS

Page 28: regresion lineal simple

Depto. Estadística, Universidad Carlos III 28Ignacio Cascos

Descripción breve del tema1. Introducción2. El modelo de regresión simple3. Hipótesis del modelo

Linealidad, homogeneidad, homocedasticidad, independencia y normalidad

4. Estimación de los parámetros Mínimos cuadrados, Máxima Verosimilitud

5. Propiedades de los estimadores Coeficientes de regresión, varianza residual

6. Inferencia y predicción7. Diagnosis

Page 29: regresion lineal simple

Depto. Estadística, Universidad Carlos III 29Ignacio Cascos

Props. de los coeficientes de regresiónNormalidad

iiix

i ywynS

xx21

)( Combinación lineal de normales

),(~ 20 iii xNy

Estimador centrado

121

ix

i yEnS

xxE

)(ˆ

Varianza del estimador

2

22

21

xi

x

i

nSyVar

nS

xxVar

)(ˆ

2

2

11

xnSN

,~ˆ

Page 30: regresion lineal simple

Depto. Estadística, Universidad Carlos III 30Ignacio Cascos

Props. de los coeficientes de regresiónNormalidad

ii ywxn

xy1

10 ˆˆ Combinación lineal de normales

),(~ 20 iii xNy

Estimador centrado

00

1

ii yEwxn

E ˆ

Varianza del estimador

2

222

0 11

xii

S

x

nyVarwx

nVar

2

22

00 1xS

x

nN

,~ˆ

Page 31: regresion lineal simple

Depto. Estadística, Universidad Carlos III 31Ignacio Cascos

Descripción breve del tema1. Introducción2. El modelo de regresión simple3. Hipótesis del modelo

Linealidad, homogeneidad, homocedasticidad, independencia y normalidad

4. Estimación de los parámetros Mínimos cuadrados, Máxima Verosimilitud

5. Propiedades de los estimadores Coeficientes de regresión, varianza residual

6. Inferencia y predicción7. Diagnosis

Page 32: regresion lineal simple

Depto. Estadística, Universidad Carlos III 32Ignacio Cascos

Inferencia respecto a los parámetros IC

2

ˆ ˆEn general, si ~ , ( ) un I.C. para :

ˆ ˆ ( )

N Var

z Var

2 20

1

ˆˆ ( / 2, 2) 1 /

ˆˆ ( / 2, 2)

Rx

R

x

St n x S

n

St n

S n

2

1 1 2

2 2

0 0 2

ˆ ~ ,

ˆ ~ , 1

x

x

NnS

xN

n S

2ˆDesconocida RS

Page 33: regresion lineal simple

Depto. Estadística, Universidad Carlos III 33Ignacio Cascos

Inferencia respecto a los parámetrosContraste de Hipótesis

0 0 1 0

0 2 2

0 1 1 1

1

: 0 : 0

ˆ ˆ 1 /

: 0 : 0

ˆ

ˆ

R x

x

R

H H

nt

S x S

H H

S nt

S

( / 2, 2)t n

Page 34: regresion lineal simple

Depto. Estadística, Universidad Carlos III 34Ignacio Cascos

Ajuste regresión simple: pureza

oxígeno

0 1ˆ ˆ y

significativos

Page 35: regresion lineal simple

Depto. Estadística, Universidad Carlos III 35Ignacio Cascos

Descomposición de la variabilidad La variabilidad del modelo satisface: VT =VE+VNE

Contraste de regresión

n

ii

n

iii

n

ii

n

ii

eyy

yy

yy

1

2

1

2

1

2

1

2

)ˆ(Explicada No adVariabilidVNE

)ˆ(Explicada adVariabilidVE

)(Total adVariabilidVT

2,11 ~2VNE

VE entonces 0, Si

nFn

Page 36: regresion lineal simple

Depto. Estadística, Universidad Carlos III 36Ignacio Cascos

Ajuste regresión simple: pureza

oxígeno

VE

Page 37: regresion lineal simple

Depto. Estadística, Universidad Carlos III 37Ignacio Cascos

Ajuste regresión simple: pureza

oxígeno

VNE

Page 38: regresion lineal simple

Depto. Estadística, Universidad Carlos III 38Ignacio Cascos

Coeficiente de determinación

22

2,

21

2

1

2

1

2

2

)ˆ(

)(

)ˆ(

VT

VE

YX

YX

Y

n

ii

n

ii

n

ii

SS

S

nS

yy

yy

yyR

Page 39: regresion lineal simple

Depto. Estadística, Universidad Carlos III 39Ignacio Cascos

Predicción Dos tipos de predicción: Predecir un valor promedio de y para cierto

valor de x. Predecir futuros valores de la variable

respuesta.La predicción es la misma (a partir de la recta de regresión) pero la precisión de los estimadores es diferente.

Page 40: regresion lineal simple

Depto. Estadística, Universidad Carlos III 40Ignacio Cascos

Predicción (promedio)

2

202

12

00

010

)(1

)ˆ()()()ˆ(

)(ˆˆ

XnS

xx

n

VarxxyVaryVar

xxyy

2

20

2/,20

)(1ˆˆX

Rn nS

xx

nSty

Intervalo de confianza para la media estimada

Estimación de la media de la distribución condicionada de y para x=x0:

Page 41: regresion lineal simple

Depto. Estadística, Universidad Carlos III 41Ignacio Cascos

Ajuste regresión simple: pureza

oxígeno

,x y

La anchura del intervaloaumenta cuando aumenta

hx x

Page 42: regresion lineal simple

Depto. Estadística, Universidad Carlos III 42Ignacio Cascos

Predicción para futuros valores

2

20

2/,20

)(11ˆˆ

XRn nS

xx

nSty

Intervalo de predicción

Page 43: regresion lineal simple

Depto. Estadística, Universidad Carlos III 43Ignacio Cascos

Ajuste regresión simple: pureza

oxígeno

Page 44: regresion lineal simple

Depto. Estadística, Universidad Carlos III 44Ignacio Cascos

Descripción breve del tema1. Introducción2. El modelo de regresión simple3. Hipótesis del modelo

Linealidad, homogeneidad, homocedasticidad, independencia y normalidad

4. Estimación de los parámetros Mínimos cuadrados, Máxima Verosimilitud

5. Propiedades de los estimadores Coeficientes de regresión, varianza residual

6. Inferencia y predicción7. Diagnosis

Page 45: regresion lineal simple

Depto. Estadística, Universidad Carlos III 45Ignacio Cascos

DiagnosisUna vez ajustado el modelo, hay que comprobar

si se cumplen las hipótesis iniciales. Gráficos de residuos frente a valores

previstos. Si las hipótesis iniciales se satisfacen, este

gráfico no debe tener estructura alguna.

Page 46: regresion lineal simple

Depto. Estadística, Universidad Carlos III 46Ignacio Cascos

Ajuste regresión simple:Datos pureza oxígeno

Page 47: regresion lineal simple

Depto. Estadística, Universidad Carlos III 47Ignacio Cascos

Relaciones no lineales

Gráficos de residuos

Page 48: regresion lineal simple

Depto. Estadística, Universidad Carlos III 48Ignacio Cascos

LinealidadSoluciones a la falta de linealidad: Transformar las variables para intentar

conseguir linealidad. Introducir variable adicionales. Detectar la presencia de datos atípicos o

ausencia de otras variables importantes para explicar la variable respuesta.

Page 49: regresion lineal simple

Depto. Estadística, Universidad Carlos III 49Ignacio Cascos

Homocedasticidad

.

y

Cuando la varianza de las perturbaciones es muy diferente para unos valores de la variable explicativa que para otros tenemos heterocedasticidad

e

Page 50: regresion lineal simple

Depto. Estadística, Universidad Carlos III 50Ignacio Cascos

HomocedasticidadSoluciones a la heterocedasticidad: Si la variabilidad de la respuesta aumenta con x según la ecuación Var(y|x) = g(x), dividimos la ecuación de regresión (y) entre g(x).

Transformar la variable respuesta y puede que también x.

Si lo anterior no funciona, cambiar el método de estimación.

Page 51: regresion lineal simple

Depto. Estadística, Universidad Carlos III 51Ignacio Cascos

NormalidadLa falta de normalidad invalida resultados inferenciales.

Comprobación mediante histogramas o gráficos probabilísticos.

En un gráfico probabilístico comparamos los residuos ordenados con los cuantiles de la distribución Normal estándar.

Si la distribución de los residuos es normal, el gráfico ha de mostrar aproximadamente una recta.

Page 52: regresion lineal simple

Depto. Estadística, Universidad Carlos III 52Ignacio Cascos

Normalidad

Page 53: regresion lineal simple

Depto. Estadística, Universidad Carlos III 53Ignacio Cascos

Independencia y Datos influyentesIndependencia Conviene hacer una gráfica de residuos frente

a tiempo (residuos incorrelados).

Datos influyentes Analizar la presencia de datos influyentes.

Los atípicos son datos muy grandes o muy pequeños. Estudiar su posible eliminación.

Page 54: regresion lineal simple

Depto. Estadística, Universidad Carlos III 54Ignacio Cascos

Transformaciones

Forma funcional que relaciona y con x

Transformación apropiada

Exponencial: y = aexp{bx}Potencia: y = axb

Recíproca: y = a+b/xHiperbólica: y = x/(a+bx)

y’ = lnyy’ = lny , x’ = lnxx’ = 1/xy’ = 1/y , x’ = 1/x