16
M.Sc. J. FELIX ZULOETA SALAZAR 1 J. Felix Zuloeta Salazar

Teoría de regresión y correlación lineal

Embed Size (px)

Citation preview

Page 1: Teoría de regresión y correlación lineal

M.Sc. J. FELIX ZULOETA SALAZAR

1J. Felix Zuloeta Salazar

Page 2: Teoría de regresión y correlación lineal

REGRESIÓN LINEAL

• Es la técnica matemático – estadística que analiza ladependencia entre dos o más variables.

• Observa si las variaciones de una característicaprovocan variaciones en la magnitud de otracaracterística.

• Es la función matemática que, para un valor dadode una variable, da el valor esperado de una

característica, con la cual está ligada.2J. Felix Zuloeta Salazar

Page 3: Teoría de regresión y correlación lineal

EJEMPLOS• El precio de venta (VD; Y) depende del precio de costo de un artículo (VI;

X).

• El costo total (VD; Y) depende de la producción total (VD; X).

• El tiempo de servicios (VD; Y) de un trabajador depende de su edad (VD;X).

• El consumo familiar (VD; Y) está en función del ingreso familiar VD; X).

Donde:

VD; Y = variable dependiente, predictando, explicativa.

VI; X = variable independiente; predictor, explicativa.

Esta relación se expresa: Y = f(X), “Y depende de X”3J. Felix Zuloeta Salazar

Page 4: Teoría de regresión y correlación lineal

DIAGRAMA DE DISPERSIÓN O NUBE DE PUNTOS

••••

•••

•• •

• •

• •

•• •••

••

••

••

• •••

• •

••

••

••

•• •

•• •

•• ••••

•••

•••

(a) Lineal directa (b) Lineal inversa (c) Curvilínea directa

(d) Curvilínea inversa (e) Lineal inversacon más dispersión

(d) Ninguna relación

Y

X

Y

X

Y

X

Y

X

Y

X

Y

X

4J. Felix Zuloeta Salazar

Page 5: Teoría de regresión y correlación lineal

MÉTODO DE LOS MÍNIMOS CUADRADOSRECTA DE LOS MÍNIMOS CUADRADOS:

Si el diagrama de dispersión muestra que los puntos se disponen

siguiendo el lugar geométrico de una recta:

Donde:

X = Variable independiente (estímulo, de influencia, causa).

Y = Variable dependiente (respuesta, criterio, efecto).Ŷ

b0 = Coeficiente autónomo (cantidad media).

b1 = Coeficiente de regresión (pendiente, proporción de cambio).

El modelo de estimación matemática, permite predecir, que valor asume

probablemente Y, cuando la variable X toma un valor determinado,

entonces la ecuación de estimación estará definida por:

, donde Ŷ es un Y estimado, esperado o calculado.

i 0 1 iY = b + b X

i 0 1 i= b + b XY

5J. Felix Zuloeta Salazar

Page 6: Teoría de regresión y correlación lineal

d1 = Y1 - Ŷ1

P1 (X1; Y1)

P1 (X1; Ŷ 1)

X1 X2

Y2

Ŷ 2

Y1

Ŷ 2

P1 (X2; Ŷ 2)

P1 (X2; Y2)

d2 = Y2 - Ŷ2

Ŷ = b0 +b1

0

6J. Felix Zuloeta Salazar

Page 7: Teoría de regresión y correlación lineal

CONDICIONES DEL MÉTODO

1. di = ei = (Yi – Ŷi) = dispersión o error.

2. Σdi = Σei = Σ (Yi – Ŷi) = 0

3.

4. Para estimar los coeficientes b0 y b1, en la expresión

sustituimos Ŷi = b0 + b1Xi; obteniendo Σ (Yi – b0 – b1 Xi)2; diferenciando

parcialmente con respecto al intercepto b0 y a la pendiente b1 e igualando a

cero se obtienen las ECUACIONES NORMALES:

De su solución se obtienen los parámetros b0 y b1

2ii(Y - )

0 1

2

0 1

Y = n b +b X

XY = b X+ b X

2

0 2 2

1 2 2

X Y - X XYb =

n X - ( X)

n XY - X Yb

n X - ( X)

2

0 2 2

1 2 2

X Y - X XYb =

n X - ( X)

n XY - X Yb

n X - ( X)

Y

Y

7J. Felix Zuloeta Salazar

Page 8: Teoría de regresión y correlación lineal

APLICACIÓN• A continuación se muestran los datos observados correspondiente a la

función costo total (C = Yi) medida en millones de soles, con respecto a la

producción total (Q = Xi) medida en miles de soles.

PRODUCCIÓN (Xi) COSTO TOTAL (Yi)

10 30

20 36

30 40

40 48

50 54

60 58

70 66

80 68

8J. Felix Zuloeta Salazar

Page 9: Teoría de regresión y correlación lineal

1. DIAGRAMA DE DISPERSIÓN

REGRESIÓN LINEAL ENTRE LA PRODUCCIÓN

TOTAL Y EL COSTO TOTAL

0

10

20

30

40

50

60

70

80

0 20 40 60 80 100

PRODUCCIÓN

COST

O T

OTA

L

9J. Felix Zuloeta Salazar

Page 10: Teoría de regresión y correlación lineal

2.CÁLCULO DE LOS PARÁMETROS b0 y b1

PRODUCCIÓN (X) COSTO (Y) X2 Y2 XY

10 30 100 900 300

20 36 400 1296 720

30 40 900 1600 1200

40 48 1600 2304 1920

50 54 2500 2916 2700

60 58 3600 2916 3240

70 66 4900 4356 4620

80 68 6400 4624 5440

ΣX ΣY ΣX2 ΣY2 ΣXY

360 400 20400 21360 20380

POR FAVOR CALCULE USTED b0 y b110J. Felix Zuloeta Salazar

Page 11: Teoría de regresión y correlación lineal

3. PLANTEAR LA ECUACIÓN DE ESTIMACIÓN DE REGRESIÓN

LINEAL

Ŷi = 24,5 + 0,5666667Xi

COSTO TOTAL ESTIMADO = 24,5 + 0,5666667 * PRODUCCIÓN TOTAL

4. INTERPRETAR b0.

Por cada mil unidades que se incremente la producción, el costo

total se incrementará en 566 666,67 soles.

5. ESTIMAR O PREDECIR CUÁNTO SERÁ EL COSTO TOTAL SI SE

QUIERE PRODUCIR 85 000 ARTÍCULOS.

Ŷi = 24,5 + 0,5666667 * 85

Ŷi = 72,66666667 * 1 000 000

Ŷi = 72 666 666,95 SOLES.

i 0 1 i= b + b XY

11J. Felix Zuloeta Salazar

Page 12: Teoría de regresión y correlación lineal

6. GRAFICAR LA RECTA DE REGRESIÓN LINEAL ESTIMADA

REGRESIÓN LINEAL ENTRE LA PRODUCCIÓN

TOTAL Y EL COSTO TOTAL

y = 0,5667x + 24,5

0

10

20

30

40

50

60

70

80

0 20 40 60 80 100

PRODUCCIÓN

CO

ST

O T

OT

AL

12J. Felix Zuloeta Salazar

Page 13: Teoría de regresión y correlación lineal

13J. Felix Zuloeta Salazar

Page 14: Teoría de regresión y correlación lineal

El análisis de correlación es la técnica estadística que permite describir el

grado hasta el cual una variable está linealmente relacionada o asociada

con otra.

El coeficiente de correlación (r) mide el grado de afinidad o asociación entre

dos variables.

Coeficiente de Pearson:

Coeficiente de Determinación: CD = r2 * 100

Propiedades de r: -1 ≤ r ≤ +1

a) Si r > 0, existe “correlación directa positiva”.

b) Si r < 0, existe una “correlación inversa negativa”.

c) Si r2 = 1, los datos forman una línea recta.

d) Si r = +1, entonce hay una correlación perfecta positiva.

e) Si r = -1, Existe una correlación perfecta negativa.

f) Si r = 0, las variables son independientes; no están correlacionadas.

2 2 2 2

n XY - X Yr =

[n X - ( X) ] [n Y - ( Y) ]

14J. Felix Zuloeta Salazar

Page 15: Teoría de regresión y correlación lineal

GRADO DE ASOCIACIÓN O INTERRELACIÓN

COEFICIENTE r GRADO DE ASOCIACIÓN

0,0 ± 0,2 NULA

± 0,2 ± 0,4 POCA SIGNIFICATIVA

±0,4 ± 0,7 SIGNIFICATIVA

± 0,7 ± 0,9BASTANTE

SIGNIFICATIVA

± 0,9 ± 1,0 MUY SIGNIFICATIVA

15J. Felix Zuloeta Salazar

Page 16: Teoría de regresión y correlación lineal

APLICACIÓN

Calcule el coeficiente de correlación y el coeficiente

de determinación del ejemplo anterior e interprete.

r = 0,9958246

Interpretación: Entre la producción total y el costo

total existe una correlación o grado de asociación

muy significativa, es decir se acepta que el costo

total esta influenciado por la producción total.

CD =99,17%

Interpretación: El 99,17% de la variación del costo es

explicada por la variación en la producción.

16J. Felix Zuloeta Salazar