12
Instituto Tecnológico Superior de Misantla Elaborado por: González Cruz Edith Ingeniería Bioquímica 505

Regresión Múltiple y Análisis de Correlación de Los Gastos en Alimentación de Una Familia Con Base en El Ingreso y Su Tamaño

Embed Size (px)

DESCRIPTION

El presente trabajo es el resultado de la aplicación práctica de los temas Regresión Múltiple y Análisis de Correlación. Las variables independientes a estudiar son el Ingreso Mensual (x1) y el Tamaño de la Familia (x2) con las cuales se analiza el efecto que provocan sus gastos de alimentación por mes (y). La selección de este problema es debida a la facilidad de entendimiento por parte del alumno hacia la bibliografía consultada. Se tiene como objetivo determinar la relación que existe entre las variables Ingreso Mensual (x1) y el Tamaño de la Familia (x2) sobre los Gastos de Alimentación por Mes (y) mediante las herramientas adquiridas durante el transcurso de la unidad las cuales nos permitieron obtener datos que hacen referencia a factores como: Coeficientes de Correlación y Determinación Simple, Parcial y Múltiple, obtención de la Ecuación de Regresión, el Error Estándar de Estimación, así como los Análisis de Varianzas para cada variable independiente.

Citation preview

Page 1: Regresión Múltiple y Análisis de Correlación de Los Gastos en Alimentación de Una Familia Con Base en El Ingreso y Su Tamaño

Instituto Tecnológico Superior de Misantla

Elaborado por:González Cruz EdithIngeniería Bioquímica 505

Page 2: Regresión Múltiple y Análisis de Correlación de Los Gastos en Alimentación de Una Familia Con Base en El Ingreso y Su Tamaño

ÍNDICE

INTRODUCCIÓN................................................................................................................................3

REGRESIÓN MÚLTIPLE Y ANÁLISIS DE CORRELACIÓN........................................................4

Coeficientes de Correlación y Determinación Simple.....................................................................4

Coeficientes de Correlación y Determinación Parcial.....................................................................5

Coeficientes de Correlación y Determinación Múltiple...................................................................5

Obtención de la Ecuación de Regresión...........................................................................................6

Error Estándar de Estimación...........................................................................................................6

Análisis de Varianza de la Regresión Múltiple................................................................................7

CONCLUSIÓN....................................................................................................................................8

BIBLIOGRAFÍA..................................................................................................................................9

2 | P á g i n a

Page 3: Regresión Múltiple y Análisis de Correlación de Los Gastos en Alimentación de Una Familia Con Base en El Ingreso y Su Tamaño

INTRODUCCIÓN

El presente trabajo es el resultado de la aplicación práctica de los temas Regresión Múltiple y Análisis de Correlación. Las variables independientes a estudiar son el Ingreso Mensual (x1) y el Tamaño de la Familia (x2) con las cuales se analiza el efecto que provocan sus gastos de alimentación por mes (y). La selección de este problema es debida a la facilidad de entendimiento por parte del alumno hacia la bibliografía consultada. Se tiene como objetivo determinar la relación que existe entre las variables Ingreso Mensual (x1) y el Tamaño de la Familia (x2) sobre los Gastos de Alimentación por Mes (y) mediante las herramientas adquiridas durante el transcurso de la unidad las cuales nos permitieron obtener datos que hacen referencia a factores como: Coeficientes de Correlación y Determinación Simple, Parcial y Múltiple, obtención de la Ecuación de Regresión, el Error Estándar de Estimación, así como los Análisis de Varianzas para cada variable independiente.

El motivo por el cual se realiza este trabajo es con base en los requerimientos académicos que la retícula de Ingeniería Bioquímica para el 5to semestre en el cual se cursa la materia de Estadística, y para la cuarta unidad “Regresión Múltiple y Análisis de Correlación” evalúa con el presente.

3 | P á g i n a

Page 4: Regresión Múltiple y Análisis de Correlación de Los Gastos en Alimentación de Una Familia Con Base en El Ingreso y Su Tamaño

REGRESIÓN MÚLTIPLE Y ANÁLISIS DE CORRELACIÓN

Una agencia desea estimar los gastos en alimentación de una familia con base en el ingreso y su tamaño. Los datos que se encuentran en la tabla representan los gastos de alimentación por mes (y) en miles de dólares, contra el ingreso mensual (x1) y el tamaño de la familia (x2) para 15 familias que se seleccionaron al azar en cierta localidad geográfica (Canavos, 1994).

Regresión Múltiple y Análisis de Correlación de los Gastos de Alimentación de una Familia (y) con base en el Ingreso (x1) y su Tamaño (x2).

Ingreso Mensual (x1)

Tamaño de la Familia (x2)

Gastos de Alimentación en miles de dólares (y)

2.1 3 0.431.1 4 0.310.9 5 0.321.6 4 0.466.2 4 1.252.3 3 0.441.8 6 0.521 5 0.29

8.9 3 1.292.4 2 0.351.2 4 0.354.7 3 0.783.5 2 0.432.9 3 0.471.4 4 0.38

Ʃy=8.07 Ʃx1=42 Ʃx2=55Ʃy2=5.7733 Ʃx1

2=188.08 Ʃx22=219

Ʃx1y=32.063 Ʃx2y=28.96 Ʃx1x2=140.8

Coeficientes de Correlación y Determinación Simple

r y x1=¿0.942459111

El valor anterior significa que existe correlación lineal muy alta entre el ingreso mensual (x1) y los gastos de alimentación por mes de una familia (y).

r2y x1

=¿0.888229177

Este valor nos indica que el ingreso mensual (x1) nos explica el 88.83% de la variabilidad de los gastos de alimentación por mes de una familia (y).

r y x2=−¿0.126468566

4 | P á g i n a

Page 5: Regresión Múltiple y Análisis de Correlación de Los Gastos en Alimentación de Una Familia Con Base en El Ingreso y Su Tamaño

Existe correlación lineal negativa muy baja (no existe) entre el tamaño de una familia (x2) y los gastos de alimentación por mes (y).

r2y x2

=¿0.015994298

Indica que el tamaño de la familia (x2) nos explica el 1.6% de la variabilidad de los gastos de alimentación por mes (y).

r x1 x2=−¿0.377659087

Existe correlación lineal baja entre el ingreso mensual (x1) y el tamaño de la familia (x2).

r2x1 x2

=¿0.142626386

El ingreso mensual (x1) nos explica el 14.26% del tamaño de la familia (x2).

Coeficientes de Correlación y Determinación Parcial

r2y x1 ∙ x2

=¿0.94882111

Significa que el ingreso mensual (x1) y los gastos de alimentación por mes (y) estando fijo el tamaño de la familia (x2), nos logran explicar el 94.88% de la variabilidad de y.

r y x1 ∙ x2=¿0.974074489

Lo anterior nos indica que existe correlación muy alta ente el ingreso mensual (x1) con los gastos de alimentación por mes de una familia (y) estando constante el tamaño de la familia (x2).

r2y x2 ∙ x1

=¿0.54943233

El tamaño de la familia (x2) y los gastos de alimentación por mes (y) estando fijo el ingreso mensual (x1), nos logran explicar el 54.94%.

r y x2∙ x1=¿0.741237027

Existe correlación parcial media alta entre el tamaño de la familia (x2) y los gastos de alimentación (y) por mes estando fijo el ingreso mensual (x1).

Coeficientes de Correlación y Determinación Múltiple

R2y ∙ x1x2

=¿0.94963968

Significa que el ingreso mensual (x1) con el tamaño de la familia (x2) cuando se manejan conjuntamente nos explican el 94.96% de la variabilidad de los gastos de alimentación por mes (y).

R y ∙ x1x2=¿0.974494577

5 | P á g i n a

Page 6: Regresión Múltiple y Análisis de Correlación de Los Gastos en Alimentación de Una Familia Con Base en El Ingreso y Su Tamaño

El cual nos indica que existe correlación media alta entre el ingreso mensual (x1) con el tamaño de la familia (x2) y los gastos de alimentación por mes (y) cuando se manejan conjuntamente.

Obtención de la Ecuación de Regresión

Ŷ= −¿0.160458042 + 0.148727022 b1 + 0.076915194 b2

a= −¿0.160458042 es el punto donde la ecuación que se ajustó a los valores observados corta al eje de la ordenada y en un sistema de coordenadas cartesianas.

b1: Ŷ= −¿0.160458042 + 0.148727022 (2.1) + 0.076915194 (3) = |0.382614286| Ŷ= −¿0.160458042 + 0.148727022 (3.1) + 0.076915194 (3) = |0.531341308| 0.148727022

b1= 0.14872702, cuando se incrementan 1000 dólares adicionales al ingreso mensual (x1) y el tamaño de la familia (x2) es constante, se tiene un gasto de 148 dólares.

b2: Ŷ= −¿0.160458042 + 0.148727022 (2.1) + 0.076915194 (3) = |0.382614286| Ŷ= −¿0.160458042 + 0.148727022 (2.1) + 0.076915194 (4) = |0.459529480| 0.076915194

b2=¿ 0.076915194, significa que por cada integrante adicional de familia (x2) permaneciendo constante el ingreso mensual (x1), se tiene un gasto de 76.9 dólares.

Error Estándar de Estimación

(x1) (x2) (y) Ŷ Y-Ŷ (Y-Ŷ)2

2.1 3 0.43 0.382614288 0.047385712 0.0022454061.1 4 0.31 0.310802459 -0.000802459 6.43941E-070.9 5 0.32 0.357972249 -0.037972249 0.0014418921.6 4 0.46 0.385165971 0.074834029 0.0056001326.2 4 1.25 1.069310275 0.180689725 0.0326487772.3 3 0.44 0.412359692 0.027640308 0.0007639871.8 6 0.52 0.568741764 -0.048741764 0.002375761 5 0.29 0.372844951 -0.082844951 0.006863286

8.9 3 1.29 1.393958043 -0.103958043 0.0108072752.4 2 0.35 0.3503172 -0.0003172 1.00616E-071.2 4 0.35 0.325675162 0.024324838 0.0005916984.7 3 0.78 0.769304547 0.010695453 0.0001143933.5 2 0.43 0.513916926 -0.083916926 0.007042052.9 3 0.47 0.501595906 -0.031595906 0.0009983011.4 4 0.38 0.355420566 0.024579434 0.000604149

Σ 0.072097848

6 | P á g i n a

Page 7: Regresión Múltiple y Análisis de Correlación de Los Gastos en Alimentación de Una Familia Con Base en El Ingreso y Su Tamaño

Sy ∙ x1x2=√ 0.072097848

15−2−1=¿¿0.077512283

Es decir, se tendrá un error de 77. 5 dólares.

Comprobando la suma de las desviaciones al cuadrado:

Ʃ (Y-Ŷ)2=(1−0.94963968 )(5.7733−65.124915 )=¿ 0.072097848

Análisis de Varianza de la Regresión Múltiple

Análisis de Regresión Múltiple de los Gastos de Alimentación por mes (y) considerando el efecto total del Ingreso Mensual (x1) y luego el efecto adicional del Tamaño de la Familia(x2).

Fuente de variación Suma de cuadrados

Grados de libertad

Cuadrado medio F

Total 1.43164 14  Regresión debido a X1 1.271624418 1 1.271624418 103.3094231Desviación de la regresión simple. 0.160015582 13 0.012308891  Regresión adicional debido a X2 0.087917734 1 0.087917734 14.63306931Desviación de la regresión múltiple. 0.072097848 12 0.006008154  

H 0=¿ La variable independiente Ingreso Mensual no influye de manera significativa en los Gastos de Alimentación por Mes.H 1=¿ La variable independiente Ingreso Mensual si influye de manera significativa en los Gastos de Alimentación por Mes.

V1=1v2 α=0.10 α=0.05 α=0.01

13 3.14 4.67 9.07  103.3094231

Conclusión: Podemos apreciar que la P (F=103.0) < 5%, por lo tanto se rechaza la hipótesis H 0 y se acepta H 1, concluyéndose que la variable Ingreso Mensual sí influye de manera significativa en los Gastos de alimentación por Mes.

Análisis de Regresión Múltiple considerando el efecto total del Tamaño de la Familia(x2) y luego el efecto adicional del Ingreso Mensual (x1).

Fuente de variación Suma de cuadrados

Grados de libertad

Cuadrado medio F

Total 1.43164 14  Regresión debido a X2 0.022898077 1 0.022898077 0.211305559Desviación de la regresión simple. 1.408741923 13 0.108364763  Regresión adicional debido a X1 1.336644075 1 1.336644075 222.4716738Desviación de la regresión múltiple. 0.072097848 12 0.006008154  

7 | P á g i n a

Page 8: Regresión Múltiple y Análisis de Correlación de Los Gastos en Alimentación de Una Familia Con Base en El Ingreso y Su Tamaño

H 0=¿ La variable independiente Tamaño de Familia no influye de manera significativa en los Gastos de Alimentación por Mes.H 1=¿ La variable independiente Tamaño de Familia si influye de manera significativa en los Gastos de Alimentación por Mes.

V1=1v2 α=0.10 α=0.05 α=0.0113 3.14 4.67 9.07

0.211305559

Conclusión: Como la P (F=0.211) > 5% se acepta la hipótesis H 0 y se concluye que la variable independiente Tamaño de Familia no influye de manera significativa en los Gastos de alimentación por Mes.

CONCLUSIÓN

En base a la evidencia experimental obtenida durante el desarrollo de este trabajo podemos concluir que se logro el objetivo de comprobar cuanta correlación existe entre las variables independientes Ingreso Mensual (x1) y el Tamaño de la Familia (x2) con los Gastos de Alimentación por Mes de la Familia (y), debido a que por medio de los valores arrojados por los Coeficientes de Correlación y Determinación Múltiple, R2 y R, se obtuvo que tal correlación es igual a 97.45 ya que al trabajar de manera conjunta con estas tres variables se logra explicar el 94.96 % de la variabilidad de los gastos mensuales. Así mismo, resultado de este análisis es la ecuación de regresión la cual describe la relación entre el ingreso mensual, el tamaño de la familia y los gastos de alimentación por mes, siendo la que más se ajusta al comportamiento de éstos, la cual resulta ser una buena herramienta de predicción del comportamiento de la variable dependiente cuando cambian los niveles de cada una de las variables independientes. Reforzando lo ya mencionado sobre la correlación entre las variables en análisis se encuentran las ANOVAS las cuales arrojaron de nueva cuenta cual es la influencia que tienen cada una de las variables independientes con la variable y, siendo la variable x1 la que si influye de manera significativa sobre los Gastos de Alimentación por mes de una Familia mientras que la variable x2 no influye de forma significativa sobre y.

Concluyéndose así, de manera general, que gracias a la aplicación del Análisis de Regresión Múltiple y Correlación se determinó que los ingresos mensuales y el tamaño de la familia si describen el comportamiento de los gastos en alimentación por mes de la misma.

8 | P á g i n a

Page 9: Regresión Múltiple y Análisis de Correlación de Los Gastos en Alimentación de Una Familia Con Base en El Ingreso y Su Tamaño

BIBLIOGRAFÍA

Canavos, C. G. (1994). Probabilidad y Estadística. Aplicaciones y Métodos. (1ra ed.). Ed. McGraw Hill. México. D.F

9 | P á g i n a