22
MODELOS DE PRONOSTICOS Primer semestre 2010 Modelo de Regresión con dos variables

MODELOS DE PRONOSTICOS Primer semestre 2010 Modelo de Regresión con dos variables

Embed Size (px)

Citation preview

Page 1: MODELOS DE PRONOSTICOS Primer semestre 2010 Modelo de Regresión con dos variables

MODELOS DE PRONOSTICOS

Primer semestre 2010

Modelo de Regresión con dos variables

Page 2: MODELOS DE PRONOSTICOS Primer semestre 2010 Modelo de Regresión con dos variables

En la práctica es frecuente encontrar una relación entre 2 variables.

Por ejemplo, el consumo (o gasto) de una familia y su ingreso.

O el salario de una persona y los años de instrucción.

Se dice que una variable depende de la otra.

Introducción

Page 3: MODELOS DE PRONOSTICOS Primer semestre 2010 Modelo de Regresión con dos variables

Introducción

Por ejemplo, el consumo (o gasto) de una familia va a depender de su ingreso.

El salario de una persona depende de los años de instrucción.

Debido a esto a una se le llama variable dependiente y a la otra variable independiente.

Page 4: MODELOS DE PRONOSTICOS Primer semestre 2010 Modelo de Regresión con dos variables

Análisis de regresión

La variable dependiente es la variable que se desea explicar o predecir y se le designa por Y.

La variable independiente es la variable explicativa y se designa por X.

El análisis de regresión se relaciona con la estimación y/o predicción de la media (poblacional) o valor promedio de la variable dependiente, con base en los valores conocidos o fijos de la variable explicativa.

Page 5: MODELOS DE PRONOSTICOS Primer semestre 2010 Modelo de Regresión con dos variables

Análisis de regresión

Ejemplo: Los datos siguientes se refieren a una población total de 60 familias de una comunidad hipotética, así como a su ingreso semanal (X) y a su gasto de consumo semanal (Y) en dólares.

Las 60 familias se dividen en 10 grupos de ingresos (de $80 a $260).

Luego, se tienen 10 valores fijos de X y los correspondientes valores Y para cada uno de los valores X, así que hay 10 subpoblaciones Y.

Page 6: MODELOS DE PRONOSTICOS Primer semestre 2010 Modelo de Regresión con dos variables

Análisis de regresión

Page 7: MODELOS DE PRONOSTICOS Primer semestre 2010 Modelo de Regresión con dos variables

Análisis de regresión Se observa una variación considerable en el

gasto de consumo semanal para cada uno de los grupos de ingreso.

Sin embargo, a pesar de la variabilidad del gasto de consumo semanal para cada ingreso considerado en promedio el consumo semanal se incrementa en la misma medida que el ingreso.

Como se ve en la figura siguiente.

Page 8: MODELOS DE PRONOSTICOS Primer semestre 2010 Modelo de Regresión con dos variables

Análisis de regresión

Page 9: MODELOS DE PRONOSTICOS Primer semestre 2010 Modelo de Regresión con dos variables

Análisis de regresión A estos valores medios los conocemos como

valores esperados condicionales, ya que dependen de los valores dados a la variable (condicional) X.

Se denotarán E(Y/X) lo cual se lee como el valor esperado de Y dado el valor de X.

Se deben distinguir dichos valores condicionales esperados del valor esperado incondicional del gasto de consumo semanal E(Y) que se obtiene sumando los gastos de consumo semanales de las 60 familias dividido por 60.

Page 10: MODELOS DE PRONOSTICOS Primer semestre 2010 Modelo de Regresión con dos variables

Análisis de regresión Al unir los valores de las medias condicionales se

obtiene lo que se conoce como la recta de regresión poblacional o de una manera más general la curva de regresión poblacional.

Con palabras más sencillas es la regresión de Y sobre X.

La figura siguiente muestra que para cada X (el nivel de ingresos) existe una población de valores Y (gastos de consumo semanal) que se dispersan alrededor de la media (condicional) de dichos valores Y.

Page 11: MODELOS DE PRONOSTICOS Primer semestre 2010 Modelo de Regresión con dos variables

Análisis de regresión

Page 12: MODELOS DE PRONOSTICOS Primer semestre 2010 Modelo de Regresión con dos variables

Análisis de regresión

Por simplicidad, se supone que tales valores Y están distribuidos simétricamente alrededor de sus respectivos valores medios (condicionales).

Es claro que la media condicional E(Y/Xi) es función de Xi

Como una primera aproximación supondremos que es lineal (función de regresión poblacional lineal)

ii XXYE 21)/(

)()/( ii XfXYE

f

Page 13: MODELOS DE PRONOSTICOS Primer semestre 2010 Modelo de Regresión con dos variables

Análisis de regresión

Donde y son parámetros no conocidos pero fijos que se denominan coeficientes de regresión.

Es claro que a medida que el ingreso familiar aumenta en promedio el consumo familiar también aumenta.

Pero para una familia individual esto no es necesariamente cierto.

21

iii uXY 21 iii uXYEY )/(

Page 14: MODELOS DE PRONOSTICOS Primer semestre 2010 Modelo de Regresión con dos variables

Análisis de regresión

Donde es el término de error estocástico o perturbación estocástica.

Representa todas las variables ignoradas que puedan afectar a Y pero que no están incluidas en el modelo de regresión.

Por motivos de vaguedad de teoría, no disponibilidad de información de las variables, por consideraciones de costo, por aleatoriedad intrínseca del comportamiento humano, por ppio. de parsimonia (modelo más sencillo posible), etc.

Se espera que el efecto combinado pueda ser tratado como una variable aleatoria.

iu

Page 15: MODELOS DE PRONOSTICOS Primer semestre 2010 Modelo de Regresión con dos variables

Análisis de regresión

Luego, el gasto de una familia individual tiene 2 componentes:

1. Un componente determinístico o sistemático

2. Un componente aleatorio o no sistemático

)/( iXYE

iu

Page 16: MODELOS DE PRONOSTICOS Primer semestre 2010 Modelo de Regresión con dos variables

Análisis de regresión

Así, el supuesto de que la recta de regresión pasa a través de las medias condicionales de Y implica que las medias condicionales de son cero.

Luego, si

iu

iii uXYEY )/(

)/()/()/( iiiii XuEXYEEXYE

0)/()/()/()/( iiiiiii XuEXuEXYEXYE

ii XXYE 21)/( iii uXY 21

0)/( ii XuE

Page 17: MODELOS DE PRONOSTICOS Primer semestre 2010 Modelo de Regresión con dos variables

Análisis de regresión En la práctica se tiene una muestra de valores de Y

que corresponden a algunos valores fijos de X.

El problema es estimar la función de regresión poblacional con base en información muestral.

Supóngase que se tiene una muestra de valores de Y seleccionados aleatoriamente para valores dados de X.

Ahora se tiene un solo valor de Y correspondiente a los valores de X.

Cada Y es seleccionada aleatoriamente de Y “similares” correspondiente a las mismas X.

Page 18: MODELOS DE PRONOSTICOS Primer semestre 2010 Modelo de Regresión con dos variables

Análisis de regresión ¿Se puede estimar la forma

de la FRP a partir de la información muestral?

La precisión varía respecto a las fluctuaciones muestrales.

Y X

70 80

65 100

90 120

95 140

110 160

115 180

120 200

140 220

155 240

150 260

Esto se aprecia considerando otra muestra de la población estudiada

Y X

55 80

88 100

90 120

80 140

118 160

120 180

145 200

135 220

145 240

175 260

Page 19: MODELOS DE PRONOSTICOS Primer semestre 2010 Modelo de Regresión con dos variables

Análisis de regresión

Revisando las rectas de regresión para cada muestra, cabe la pregunta cual es la verdadera, y evidente habrá N rectas de regresión para N muestras distintas.

Page 20: MODELOS DE PRONOSTICOS Primer semestre 2010 Modelo de Regresión con dos variables

Análisis de regresión Al igual que la FRP se establece la FRM

Para la FRM se define entonces

Al igual que la FRP, la FRM tiene su forma estocástica:

22

11

21

/:ˆ

ˆˆˆ

deestimador

deestimador

XYEdeestimadorY

XY

ii

ii

iii uXY ˆˆˆ21

Page 21: MODELOS DE PRONOSTICOS Primer semestre 2010 Modelo de Regresión con dos variables

Análisis de regresión

es el término residual (muestral).

Es una estimación de

El objetivo principal en el análisis de regresión es estimar la FRP

con base en la FRM

Luego la FRM es una aproximación de FRP

iu

iu

iii uXY ˆˆˆ21

iii uXY ·21

iii uYY ˆˆ

Page 22: MODELOS DE PRONOSTICOS Primer semestre 2010 Modelo de Regresión con dos variables

Análisis de regresión

iii uYY ˆˆ