30
CURSO: ECONOMETRÍA Y ANÁLISIS DE POLÍTICAS FISCALES INSTRUCTOR: HORACIO CATALÁN ALONSO

CURSO: ECONOMETRÍA Y ANÁLISIS DE POLÍTICAS … · 2016-07-04 · tabla de analisis de la varianza (anova) 𝑒𝑔 =

Embed Size (px)

Citation preview

CURSO: ECONOMETRÍA Y ANÁLISIS DE POLÍTICAS FISCALES

INSTRUCTOR: HORACIO CATALÁN ALONSO

Análisis Estadístico

con STATA

• Stata se considera un “paquete para análisis

estadístico”

•Trabaja con datos de sección cruzada, series de

tiempo y datos panel

• Se puede utilizar es sistemas operativos de

Windows, Macintosh, Unix y Linux

http://www.stata.com

• Stata/MP: The fastest version of Stata (for dual-core

and multicore/multiprocessor computers)

• Stata/SE: Stata for large datasets

• Stata/IC: Stata for moderate-sized datasets

• Small Stata: A version of Stata that handles small

datasets (for educational purchases only)

• Numerics by Stata: Stata for embedded and web

applications

Ventana de

Resultados

Editor de comandos

Historial

de

instrucciones

Lista de

variables

Características de

las variables

Comandos básicos

Syntax

[prefix :] command [varlist] [=exp] [if] [in] [weight]

[using filename] [, options]

Cambio de directorio

cd c:\practica\stata_1\

Log files guarda los resultados de

Stata la extensión es .log

se puede cambiar a txt

File/Log/Begin..

Se debe iniciar abriendo este archivo

Seleccionar Hacer una copia y pegar en Stata

Comandos básicos

Syntax

command [nombre var] [=operación] [if] [in] [, opciones]

• Crear un archivo con extensión “do”• Permite editar y ejecutar las

instrucciones

200

400

600

800

1000

1200

pib

1960 1980 2000 2020tiempo

Fuente: Con base en información de INEGI

(miles de millones de dólares USA de 2010)

Evolución del PIB 1965-2014

5000600070008000900010000

pib

p

1960 1980 2000 2020tiempo

Fuente: Con base en información de INEGI

(Dólares por persona de 2010)

PIB per cápita 1965-2014

.81

1.2

1.4

1.6

1.8

engp

1960 1980 2000 2020tiempo

Fuente: Con base en información de SENER

(tons eq petróleo por persona)

Consumo de Energía 1965-2014

1.5

22.5

33.5

4

co2p

1960 1980 2000 2020tiempo

Fuente: Con base en información de IEA

(tons CO2 eq por persona)

Emisiones CO2 1965-2014

1.2

1.3

1.4

1.5

1.6

ieng

1960 1980 2000 2020tiempo

Fuente: Con base en información de IEA

(barriles por cada 1000 dólares)

Intensidad Energética 1965-2014

Dadas dos variables (Y, X) tomadas sobre el mismo

elemento de la población, el diagrama de dispersión es

simplemente un gráfico de dos dimensiones, donde en un

eje (la abscisa) se sitúa una variable, y en el otro eje (la

ordenada) se sitúa la otra variable

Si las variables están correlacionadas, el gráfico mostraría

algún nivel de correlación (tendencia) entre las dos

variables. Si no hay ninguna correlación, el gráfico

presentaría una figura sin forma, una nube de puntos

dispersos en el gráfico.

GRÁFICOS DE DISPERSIÓN: Permite

representar la evolución conjunta de ambas

variables

Representación gráfica de una relación

Variable X

Var

iab

le Y

Var

iab

le Y

Var

iab

le Y

Variable XVariable X

Relación lineal positiva Relación lineal negativaSin relación

.51

1.5

2

5000 6000 7000 8000 9000 10000pibp

95% CI Fitted values

Fitted values engp

Energía vs PIB

12

34

5

5000 6000 7000 8000 9000 10000pibp

95% CI Fitted values

Fitted values co2p

Emisiones CO2 vs PIB

12

34

.8 1 1.2 1.4 1.6 1.8engp

95% CI Fitted values

Fitted values co2p

Emisiones CO2 vs ENG

.86

1.51.2 1.1

2.3

1.31.5

3.2

1.5

1.5

3.3

1.41.8

3.7

1.4

01

23

40

12

34

1965-1969 1970-1979 1980-1989

1990-1999 2000-2014

mean of engp mean of co2p

mean of ieng

Graphs by periodo

-50

510

15

Porc

enta

je

1960 1980 2000 2020tiempo

dpib deng

dco2

Tasas de crecimeinto

CO2p = 𝛼 + 𝛽𝑃𝐼𝐵𝑝

Modelo de Regresión Lineal

El modelo establece que un cambio en una unidad de del

PIB per cápita produce u ocasiona un cambio en las

emisiones per cápita de CO2, medido por el parámetro 𝛽

Este modelo podría ser adecuado si la línea recta pasará

por todos los puntos del diagrama de dispersión

Debido a que los valores observados de la línea recta del

modelo se define un erro

ii XY

𝑢𝑖

La diferencia entre el valor observado de la variable y la

recta estimada se denomina error

CO2p = 𝛼 + 𝛽𝑃𝐼𝐵𝑝

CO2p = −0.655 + 0.000479𝑃𝐼𝐵𝑝

TABLA DE ANALISIS DE LA VARIANZA (ANOVA)

𝑅𝑒𝑔𝑆𝑆 =

𝑖=1

𝑁

𝑌𝑖 − ത𝑌2

Regression Sum of Squares

Variabilidad explicada por el modelo

𝑅𝑆𝑆 =

𝑖=1

𝑁

𝑌𝑖 − 𝑌𝑖2

Residual Sum of Squares

Variabilidad NO EXPLICADA𝑇𝑆𝑆 =

𝑖=1

𝑁

𝑌𝑖 − ത𝑌2 Total Sum of Squares

Variabilidad Total

𝑇𝑆𝑆 = 𝑅𝑒𝑔𝑆𝑆 + 𝑅𝑆𝑆

MS (Mean Square)

N

i

i

N

i

i

YY

u

R

1

2

1

2

2

ˆ

1

𝛼

𝛽

𝑠𝑒(𝛼)

𝑠𝑒(𝛽) 𝑡 =መ𝛽

𝑠𝑒(𝛽)

𝑡 =ො𝛼

𝑠𝑒(𝛼)

𝛽 ± 𝑡 0.975,𝑁−𝑘 𝑠𝑒(𝛽)

𝛼 ± 𝑡 0.975,𝑁−𝑘 𝑠𝑒(𝛼)

N

i

i

N

i

i

N

i

i

N

i

ii

YPYPYP

YPCOYPCO

11

2

11

22

La curva ambiental de Kuznets, representada por una U invertida,

es una de las hipótesis básicas para explicar la relación entre nivel

de ingreso per cápita y el medio ambiente

Las causas económicas que originan este comportamiento son

múltiples

Tres efectos principales: de escala, de composición y tecnológico

𝐶𝑂2𝑡 = 𝛽0 + 𝛽1𝑌𝑃𝑡 + 𝛽2𝑌𝑃𝑡2 + 𝛽3𝑌𝑃𝑡

3 +𝑗=1

𝑘

𝛾𝑗𝑋𝑗,𝑡 + 𝑢𝑡

1.5

22.5

33.5

4

5000 6000 7000 8000 9000 10000pibp

Fitted values co2p

CURSO: ECONOMETRÍA Y ANÁLISIS DE POLÍTICAS FISCALES

INSTRUCTOR: HORACIO CATALÁN ALONSO