DATOS CON STATAfaviok.weebly.com/uploads/6/4/0/3/6403801/sistemas_de_in... · 2018-10-02 · MANEJO...

Preview:

Citation preview

MANEJO DE DATOS CON STATA

Interfaz

Revisar

Variables

Resultados

Comandos

MANEJO DE DATOS CON STATA

Interfaz

Para visualizar la ruta de todos los archivos

creados por Stata, escriba la palabra sysdir en la

barra de comandos

MANEJO DE DATOS CON STATA

Cargar una base de datos

use ‘‘C:/Mis Documentos/Stata/Datos1.dta’’

MANEJO DE DATOS CON STATA

Cargar una base de datos

Para ver las observaciones en pantalla, se puede

utilizar edit o bien list seguido por el nombre de la

variable o variables que se deseen visualizar. La

diferencia entre edit y list es que el primero

despliega toda la hoja de cálculo mientras el

segundo despliega los datos en la ventana de

resulta dos.

Comandos: describe, edit, list

MANEJO DE DATOS CON STATA

Borrar datos

El comando clear descarga los datos de la memoria

temporal de Stata; notese que al utilizar clear no se

realizará ninguna advertencia antes de descargar

los datos y si la base de datos original ha sido

modificada sin ser salvada estos cambios se

perderán.

Comandos: clear

MANEJO DE DATOS CON STATA

Label. Este comando sirve para añadir etiquetas a

variables (label variable).

Comentar:

(*) Otra opción es encerrar el comentario entre los

siguientes símbolos ( /* */).

MANEJO DE DATOS CON STATA

order, move y aorder Estos comandos cambian el

orden en que se encuentran las variables.

order seguido por lista de var cambia el orden

según sea especificado por la lista de variables.

move var1 var2 en cambio, sustituye la variable1

en la posición de la variable2.

aorder acomoda las varibles en órden alfabético.

sort Ordena de forma acendente las observaciones

basado en una o más variables.

MANEJO DE DATOS CON STATA

Muchas veces es necesario combinar dos o más

bases de datos para formar una sola. Para ello se

pueden utilizar los comandos merge o append.

merge une dos bases de datos utilizando una

variable en común.

Las dos bases de datos deben estar en formato .dta

(Stata) y las observaciones deben estar ordenas

(utilizando sort) de acuerdo a la variable que sirve

como referencia.

MANEJO DE DATOS CON STATA

El objetivo de merge es anexar variables no

observaciones. Por ejemplo:

use ds2

sort recid

save ds2, replace

use ds1

sort recid

merge recid using ds2

MANEJO DE DATOS CON STATA

Lo que este pequeño codigo nos dice es que

carguemos la base de datos ds2 (use) y la

ordenemos de acuerdo al identificador recid (sort) y

guardemos los cambios reemplazando ds2 (save).

Posteriormente abrimos la segunda base de datos

utilizando el comando use, la ordenemos con base

en recid y finalmente la pegamos (merge) de

acuerdo a recid utilizando la base de datos ds2.

MANEJO DE DATOS CON STATA

En el caso de append sucede lo contrario, lo que se

busca es anexar observaciones

append using ndatos

MANEJO DE DATOS CON STATA

Si se desea construir una nueva base de datos que

contenga información condensada de la base

original, esto se puede hacer utilizando el comando

collapse.

collapse (mean) edad educacion ingreso, by(hogar)

MANEJO DE DATOS CON STATA

codebook es un comando muy útil para empezar a

analizar la base de datos. Si no se específica una

variable codebook presenta estadísticas

descriptivas sobre cada una de las variables en la

base de datos

O bien

summarize price mpg

sum id120 id130;

MANEJO DE DATOS CON STATA

Muchas veces necesitamos crear una tabla con

determinados estadísticos descriptivos, para hacer

esto se puede hacer uso de los comandos tabstat o

tabulate.

tabstat price mpg trunk weight, statistics(mean n

sum sk median)

tabulate rep78 foreign

MANEJO DE DATOS CON STATA

Asimetria y curtosis:

sktest

MANEJO DE DATOS CON STATA

Gráficos

Stata tiene un gran los commandos para generar

gráficas siendo scatter, twoway, histogram y

kdensity entre los comandos más utlizados.

scatter le year

scatter le year, connect(l)

scatter lexp gnppc, by(region)

MANEJO DE DATOS CON STATA

Gráficos

histogram volume, freq kdensity xaxis(1 2) ylabel(0(10)60, grid

hist id120, width(1) percent

title("Distribucion edad")

subtitle("Años")

scheme(s1mono)

;

graph save Graph"C:\Users\FAVIO\Graph.gph"

MANEJO DE DATOS CON STATA

Gráficos

twoway (scatter aca110 aca105) (lfit aca110

aca105),

title("")

subtitle("")

scheme(s1mono)

;

graph export "C:\Users\FAVIO\Grafica", as (jpg)

replace

MANEJO DE DATOS CON STATA

Archivos do

Permiten escribir un código que al ejecutarlo

genera los resultados de las instrucciones que se

incluyen en el.

MANEJO DE DATOS CON STATA

Ejercicio 9.- Con la base de datos wage2 escribir

un archivo do para realizar su estadística

descriptiva. Para ello proponga preguntas guía.

Por ejemplo:1. ¿Cuantas mujeres con escolaridad universitaria hay

en total?¿que proporción equivale comparada con los hombres en esta misma situación?

2. ¿Cuántas personas en entre 20 y 40 años hay? Entonces es necesario generar una nueva variable que es 1 si la edad del individuo esta entre 20 y 40, alternativamente es 0

No olvide "Etiquetar" las nuevas variables construidas

MANEJO DE DATOS CON STATA

Regresión

reg y s

xi: reg y m i.sector

MANEJO DE DATOS CON STATA

Regresión

Los diagnósticos de la regresión son obtenidos justo

después de la prueba escribiendo cualquiera de los

siguientes comandos: hettest para

heterosedasticidad, vif para multicolinealidad y

ovtest para variables omitidas y especificación

incorrecta.

MANEJO DE DATOS CON STATA

Regresión

hettest. Esta prueba utiliza los residuales

obtenidos de la regresión original, los eleva al

cuadrado y posteriormente los corre contra las

variables independientes. De este segundo modelo

se obtiene un estadístico de prueba con distribución

F. Esto es lo que se conoce como la prueba Breusch-

Pagan (1980).

MANEJO DE DATOS CON STATA

Regresión

Ovtest. Realiza la prueba RESET, Regression

Specification Error Test, [Ramsey 1969]. En esta

prueba se agregan polinomios de valores ajustados

para y.

MANEJO DE DATOS CON STATA

Regresión

vif. Esta prueba presenta la proporción de la

varianza total de cada una las variables

independientes que no es explicada por las

variables independientes restantes (Variance

Inflation Factor.)

MANEJO DE DATOS CON STATA

Regresión

Si alguno de los diagnósticos nos indican la

presencia de un problema con los supuestos OLS.

Utilizar los comandos: robust, ivreg

MANEJO DE DATOS CON STATA

Regresión

Predicción

Utilizar los comandos: predict

MANEJO DE DATOS CON STATA

Modelo logit

logit active yschooling experience sqexperience

north south hhsize ohhminc

MANEJO DE DATOS CON STATA

Ejercicio 10.-

1. Estimar un modelo Logit con la base Mroz.

2. Obtener una grafica donde se muestre cual es la probabilidad de laborar conforme cambia la escolaridad diferenciando por el número de hijos menores de 6 años.

3. Obtener una grafica donde se muestre cual es la probabilidad de laborar conforme cambia la edad diferenciando por el número de hijos menores de 6 años.

Recommended