Upload
carolina-figueroa
View
10
Download
0
Embed Size (px)
DESCRIPTION
Còmo usar Stata
Citation preview
Bases de STATA, tipos de archivos, sintaxis y comandos
básicos(Referencia Seminario de Stata – Universidad Nacional de La Plata)
Camilo F. Gómez
Agosto 6 de 2014
Econometría I - Camilo F. Gómez 1
Hoja de Ruta
Introducción a STATA
• Detalles sobre versiones
• Manuales y guías de aprendizaje
• Entorno de trabajo – Interface
• Sintaxis
• Comandos básicos
• Memoria
• Abreviaturas
Econometría I - Camilo F. Gómez 2
Introducción a STATA
• STATA es un sistema que permite la gestión y manejo de datos para poder realizar estimaciones econométricas y estadísticas.
• La ventaja de STATA es que basa su lenguaje en programación a través de una sintaxis.
• Posee comandos predefinidos que permite realizar trabajos complejos.
• Admite la creación de nuevos comandos por parte del usuario, generando posibilidades de expnasión.
Econometría I - Camilo F. Gómez 3
Detalle sobre versiones
Existen varias versiones de STATA las más importantes son:
• Windows (32 - bit), Windows (64 - bit)
• Mac (32 – bit Intel), Mac (64 – bit Intel)
• Linux (32 – bit), Linux (64 – bit x 86 – 64)
Hasta la versión 10 del programa existían dos tipos: SE (special edition) y el IC (standard).
A partir de la versión 11 existen versiones optimizadas.
Para saber la versión de STATA instalada ejecutar el comando
about
Econometría I - Camilo F. Gómez 4
Manuales y guías de aprendizaje
Las fuentes oficiales para aprender STATA son los manuales originales.
• Para dar una base es suficiente con la guía de usuario.
• Para usuarios avanzados, existen libros y manuales detallados por comando.
• STATA posee una ayuda en línea que permite acceder a información con respecto a inquietudes concretas, esta se puede obtener de doamaneras:
• Utilizando man comando
• Se utiliza desde el menú o la línea de comando la opción help.
Econometría I - Camilo F. Gómez 5
Entorno de trabajo - Interface
La interface en STATA corresponde al entorno de trabajo. A continuación se trabajará en interface en las siguientes clases se realizará la interface a través de archivos do y log.
Estas son las ventajas que hacen parte del entorno de trabajo.
• Ventana “Review”. Muestra el historial de comandos utilizados.
• Ventana “Variables”. Determina las variables de la base de datos.
• Ventana “Results”. Es la ventana que expone los resultados (ventana de color negro) después de tulizar los comandos.
• Ventana “Command”. En esta ventana se introducen los comandos a utilizar.
Econometría I - Camilo F. Gómez 6
Sintaxis
El programa STATA trabaja mediante ordenes por parte del usuario a través de comandos. Los comandos conforman un lenguaje de comunicación del programa, por lo que existe una determinada sintaxis que se debe respetar.
comando [varlist] [=exp] [if exp] [in range] [weight] [,opciones]
Los corchetes indican elementos opcionales, todos los elementos que pueden acompañar un comando.
Econometría I - Camilo F. Gómez 7
Comandos básicos
Para ver los diferentes comandos simples y que permita entender la estructura de la sintaxis. Para ello utilizaremos la base de datos auto.dta. Esta base de datos contiene 74 observaciones de vehículos incluye las variables precio, largo, marca, consumo, etc.
Comando para cargar la base de datos
use “c:\clase 4\auto.dta”
• No se puede utilizar dos bases de datos simultáneamente, o abrir una base con una que ya esta siendo utilizada para ello se puede utilizar
use c\clase 4\auto.dta, clear
Econometría I - Camilo F. Gómez 8
Comandos básicos
• Utilizando el comando “cd c:\clase 4\auto.dta” para indicarle a STATA donde esta la carpeta que esta trabajando. Luego se utiliza el comando “use auto.dta”
• La otra alternativa es abrir la base a través del menú “open”.
Una vez cargada la base de datos, se puede observar “Review”, “Variables” y “Results” que cambiaron.
Econometría I - Camilo F. Gómez 9
Comandos básicos
Sintaxis: Comando sin opciones
El comando summarize permite obtener una descripción estadística de cualquier variable que componen la base de datos.
summarize
Se puede usar para obtener la descripción estadística de una variable.
summarize price
Econometría I - Camilo F. Gómez 10
Comandos básicos
Más variables
summarize price weigth length
Lista de variables (todas las variables que están entre Price y trunk)
summarize price-trunk
Variables que inician con la letra l (en este caso length)
summarize l*
Econometría I - Camilo F. Gómez 11
Comandos básicos
Sintaxis [if exp]
La aplicación de comandos a veces se debe realizar para variables que debe cumplir ciertas restricciones, esto se hace utilizando el “si condicional” (if en ingles).
summarize length if price > 4500
Calcula el resumen estadístico de la variable largo de aquellos autos con un precio mayor a 4.500.
Econometría I - Camilo F. Gómez 12
Comandos básicos
Para construir una sentencia se debe utilizar los siguientes componentes:
• Operadores de comparación
== igual
!= no igual (similar a ~=)
>, <, >=, <= los usuales mayor, menor, mayor igual y menor igual.
• Operadores lógicos
& y
| o
! No
Econometría I - Camilo F. Gómez 13
Comandos básicos
• Operadores jerárquicos. El paréntesis determina el orden de la aplicación de las condiciones.
summarize length if (price > 4500) & (length < 180)
summarize length if (price > 4500 & length < 180) | weight > 3400
summarize length if !(price > 4500) & (length < 180) | weight > 3400)
Sintaxis [in range]
Permite aplicar el comando a un rango de observaciones.
summarize price in 1/10
Obtiene la descripción estadística de las 10 primeras observaciones.
Econometría I - Camilo F. Gómez 14
Comandos básicos
summarize price in 7/12
Obtiene la descripción estadística de la 7 a la 12 observación.
summarize price in -10/-1
El comando se aplica a las ultimas 10 observaciones.
Debemos tener claro que la aplicación de [in range] a su vez depende de como esta ordenada la base de datos. Los comandos para ordenar son:
sort price
Permite ordenar de manera ascendente según la variables especifcada.
Econometría I - Camilo F. Gómez 15
Comandos básicos
gsort-price
Ordena de manera descendente, según el precio del auto.
gsort+price
Ordena de manera ascendente, según el precio del auto.
Sintaxis [=exp]
Para generar se utiliza solo dos comandos: generate y replace.
Econometría I - Camilo F. Gómez 16
Comandos básicos
generate eleccion = 0
Este comando permite crear una nueva variable en la base de datos. Para ello se debe indicar que valores puede tomar esta variable, en este caso la variable se llama elección y tiene un valor de cero.
Se puede generar una nueva variable combinándola con otras existentes.
generate price2 = price*2
generate lnprice = ln(price)
Así mismo se puede verificar los valores con el siguiente comando:
list price price lnprice
Econometría I - Camilo F. Gómez 17
Comandos básicos
Se puede crear un variable con valor nulo, en STATA se identifica con un punto (.)
generate nulo = .
El otro comando que se usa es el replace, este comando permite reemplazar valores de la variable creada.
replace price2 = 0 if price < 4500
¿ Que hizo este comando?
Econometría I - Camilo F. Gómez 18
Comandos básicos
Sintaxis [by varlist]
Permite aplicar el comando a un grupo de observaciones definidos por los distintos valores de la variables indicada. Para saber cuantos autos nacionales y extranjeros existen.
sort foreign
By foreign: summarize price
Se puede utilizar el siguiente método
summarize price if foreign==0
summarize price if foreign==1
¿Cuál es la diferencia entre ambos métodos?
Econometría I - Camilo F. Gómez 19
Comandos básicos
Sintaxis [, opciones]
Existen comandos que pueden aceptar opciones adicionales, estas se especifican en la sintaxis luego de la coma.
summarize price, detail
¿Qué cambio?
Sintaxis[weight]
Esta indica a una variable como ponderador de las observaciones. Cuando estemos trabajando Encuestas de Hogares la utilizaremos como parte del sintaxis.
Econometría I - Camilo F. Gómez 20
Otros comandos
Para tabular cantidades de observaciones para distintos valores de una variables tenemos:
tabulate foreign
Así mismo puede ser combinado con el comando summarize
tabulate foreign, summarize (price)
De esta manera se obtiene la media, el desvió estándar y la frecuencia, del precio para los autos nacionales y extranjeros.
Econometría I - Camilo F. Gómez 21
Otros comandos
Se puede combinar con más variables
tabulate foreign price
Por su parte el comando tabstat es más avanzado para generar estadísticas descriptivas.
tabstat price, statistics(mean)
De igual manera se pueden obtener otros.
tabstat price, statistics(mean sum count max min range sd variance cv median p10)
Para más variables
tabstat price length, statistics(mean sum count max min range sd variance cv median p10)
Econometría I - Camilo F. Gómez 22
Memoria
STATA trabaja de una manera en donde la base de datos es almacenada en la memoria RAM del PC. Esto trae ventajas y desventajas.
• La ejecución de comandos es más rápida, ya que no accede al disco.
• El tamaño de la base de datos procesada depende de la cantidad de memoria RAM del PC.
El comando para conocer el uso de la memoria es:
memory
Econometría I - Camilo F. Gómez 23
Memoria
El programa comienza la sesión con una capacidad de memoria asignada. Dado que este espacio puede no ser suficiente, se puede ampliar la memoria.
set memory 100m
Este comando asigna 100 mega bytes de memoria para el uso de STATA, sin embargo para las ediciones posteriores a STATA 11 no es necesario, ya que se asigna la cantidad automáticamente.
Econometría I - Camilo F. Gómez 24
Abreviatura
Es interesante que los comandos que se explicaron pueden ser abreviados, es decir, pensaron que se tenían que escribir siempre summarize.
La regla es sencilla se puede realizar la abreviatura siempre y cuando no se confunda con otro comando.
• Los comando destructivos no se abrevian drop, clear
• Existe el comando describe que se abrevia con d, a pesar de confundirse con otros.
Ejemplo
sum price foreign
Econometría I - Camilo F. Gómez 25