135
APRENDIENDO A USAR STATA Carlos Giovanni González Espitia Email: [email protected] Departamento de Economía Universidad Icesi Resumen El objetivo de este documento es introducir al lector en el uso básico de Stata, posiblemente el software econométrico más popular y con las herramientas predefinidas más adecuadas de cálculo automatizado para la docencia y la investigación en economía. Palabras Clave: Econometría, software econométrico, Stata Clasificación JEL: C01, C87. Stata es una marca registrada de Stata Corporation. Copyright 1996–2010 StataCorp LP, 4905 Lakeway Drive, College Station, TX 77845 USA. Las opiniones contenidas en este documento, los errores u omisiones son de exclusiva responsabilidad del autor. .::UdecomBooks::.

Stata 11

Embed Size (px)

Citation preview

  • APRENDIENDO A USAR STATA

    Carlos Giovanni Gonzlez Espitia

    Email: [email protected]

    Departamento de Economa

    Universidad Icesi

    Resumen

    El objetivo de este documento es introducir al lector en el uso bsico de Stata,

    posiblemente el software economtrico ms popular y con las herramientas

    predefinidas ms adecuadas de clculo automatizado para la docencia y la

    investigacin en economa.

    Palabras Clave: Econometra, software economtrico, Stata

    Clasificacin JEL: C01, C87.

    Stata es una marca registrada de Stata Corporation. Copyright 19962010 StataCorp LP, 4905

    Lakeway Drive, College Station, TX 77845 USA. Las opiniones contenidas en este documento, los errores

    u omisiones son de exclusiva responsabilidad del autor.

    .::UdecomBooks::.

  • 2

    1 Introduccin

    Este documento es el primero de una serie de documentos de carcter acadmico que

    se escribirn sobre el uso en econometra del software Stata. Este programa no es

    libre y tampoco es gratuito, por lo que es necesario acceder a una licencia para su uso

    legal. La empresa que desarrolla y comercializa el software es StataCorp

    (www.stata.com). Este programa supera prcticamente todos los test de fiabilidad

    (www.stata.com/support/cert/), por esta razn, adems de su rigurosidad y manejo

    de dos ambientes de trabajo, es uno de los programas economtricos ms utilizados.

    Una de las ventajas ms destacadas del programa es que permite un ambiente de

    trabajo tradicional por medio de ventanas (Windows), el cual es muy fcil de utilizar a

    travs de un men principal y de una barra de herramientas de donde se despliegan

    todas las opciones posibles que tiene predefinidas el software. Por otro lado, tambin

    permite trabajar con comandos predefinidos, que se complementa con un potente

    lenguaje de programacin. Esta opcin permite utilizar rutinas para ejecutar

    programas previamente hechos sin necesidad de empezar de nuevo. Posiblemente,

    sta opcin de uso es una de las ventajas ms reconocidas para usar Stata.

    Este documento va dirigido a todos los estudiantes, profesores e investigadores en

    economa deseosos de empezar a usar el programa, o profundizar sus conocimientos

    en la herramienta. Adems, el documento es una herramienta de apoyo y no sustituye

    los manuales de Stata, ni los libros ms rigurosos de econometra.

    El objetivo de este documento es introducir al lector en el uso bsico de Stata, uno de

    los programas ms populares y rigurosos para hacer econometra. Actualmente los

    econometristas pueden facilitar su labor al realizar una buena eleccin del software

    con el que se va a trabajar. Algunas de las ventajas de utilizar Stata son que permite

    realizar las regresiones de manera sencilla y rpida mediante comandos, adems de

    que tiene propiedades particulares como la facilidad de guardar en un archivo todo lo

    realizado hasta cierto punto para reanudar con el trabajo despus de cerrado el

    programa.

    El documento consta de cuatro apartados, el primero de ellos es esta introduccin. En

    el segundo apartado se hace una introduccin al programa y a los comandos ms

    bsicos. El tercer apartado recoge las nociones bsicas para el procesamiento de

    datos. En el cuarto apartado se presentan algunos comentarios generales del uso

    bsico del programa. Finalmente, el documento termina con una seccin de la

    bibliografa usada y otra complementaria. El documento termina con un anexo sobre

    el uso del programa Stattranfer, la econometra no sera lo mismo sin l.

  • 3

    2 Comandos bsicos

    Stata es un programa que se instala fcilmente y que tiene una interface muy

    amigable. En el Cuadro 1, se puede observar la salida inicial del programa. En la parte

    superior de la interfase de salida de Stata vemos el men principal con todas sus

    opciones (File, Edit, Data, Graphics, Statistics, User, Windows y Help), as como una

    barra de herramientas con once iconos, distribuidos en el siguiente orden (Open,

    Save, Print, Log, New viewer, Graph, New do-file editor, Data editor, Data browser,

    Clear y Break). En la misma salida se observan cuatro grandes ventanas, (i) Results, (ii)

    variables, (iii) Review y (iv) Command.

    Cuadro 1. Salida inicial de Stata 11

    A continuacin se describe cual es el uso de cada una de las ventanas que se observan

    en la pantalla principal del programa:

    a. Results

    En esta ventana encontramos el logo de Stata, la versin del programa que se est

    usando y la memoria que tenemos disponible para cargar los datos y el nmero de

    variables. En esta ventana de resultados, como su nombre lo indica, se tendrn todo

    tipo de resultados sobre los comandos que se ejecuten; tambin aparecen mensajes

    de lo que se est haciendo o lo que est ejecutando el programa, as como mensajes si

    cometemos algn tipo de error. Los colores de las palabras nos indican si son

    resultados de un comando, si es un comando o si es un error. Esta opcin de los

    .::UdecomBooks::.

  • 4

    colores est predefinida pero se puede cambiar. Con click derecho sobre la ventana

    podemos copiar, imprimir el texto, o establecer las preferencias para esta ventana.

    b. Variables

    Esta ventana, que aparece a un lado de la ventana de resultados, muestra las variables

    que contiene el archivo que se abri o del fichero que actualmente se tiene en

    memoria, tambin nos muestra informacin de las etiquetas de cada una de las

    variables; as como la informacin relevante de cada variable (Name, Label, Type y

    Format). Puede utilizarse para introducir los nombres de las variables en la ventana de

    comandos haciendo click sobre la variable. Igualmente, situndonos en la variable y

    haciendo click derecho se puede introducir comentarios a esa variable. Para ver las

    notas de un fichero se puede usar el comando .notes list.

    c. Review

    La ventana de revisin, muestra una lista de los comandos que recientemente se han

    ejecutado desde que se abri algn tipo de archivo, sea de datos (*.dta), un do-file

    (*.do) o un log (*.log). Desde esta ventana se pueden incluir comandos tecleados con

    anterioridad en la ventana command, con hacer click una vez en el mismo. Y haciendo

    click dos veces se copia y ejecuta.

    d. Command

    Esta es la ventana donde se deben escribir los comandos que se desean ejecutar. Se

    pueden recuperar comandos escritos anteriormente o posteriormente con la tecla

    RePg o AvPg, hasta llegar al comando buscado, o tambin se pueden buscar en la

    ventana Review y darle click. Otra ayuda importante en esta ventana es la opcin de

    completar automticamente el nombre de una variable tecleada parcialmente con la

    tecla Tab.

    En general, Stata permite ser usado por medio de ventanas con la opcin del men

    principal convencional. Una vez se selecciona una opcin del men, se puede buscar y

    seleccionar la opcin de lo que se desea hacer (inmediatamente el programa abre otra

    ventana, donde se define la tarea que deseamos que realice el programa).

    La otra opcin es por comandos o programacin, que se debe hacer directamente en

    la ventana de comandos o creando un do-file. Ej: Se escribe directamente la opcin

    use or open.

    Muchos de los comandos de Stata se pueden abreviar a las primeras letras. Por

    ejemplo: el comando inspect se puede escribir ins, teniendo el mismo resultado.

    Es fundamental tener cuidado en el uso de los comandos porque este software es muy

    sensible al uso de maysculas y minsculas. Ejemplo: Para Stata no es lo mismo

    inspect que INSPECT o que Inspect. El comando correcto es inspect. Todos los

  • 5

    comandos de Stata se escriben en minsculas, mientras que los nombres de las

    variables dependen del creador del archivo de datos y pueden ir en maysculas,

    minsculas o combinaciones.

    Por otra parte, los tipos de archivos que podemos usar en Stata son:

    Tabla 1. Extensin y tipos de archivos en Stata

    Extensin Tipo de archivo

    .dta Archivos de datos

    .do Archivos de comandos

    .ado Programas

    .hlp Archivos de ayuda

    .gph Grficos

    .dct Archivos diccionarios

    .smcl Archivos log

    .raw Ficheros de datos ASCII/text

    .dct Ficheros de instrucciones ASCII

    A continuacin, se presentan algunos temas que es necesario conocer antes de

    empezar a usar el programa.

    2.1 Personalizacin de la ventana inicial

    El programa tiene unas preferencias establecidas para su uso. Sin embargo, estas

    pueden ser cambiadas desde el men principal. Siguiendo la ruta: Edit Preferences.

    Algunas de las preferencias que se pueden modificar son:

    Edit Preferences General preferences

    En las preferencias generales se pueden cambiar las preferencias de la ventana inicial

    de Stata. Por ejemplo, se pueden modificar los colores de la ventana de resultados,

    hay tres colores negro (predefinido), blanco y azul. En esta misma ventana, se pueden

    hacer cambios sobre los colores de las letras. Por ejemplo, el programa tiene

    predefinidos mensajes en letras rojas para errores. Aqu tambin se puede definir el

    tamao de la ventana y si se quiere minimizar o maximizar la ventana: Edit Preferences General preferences Manage preferences, o dando click derecho sobre la ventana de resultados y despus en Font. Modificando la fuente de la

    ventana de resultados se puede obtener mayor claridad al copiar el resultado por

    ejemplo en un archivo de Microsoft Word, y/o Latex.

    2.2 Ayudas de Stata

    Stata es un programa muy completo y en ocasiones es difcil conocer para qu sirven

    todos los comandos que el programa trae predefinidos. El men desplegable Help, nos

    permite de forma muy intuitiva buscar informacin sobre estadsticas, grficos,

    .::UdecomBooks::.

  • 6

    manejo de datos, programacin, etc., as como descargar de la red las ltimas

    actualizaciones de Stata, programas realizados por analistas y puestos a disposicin de

    todos los usuarios del software.

    Para situaciones en las cuales necesitamos ayuda, podemos acceder fcilmente al

    men de ayuda del programa haciendo click en el men help de la barra de

    herramientas. En caso de necesitar ayuda acerca de cmo se utiliza un comando, los

    pasos son los siguientes:

    Primero, dando click en Stata Command Stata abre una nueva ventana donde se nos

    pide introducir el comando sobre el que necesitamos ayuda:

    Una vez introducido el comando, se abre la ventana Viewer(#1) [Help describe] que

    proporciona la informacin que se est solicitando:

    Cuadro 2. Ventana de ayuda de Stata

    En esta nueva ventana el programa ofrece la descripcin completa de la sintaxis que

    se debe usar para escribir correctamente el comando. Igualmente, si se tienen dudas

  • 7

    sobre qu hace un comando o cmo se utiliza, se puede acceder a la informacin

    tecleando simplemente:

    .help nombre del comando

    En caso de que no se sepa cmo se escribe el comando o se desconoce si el programa

    tiene predefinido un comando para lo que se desea hacer, se puede usar el comando:

    .search palabra clave.

    2.3 Modificar la memoria

    Cuando se abre un archivo de datos en Stata el programa mantiene los datos en la

    memoria. As, si se est trabajando con un archivo de datos y se desea cargar otro

    archivo es necesario remover el archivo de la memoria y para esto usamos el

    comando:

    .clear

    Tecleando este comando se borran todos los datos que se encontraban en la memoria

    del programa.

    En otras ocasiones cuando se intenta abrir un archivo puede salir el siguiente mensaje:

    .no room to add more observations

    .r (901);

    Lo cual significa que la memoria asignada por defecto por el programa es insuficiente

    para cargar los datos o ejecutar lo que solicitamos. Se puede averiguar cunta

    memoria hay asignada y cunta se tiene libre tecleando:

    .memory

    Y se puede ampliar la memoria asignada, por ejemplo a 10Mb, tecleando:

    .set memory 10m

    Se puede asignar una memoria permanente diferente a la predefinida siempre que se

    abra el programa, esto se puede hacer agregando permanently al comando, de la

    siguiente manera:

    . set memory 10m, permanently

    Generalmente, la memoria asignada por defecto es insuficiente para la mayora de

    trabajos en investigacin y algunos en docencia. Por lo que es mejor siempre al inicio

    de cada sesin de trabajo ampliar la memoria.

    .::UdecomBooks::.

  • 8

    2.4 Estructura de los comandos

    La estructura general de la sintaxis de los comandos de Stata es la siguiente:

    [by varlist:] Command [varlist] [=exp] [if exp] [in range] [weight] [using filename] [,

    options]

    Donde los corchetes indican partes que tienen o no que aadirse segn el comando

    especfico del que se trate y lo que se desee hacer. A continuacin se describirn

    brevemente cada una de las opciones entre corchetes.

    [by varlist:]

    Esta opcin hace que el comando se ejecute por separado, dentro de cada grupo de

    variables del archivo o de algunas variables especificadas. El fichero tiene que estar

    ordenado por esas variables (para ordenar variables usamos el comando .sort):

    .sort sex age

    Este comando ordena los datos por sexos y dentro de cada sexo, por edades.

    .by sex age: regress vard var1 var2 var3

    Este otro, estima una regresin de vard sobre var1, var2 y var3 dentro de cada grupo

    de sexo y edad.

    [varlist:]

    Esta opcin especifica las variables para las que se pide el comando. Por ejemplo:

    var1 Variable var1.

    var1 var 2 var3 Variables var1, var2, var3.

    hh* Variables que empiezan con hh.

    var1-var6 Desde la variable var1 hasta var6.

    [=exp]

    Esta opcin sirve para expresiones matemticas o lgicas. Especifica el valor asignado

    a una variable. Los operadores que pueden incluirse son los siguientes:

    Tabla 2. Operadores bsicos de expresiones en Stata

    Aritmticos Lgicos Relacionales (variables

    numricas y de cadena)

    + suma ~ no > mayor que

    - resta l o < menor que

    * multiplicacin & y >- mayor o igual que

    / divisin

  • 9

    ^ potencia == igual que

    + encadenamiento de

    cadenas

    ~= no igual que

    Es importante aclarar que las expresiones lgicas generan dos posibles resultados para

    Stata, segn las va evaluando, observacin a observacin:

    Verdadero=1, si son ciertas para esas observaciones, o bien,

    Falsas=0, si no son ciertas para esa observacin.

    Otras expresiones que pueden utilizarse son las variables del sistema, que son

    variables internas de Stata cuyos nombres empiezan por _. Por ejemplo, dos

    variables del sistema que pueden ser tiles son:

    _n nmero de la observacin, segn el orden actual del fichero. _N nmero total de observaciones (coincide con el _n de la ltima observacin)

    [if exp]

    Las condiciones if se utilizan para restringir el campo de actuacin de un comando a

    slo las observaciones que cumplen la condicin especificada. Por ejemplo:

    .list var1 var2 if var1>20

    .list var1 var2 if var1>20 & var120 l var1

  • 10

    aweight: analytic weights, indica los pesos inversamente proporcionales a la varianza

    de cada observacin. Un uso tpico de este tipo de ponderacin es cuando las

    observaciones son medias y el peso representa el nmero de elementos que generan

    la media. Han de ser positivos, pero no necesariamente enteros.

    Iweight (importance weights): estos comandos no tienen definicin estadstica formal,

    simplemente representan de alguna forma la importancia que se atribuye a cada

    observacin. Cada comando que los acepta explica cmo los utiliza puede tener

    cualquier forma.

    Estas variables de ponderacin se incorporan a los comandos as (recuerde que los

    weights se especifican siempre entre corchetes):

    .command ponderacin [weighttype=varname]

    [using filename]

    Se utiliza slo en algunos comandos, como infile o outfile.

    [, options]

    En la sintaxis de cada comando, que puede verse en las ayudas, se especifican las

    opciones disponibles. Las opciones se escriben siempre detrs de una coma, pero no

    es necesario poner comas entre las distintas opciones.

    2.5 Comando para usar bases de datos que vienen con Stata:

    Otra de las herramientas bsicas con las que podemos contar para practicar y

    perfeccionar nuestro entrenamiento en Stata es un conjunto de bases de datos que

    vienen incorporadas automticamente con el programa. El comando para abrir stas

    bases de datos es:

    .sysuse nombre de la base de datos

    Un ejemplo es: .sysuse auto

    Tras ejecutar este comando, inmediatamente se observa cmo el programa carga un

    archivo de datos llamada auto. Alternativamente, el programa permite realizar la

    misma accin mediante la barra de herramientas, as: File Example datasets. Con

    esta opcin, podemos acceder a todas las bases de datos o podemos acceder a los

    ficheros por temas de estudio como regresin lineal, series de tiempo, datos de panel,

    etc.

    Adems de esto, el programa ofrece una serie de bases de datos disponibles en

    Internet. Estas se pueden utilizar por ejemplo con la direccin

    http://www.ats.ucla.edu/stat/stata/ o por REPEC mediante la direccin

    http://ideas.repec.org/ .

  • 11

    3 Procesamiento de datos

    Despus de descargar los datos a un software amigable como Stata, el econometrista

    se enfrenta al procesamiento de los datos, variables y observaciones para realizar su

    anlisis economtrico. A continuacin, se describen algunos de los comandos bsicos

    para realizar un buen procesamiento de la base de datos.

    3.1 Abrir, guardar y salir

    a. Abrir archivos de Stata:

    Stata permite varias opciones para abrir o leer ficheros de datos. As, si ya se tienen

    grabados los datos en formato Stata (*.dta), podemos abrir el archivo mediante el

    men Open o directamente con el comando:

    .use

    Algunas de las posibilidades que permite el programa para usar este comando son:

    Si los datos estn en una carpeta especfica entonces se debe utilizar:

    .use C:\carlos\2009\

    use t12009

    O tambin, para obtener el mismo resultado:

    .use C:\carlos\2009\t12009.dta

    Se debe tener en cuenta que no es preciso indicar el directorio si los datos estn en el

    directorio de trabajo actual (el directorio de trabajo lo da Stata en la lnea inferior de

    la pantalla). Por defecto, el directorio de trabajo es C:\DATA. En este caso se debera

    usar:

    .use t12009

    Adems, no es preciso sealar tampoco la extensin .data, ya que el programa lo

    asume por defecto.

    Tambin podemos abrir datos parciales de un archivo:

    .use var1 var2 using t12009

    Con la opcin anterior slo se abrirn las variables var1 y var2 del archivo t12009.

    Adems, si se desea seleccionar las diez primeras observaciones, entonces se debe

    indicar:

    .use t12009 in 1/10

    Las dos anteriores opciones se pueden combinar seleccionando de un archivo de

    datos slo algunas variables y algunas observaciones. Cuando se trabaja al mismo

    .::UdecomBooks::.

  • 12

    tiempo con varias bases de datos, es importante tener cuidado, ya que si se tienen en

    la memoria unos datos en los que se han hecho cambios no grabados e se intenta

    abrir un archivo de datos nuevo, Stata dar un mensaje de error con el aviso de que

    no se han guardado los cambios. Para evitar esto, se debe incluir al final el comando

    .clear, de la siguiente forma:

    .use t12009, clear

    Tambin se puede abrir un archivo de Stata por medio de ventanas: File Open (o directamente con el icono Open).

    b. Abrir archivos en otro formato

    Para abrir datos que todava no estn en formato Stata se utilizan los comandos

    .insheet, .infile o .infix, dependiendo del formato y disposicin de los datos

    .infile

    Este comando permite la lectura de archivos sin formato o con formato ASCII

    .infix e insheet

    Estos comandos sirven para leer datos desde un fichero auxiliar de formato fijo y

    hacer lectura recursiva de algn archivo, respectivamente.

    c. Guardar

    Para gravar un archivo de datos se utiliza el comando:

    .save nombre del archivo

    Stata graba el nuevo archivo en el directorio de trabajo y le aade automticamente la

    extensin .dta. Si lo que se desea es que el programa lo guarde en el directorio de

    trabajo predeterminado, Stata lo guardar por defecto siempre en c:\data. Debemos

    escribir .save y el nombre del archivo.

    Ahora bien, si se tiene el fichero con ese nombre y se quiere guardar una nueva

    versin del mismo, con algunas modificaciones, como por ejemplo, nuevas variables

    que hemos creado, se aade el comando .replace.

    .save, replace

    Si se desea grabar en otro directorio distinto de trabajo, se debe especificar:

    .save C:\econometria\nombre del archivo

  • 13

    d. Salir

    Para salir definitivamente del programa, se puede hacer por el men File, dando click

    en la X de la esquina superior derecha o utilizando directamente el comando exit. Hay

    que tener en cuenta que si se tienen los datos sin grabar, el programa pedir

    confirmacin.

    3.2 Describir, listar e inspeccionar

    a. Describir datos

    Para facilitar la explicacin de los comandos a partir de ahora se trabajar con los

    datos auto.dta, que vienen predefinidos como (data examples) en Stata. Se abren los

    datos:

    .sysuse auto.dta

    Una vez se tienen cargados los datos se puede empezar a trabajar con ellos. Lo

    primero que se hace es una descripcin bsica de la base de datos. El comando que se

    usa para describir la base de datos es:

    .describe

    O simplemente (d). Con esta opcin se puede ver cuntas observaciones y cuntas

    variables se tenan cuando se cre el archivo y qu tamao tiene; as como una

    descripcin de cada una de las variables con las que se puede trabajar. En el cuadro 3

    se muestra la salida en la ventana de resultados de Stata:

    Cuadro 3. Resultados del comando .describe

    En el siguiente apartado se explica otro de los comandos importantes para conocer la

    base de datos con la que se trabaja en un estudio economtrico.

    .::UdecomBooks::.

  • 14

    b. Inspeccionar datos

    .inspect

    Proporciona un resumen bsico del tipo de valores que tiene una variable numrica y

    un histograma de: valores positivos, nulos, negativos, enteros y no enteros de la

    variable, as como los valores missing que existen. Estos ltimos estn codificados en

    Stata como un punto (.) en las variables numricas y un espacio ( ) en las variables de

    texto. As, si se desea inspeccionar una sola variable, se deb escribir .inspect nombre

    de la variable; pero si queremos inspeccionar todas las variables se escribe

    simplemente .inspect o .inspect _all.

    La siguiente tabla representa los resultados que se obtienen con este comando al

    introducirlo en Stata con los datos de la base auto generada por el programa.

    Como se observa en la tabla, Stata arroja un grfico que muestra una estimacin de la

    distribucin de los datos de la muestra de la variable seleccionada. El grfico est

    comprendido entre los dos valores extremos que alcanza la variable y muestra una

    distribucin aproximadamente normal. Junto a esto, el programa muestra una tabla

    que indica si la variable toma valores negativos positivos o iguales a cero, adems de

    mostrar si presenta algn caso de missing o no.

    Otros dos comandos que sirven para inspeccionar los datos son:

    .edit

    Este comando permite editar la base de datos abriendo la ventana de editor de datos,

    mientras que el comando .browse permite ver y revisar los datos que se tienen

    cargados en Stata.

    c. Listar datos

    Igualmente, si se quiere obtener un listado de los valores que tienen las observaciones

    de una o ms variables, se usa el comando:

    .list

    (21 unique values)12 41 74

    # # # # . Missing - # # # Total 74 74 - # # # Positive 74 74 - # Zero - - - # Negative - - - Total Integers Nonintegers

    mpg: Mileage (mpg) Number of Observations

  • 15

    Si se desea un listado para todas las variables se usa el comando slo, pero si se quiere

    hacer un listado solo de los valores de una variable o de algunas, se escriben los

    nombres de las variables despus del comando: .list var1 var2.

    Se puede filtrar la lista de tres diferentes maneras, tal como lo muestra la siguiente

    lista de ejemplos:

    .list var1 var2 in 1/5

    Para listar las primeras 5 observaciones de las variables indicadas

    .list var1 in -5/-1

    Para listar las ultimas 5 observaciones de las variables seleccionadas

    .list var1 if var2 =0 Conserva las observaciones con precio positivo y elimina el

    resto.

    Por otro lado, el comando drop es el comando de la segunda opcin, el cual permite

    borrar de la memoria las variables u observaciones de la base de datos, conservando

    las restantes. Algunos ejemplos pueden ser:

    .::UdecomBooks::.

  • 16

    . drop price Elimina la variable Price

    . drop in 1/15 Borra las 15 primeras observaciones

    . drop if price

  • 17

    se han marcado explcitamente (, preserve) antes de abandonarlo. Tambin es posible

    poner etiquetas a las variables desplegando el men Data Labels.

    3.5 Creacin y modificacin de variables

    A continuacin se presentan algunas formas bsicas de crear y modificar variables

    entre las que se destacan: generar, recodificar, renombrar y organizar variables.

    a. Generar

    El comando ms simple y directo para crear nuevas variables es generate. La sintaxis

    bsica es:

    . generate newvar = expresin

    Es importante recordar que la expresin puede incluir cualquier operacin aritmtica,

    de relacin o funcional (ver Tabla 2). Tambin es importante tener en cuenta que este

    comando, como muchos otros de Stata, puede restringirse a determinados casos

    usando las condiciones (if in).

    Una extensin del comando generate es el comando egen.

    . egen

    Este comando puede utilizarse con determinadas funciones que se sealan a

    continuacin. Dependiendo de la funcin, los argumentos se refieren a una expresin,

    una lista de variables, etc. Las opciones tambin dependen de la funcin utilizada. A

    continuacin se da un ejemplo sencillo de cmo utilizar este comando.

    Se crea un archivo con cuatro observaciones:

    .set obs 4

    Se generar tres variables var1, var2 y var3:

    .generate var1=2

    .generate var2=4

    .generate var3=var1 + var2

    Se ha creado una base de datos con tres columnas (variables) y con cuatro

    observaciones, cada una. A continuacin, se crean dos nuevas variables var4 y var5.

    Var4 ser la suma acumulada de cada observacin de var3 (va sumando rengln tras

    rengln, el dato de la observacin fila por fila):

    .generate var4=sum(var3)

    .::UdecomBooks::.

  • 18

    Y var5, ser la suma acumulada final de la variable var3:

    .generate var5=sum(var3)

    Para generar una variable con el nmero de una observacin en la base de datos se

    puede usar:

    .generate id=_n

    Otra opcin que permite este comando es generar una variable dummy:

    .generate dummy1=sexo==2

    Con este comando se crea una variable dummy que es igual a 1 si sexo=2 y cero en

    otro caso.

    Tambin se puede crear de esta otra forma:

    .generate dummy1=0

    .generate dummy1=1 if sexo==2

    En cualquiera de estos casos se debe tener cuidado si hay valores missing, puesto que

    se estara asignando un cero a algo que en realidad es un missing. Para arreglar este

    problema tenemos:

    .replace dummy1= if sexo== .

    b. Recodificar

    Este comando puede cambiar el valor de una variable determinada.

    .recode var1 2=0

    Algunas encuestas vienen con los missing codificados, estos se pueden convertir

    nuevamente en missing.

    .recode va1 999=.

    Tambin se puede recodificar una variable. Por ejemplo; recodificando la edad en

    rangos:

    .recode edad 15/25=1 26/35=2 36/45=3 46/55=4 56/65=5 *=9

    Otros ejemplos son:

    .recode edad 0/25=1 25/50=2 50/max =3, gen(edad_agrupada)

    .recode x (1 2 3=1) (4 5 6 =2), gen(n_x)

  • 19

    c. Renombrar

    Cambia el contenido de una variable ya existente.

    .replace

    As, si se desea que en la variable edad todas las observaciones que tienen una edad

    mayor o igual a 65 tomen el valor de 65, entonces se usa el siguiente comando:

    .replace edad=65 if edad=65

    d. Renombrando variables

    Un comando muy til para renombrar algunas variables ya existentes es:

    .rename

    Este comando puede cambiar los nombres de las variables para que se ajusten a

    nuestro inters, hacer ms cortos los nombres o ms familiares.

    e. Otros comandos: sort, gsort

    Es muy frecuente la necesidad de organizar una base de datos segn una o varias

    variables, dando prioridad al orden de la variable que se pone en primer lugar y as

    sucesivamente. Por defecto este comando ordena las observaciones de menor a

    mayor.

    .sort var1

    El comando anterior ordena las observaciones de menor a mayor segn var1

    .sort var1 var2

    El comando anterior ordena las observaciones por la variable 1 y dentro var1, se

    ordena de menor a mayor segn la variable 2.

    Un comando que permite elegir como se debe ordenar cada variable, y a su vez,

    permite cambiar entre descendente o ascendente para cada variable es:

    .gsort +var1 var2

    Con este comando ordenamos var1 de menor a mayor y var2 de mayor a menor

    3.6 Combinacin de bases de datos

    a. Comando merge

    Este comando sirve para aadir variables a un archivo de datos que tenemos abierto.

    Esto es, pegar datos de forma horizontal, o sea, aadir variables a las observaciones

    .::UdecomBooks::.

  • 20

    existentes. Hay que tener en cuenta que no se requiere que los dos archivos de datos

    tengan exactamente las mismas observaciones. Este comando es muy apropiado

    cuando se tienen datos de los individuos que participan en una encuesta y se reciben

    datos de un segundo modulo de la encuesta. Por ejemplo, la Encuesta Nacional de

    Hogares (ENH), Encuesta Continua de Hogares (ECH) y la Gran Encuesta Integrada de

    Hogares (GEIH), realizada por el Departamento Administrativo Nacional de

    Estadsticas (DANE).

    Para poder llevar a cabo con xito esta orden, ambos conjuntos de datos deben estar

    ordenados con base a las mismas variables y en el mismo orden. Entonces, este

    comando se usa con el siguiente orden. Primero se abre el archivo de datos (.use), en

    segundo lugar se ordenan las variables, en este caso se supone que las variables

    ordenadas son var1 y var2 (.sort) y en tercer lugar se hace el Merge:

    . merge var1 var2 using ECH

    Noten que merge crea una variable adicional _merge, esta variable puede tomar tres

    valores que nos sirven para revisar si estamos trabajando correctamente con la base

    de datos. Esta variable toma los siguientes valores:

    .merge==1 para las observaciones del fichero master

    merge==2 para las observaciones del fichero using

    merge==3 para las observaciones presentes en ambos ficheros

    Recuerde que en ocasiones se puede tener una nueva versin de algunas variables

    que pueden combinarse con las anteriores con la opcin update replace.

    .merge using filename, update replace

    f. Comando append

    El comando append es muy til para unir archivos de datos. Esto es, pegar datos de

    forma vertical en una base de datos. Al contrario de merge con el que se agregan

    variables, este comando agrega observaciones.

    . append

    Este comando aade un fichero de datos con formato Stata al final del archivo que se

    tiene abierto. Es una combinacin vertical de bases de datos, aadiendo al final del

    archivo que est abierto las observaciones. Para el uso de este comando no se

    requiere que los dos ficheros de datos tengan exactamente las mismas variables.

    g. Comando joinby

    Este comando puede crear diferentes combinaciones entre varias bases de datos. Y

    crea un archivo de datos con todas las parejas entre ficheros. Lo primero es abrir el

    archivo de datos (.use) y posteriormente

  • 21

    . joinby idenh using varfam

    Con este comando combinamos, usando una variable de identificacin del hogar

    denominada varfam, variables familiares.

    Otros comandos importantes para la combinacin de bases de datos son:

    .cross

    Este comando crea todas las posibles combinaciones entre ambos ficheros.

    . fillin

    Este comando rellena con observaciones todas las posibles combinaciones de un

    listado de variables. Los valores de otras variables, aparte de las que definen el

    relleno, se asignan a missing. Esta opcin es buena cuando se trabajan datos

    longitudinales para balancear datos de panel.

    3.7 Archivos log, do y ado

    Primero, se describe el papel de los archivos log file para, posteriormente, pasar a los

    do file y finalmente a los ado file. Se observa que en la ventana de resultados no se

    muestran todos los resultados de la sesin, slo los ltimos, y puede ocurrir que tras

    ejecutar una orden que genera un output, especialmente largo, slo se tenga en

    memoria la ltima parte. Por ello, la forma normal de trabajar es abrir un fichero log

    al principio de la sesin. Los ficheros log contienen los comandos y los resultados del

    anlisis (no los grficos), este tipo de archivos se pueden abrir por Stata o por un

    procesador de texto. Tambin, pueden crearse los archivos log (por defecto), en un

    formato de Stata (.smcl). Algunos ejemplos de este tipo de archivos son:

    a. log file

    .log

    Al principio de cada sesin de trabajo se debe crear un archivo log. Esto se puede

    realizar mediante el men File de la barra de herramientas donde damos en Begin:

    .::UdecomBooks::.

  • 22

    Una vez hecho esto, se guarda el archivo en formato *.log con el nombre que se

    desea. Tambin es posible realizarlo mediante el uso de comandos, tal como se

    menciona a continuacin.

    . log using nombre del archivo

    Por defecto tiene formato *.smcl (Stata Markup Control Language).

    Si se desea que el archivo se pueda abrir en un procesador de texto el comando seria:

    . log using nombre del archivo.log

    Este ltimo tiene formato ASCII, y se puede abrir en el block de notas, como un

    archivo de texto *.txt.

    Con los comandos log se puede usar entonces dos nuevos comandos.

    El primero es: log using carlos.log, append el cual es similar al comando log using,

    pues si existe ya otro fichero con el mismo nombre, continua grabando encima del

    archivo.

    El segundo comando es: log using carlos.log, replace, el cual lo que hace es

    reemplazar el archivo ya existente por el nuevo.

    Para ver el log file, usamos el comando (. view).

    . view carlos.log

    Stata tambin permite abrir o convertir el logfile a un formato de texto y poder

    abrirlo en cualquier procesador de texto.

    . translate carlos.smcl to hw1.txt

    Igual resultado se obtiene, con el siguiente comando:

    . translate carlos.smcl to hw1.log

    Una vez se abre el archivo log en una sesin iniciada en Stata, la grabacin de este

    puede ser se puede interrumpir o reanudar temporalmente interrumpida con el

    comando log off o reanudada con el comando log on.

    Stata permite tambin que se pueden introduzcan comentarios en el log a travs de

    lneas que empiezan por *. Por ejemplo:

    *INTRODUCCION Y ANALISIS DE DATOS*

    ******INTRODUCCION Y ANALISIS DE DATOS******

    Basta con un asterisco al principio, pero con muchos (*) el comentario resalta ms y

    es de ms ayuda para leer fcilmente el log.

  • 23

    El log se cierra automticamente al salir de Stata pero tambin se puede cerrar en

    cualquier momento de la sesin o al final de la sesin con los siguientes comandos:

    . log close

    . cmdlog close

    b. Do file

    Los do files son ficheros que contienen una lista ordenada de instrucciones de Stata,

    que se ejecutan de una sola vez. Se crean, graban, cargan, modifican y ejecutan

    utilizando el do file Editor, aunque tambin pueden utilizarse otros editores de texto

    para escribir las instrucciones (se recomienda el block de notas). Son especialmente

    tiles cuando se desean utilizar los mismos comandos de forma repetida sobre

    muestras distintas, o bien reproducir los resultados con algunos cambios. A menudo

    incorporan la utilizacin de programas definidos por el usuario, as como instrucciones

    para crear los oportunos ficheros Log en los que se graban los resultados.

    Los comandos se pueden escribir en cualquier editor de texto o en el editor de texto

    de Stata (Do-file editor).

    El Dofile se realiza dando click en el cono que abre la ventana New Do-file Editor,

    ubicado justo debajo de la barra de herramientas clsica. Una vez abierto, el usuario

    se encuentra frente a una ventana en blanco para iniciar la realizacin del archivo Do.

    Es importante tener en cuenta que se debe preceder de un asterisco (*) cualquier

    ttulo, anotacin o comentario que se desee incorporar al archivo: estos aparecern

    de color verde. Los comandos se escriben cada uno en diferentes lneas y aparecern

    en color azul oscuro, acompaados de las variables que estarn en negro. Los

    comandos que abren una nueva base de datos estarn escritos de color rojo oscuro en

    el archivo.

    En general, un Dofile lucira as:

    Cuadro 4. Ventana del Dofile Editor

    .::UdecomBooks::.

  • 24

    El nico comando que se desconoce del ejemplo anterior es .set more off. Este

    comando es til cuando la extensin de los resultados (en la ventana de resultados)

    supera una pgina, entonces Stata pausa el proceso y pregunta si se desea continuar

    con la opcin more. El comando set more off, nos permite hacer el do file sin pausas.

    La opcin contraria es .set more on.

    Para ejecutar un archivo do y mostrar los resultados, se utiliza el siguiente comando:

    . do carlos.do

    Con esto, una vez reiniciado el programa, el archivo le permite al usuario volver a

    correr los comandos guardados en el Dofile y ver todos los resultados en la ventana

    Results de Stata.

    Por el contrario, para ejecutar un archivo do y no mostrar los resultados, se utiliza:

    .run carlos.do

    El uso real de Stata se apoya normalmente en la construccin y ejecucin de archivos

    do file, ms que en la forma interactiva de trabajo. Por eso, la importancia de estos

    comandos, log, do y ado. Recordemos que los do files son archivos de comandos,

    mientras que los ado son macro archivos de programacin.

    c. Archivos ado file:

    Un fichero ado file (que se refiere a un authomatic do file), es como un archivo do,

    es decir, es un archivo que contiene una serie de lneas de programacin Stata. Sin

    embargo, a diferencia de un fichero do, el ado debe que estar archivado en

    determinados directorios y se ejecuta de la misma forma que los dems comandos de

    Stata. Los archivos ado se pueden buscar con el comando .sysdir, y los encontraremos

    en el directorio preestablecido previamente por Stata o por el autor del archivo ado.

    Este tipo de archivos se ejecuta igual que cualquier comando de Stata. Hay que tener

    en cuenta que si no se ha creado o se est apenas creando, lo primero es guardarlo

    en un directorio predefinido que est usando Stata para luego usar la opcin do.

    .do nombre del ado

    Este comando le dice a Stata que lea el archivo do. Despus este se debe ejecutar

    dndole el nombre del ado. Por otra parte, algunos econmetras han escrito

    programas ado que hoy en da se pueden encontrar publicados en el Stata Technical

    Bulletin, o directamente en la pgina web de Stata en forma de ado files. Como ya se

    mencion, estos programas ado se pueden descargar desde Internet de manera

    permanente de tal forma que Stata los reconozca como si fueran comandos internos

    (predefinidos) del programa. Estos archivos en su mayora vienen acompaados de un

    archivo que explica exactamente la sintaxis y el funcionamiento del nuevo comando.

    Entre los ado files que pueden descargarse de Internet se encuentran las

    actualizaciones oficiales de Stata.

  • 25

    Para buscar e instalar ado files sobre, por ejemplo, desigualdad, hacemos:

    Help Search Search net resources inequality (=palabra clave)

    Esto genera una lista de ados, con una pequea descripcin. Se entra en los que

    interesan y, si se desea instalarlos, se siguen las instrucciones (click here to install).

    4. Comentarios finales

    El econometrista tiene una amplia gama de software entre los que se puede permitir

    hacer una eleccin minuciosa de un programa que vaya acorde a las diferentes

    necesidades. Stata es una herramienta utilizada alrededor del mundo pues, adems

    de la facilidad y rapidez para su uso, presenta otras mltiples ventajas, no solamente

    para los estudiantes y principiantes en el manejo de software de este tipo, sino

    tambin para usurarios ms experimentados que tienen certeza sobre la superioridad

    del programa.

    Una vez los usuarios se hayan iniciado en Stata con los elementos bsicos

    anteriormente descritos, puede dar paso ahora al manejo completo del programa

    haciendo uso de nuevas herramientas que el software proporciona.

    5. Bibliografa

    Acock, A. C. (2006) A Gentle Introduction to Stata, Third edition. Stata Press

    Adkins L.C y Carter R. (2008). Using Stata for Principles of Econometrics. Wiley.

    Baum C. F. (2006) An Introduction to Modern Econometrics Using Stata. Stata

    Press

    Becker, Gary S. (1964) Human Capital: A theorical and empirical analysis, with

    special reference to education. New York.

    Blossfeld H-P., Golsch K., Rohwer G. (2007) Event History Analysis with Stata.

    Cameron A.C y Trivedi P.K (2009). Microeconomtrics using Stata. Stata Press

    Cleves M., Gould W., Gutierrez R., Marchenko Y. (2002) An Introduction to

    Survival Analysis using Stata. Thrid edition. Stata Press

    Chiswik, Barry (2003) Jacob Mincer, Experience and the distributions of

    earnings. Institute for the study of labor (IZA). IDEAS

    Gujarati (2010) Econometra. Mxico. Mc Graw Hill

    Gould W., Pitblado J., Sribney W. (2006) Maximum likelihood Estimation with

    Stata. Stata Press

    Hamilton, L.C. (2009). Statistics with STATA 8. Belmont, CA: Duxbury Press

    Kohler, U. y Kreuter, F. (2009). Data Analysis Using Stata. College Station, TX:

    Stata Press

    Long, J. S. (2009) The Workflow of Data Analysis Using Stata. Stata Press.

    Mincer, J. (1974) Schooling, experience and earnings, Columbia University

    Press.

    Mitchell M. (2008) A visual guide to Stata Graphics. Stata Press

    Murray, M. (2006) Econometrics: a modern introduction. Ed. Pearson

    .::UdecomBooks::.

  • 26

    Pollock, Ph. H. (2006) A Stata Companion to Political Analysis. Washington, CQ

    Press.

    Rabe-Hesketh, S. y Everitt, B. (2004). A Handbook of Statistical Analysis Using

    STATA, London: Chapman & Hall/CRC Press

    Newton J., Cox N. (2003) Seventy-six Stata tips

    STATA CORP (2008). Users Guide, Reference Manual Release 10. Stata Press.

    Wooldridge, J. (2006) Introduccin a la econometra. Un enfoque moderno. Ed.

    Thomson

    Algunos recursos en Internet para usuarios Stata:

    http://www.ats.ucla.edu/stat/stata/

    http://econpapers.hhs.se/paper/bocbocoec/531.htm

    http://fmwww.bc.edu/ec/res.info.php

    http://ideas.repec.org/s/boc/bocins.html

  • 27

    Anexo 1:

    Introduccin a Stattransfer

    Un excelente complemento para los usuarios de Stata es el software Stattransfer

    (www.stattransfer.com) y/o (www.stata.com). Este programa es de gran utilidad para

    la conversin de bases de datos de un formato a otro. Por ejemplo, si se tiene acceso

    a unos datos en SPSS, Epi-info, SAS, Excel, o datos en otro formato; con Stattransfer se

    pueden convertir a archivos de Stata con mucha facilidad.

    El programa no slo permite pasar a Stata, sino que convierte los datos que se tengan

    en cualquier otro formato, si se desea. Es importante aclarar que Stattransfer no tiene

    todos los formatos en los que se puede trabajar una base de datos, pero si tiene una

    amplia gama de programas estadsticos y economtricos que son convencionalmente

    usados en la docencia y la investigacin econmica.

    En el Cuadro 2 se presenta la salida inicial de Stattransfer 9. A continuacin, se hace

    una breve descripcin de cmo usar este programa para convertir bases de datos a

    diferentes extensiones. El programa tiene un men de opciones que no es necesario

    saber usar para convertir una base de datos de una extensin o formato a otra. No se

    profundizar en este men dado que presenta opciones avanzadas son opciones para

    expertos y la idea es slo introducir al lector en el uso de este programa.

    Se puede observar que el programa tiene dos opciones: tipo de datos de entrada

    (Input File Type) y tipo de datos de salida (Output File Type), en la primera de ellas se

    selecciona la extensin o programa en el que se tiene la base de datos, e

    inmediatamente en la parte de abajo se selecciona la ubicacin donde se encuentra el

    archivo (se puede hacer con browse o view), as, con el paso anterior, el programa

    identifica el archivo y formato o programa en el cual se tienen originalmente los datos.

    Ahora bien, el siguiente paso es seleccionar la extensin o programa en el que se

    desea tener los datos, esto se hace en la opcin tipo de datos de salida, y, una vez

    seleccionado un formato, en la parte inferior elegimos el folder o carpeta donde

    queremos guardar la nueva base de datos convertida a la extensin que hemos

    seleccionado. Tenga en cuenta que Stattransfer le dar automticamente la misma

    ubicacin al nuevo archivo donde se encuentran los datos originales.

    Seleccionados el tipo de datos de entrada y el tipo de datos de salida, y sus respectivas

    ubicaciones se activar la opcin transfer, con darle click, el programa empezar a

    transformar los datos a la nueva extensin. Una vez termina podemos ver el nuevo

    archivo creado con la extensin que se ha predefinido; tambin se puede iniciar otro

    proceso de conversin con la opcin reset o salir del programa con exit.

    .::UdecomBooks::.

  • 28

    Cuadro 2 Salida inicial de Stattransfer 9

  • DESCRIBIENDO Y GRAFICANDO DATOS EN STATA

    Carlos Giovanni Gonzlez Espitia

    Email: [email protected] Departamento de Economa

    Universidad Icesi

    Resumen

    Este documento est dirigido a todos los estudiantes, profesores e investigadores en

    economa deseosos de hacer anlisis de estadsticas descriptivas, tablas y grficos en

    Stata.

    Palabras clave: Econometra, software economtrico, Stata. Clasificacin JEL: C01, C87.

    Stata es una marca registrada de Stata Corporation. Copyright 19962010 StataCorp LP, 4905

    Lakeway Drive, College Station, TX 77845 USA. Las opiniones contenidas en este documento, los errores u omisiones son de exclusiva responsabilidad del autor.

    .::UdecomBooks::.

  • 2

    1 Introduccin

    En esta sesin se mencionarn distintas herramientas que proporciona Stata para analizar los datos, como un primer paso. Las formas ms utilizadas para esto es mediante tablas estadsticas y el anlisis grfico. Para empezar a usar Stata, se har una breve descripcin de las estadsticas descriptivas y los grficos que ofrece Stata, ya que estos son fundamentales para hacer un buen anlisis previo de los datos que se tienen antes de la realizacin de las regresiones economtricas. El objetivo es acercar a los interesados en la econometra a uno de los pasos fundamentales de todo anlisis economtrico, en este caso, el procesamiento y comprensin de los datos con los que se est trabajando. De hecho, antes de realizar la estimacin de cualquier modelo, el econometrista se enfrenta a descargar los datos a un software en el cual pueda trabajar. Una vez se han sido cargados los datos en Stata, el paso siguiente es el procesamiento de los mismos. Este paso es de vital importancia pues, los investigadores deben tener presente la estructura de datos con la que estn trabajando a lo largo del desarrollo del ejercicio. Obtener algunas estadsticas descriptivas de la base de datos es fundamental para analizar fcilmente el comportamiento de las variables que se usarn en un futuro para realizar las regresiones. Finalmente, es importante poder hacer grficos y tablas que permiten, en muchos casos, hacer un anlisis intuitivo del comportamiento de las variables y de los datos. Con base en lo anterior, este documento se estructura en cuatro secciones. La primera de ellas es esta introduccin, donde se presenta la motivacin para iniciar al usuario al anlisis de datos, siendo esto parte fundamental del trabajo del econometrista. En la segunda seccin se hace muestra de las estadsticas descriptivas bsicas mediante tablas que proporciona el software. En la tercera parte, se hace una introduccin al anlisis grfico como una opcin alternativa para el usuario en la revisin de los datos. En la cuarta y ltima seccin, se hacen unos breves comentarios finales intentando introducir al lector al siguiente documento, mostrando tambin la bibliografa que se utiliz para la construccin del documento.

    2 Estadsticas descriptivas

    En econometra, despus de obtener los datos y organizarlos es necesario realizar algunas estadsticas bsicas para familiarizarnos con las variables de la base de datos. Es por ello que en esta seccin se presentan algunos de los comandos bsicos que tiene predefinido Stata para realizar estadsticas descriptivas. Para una mejor explicacin de la realizacin de las estadsticas descriptivas, en esta sesin se utilizar como ejemplo la base de datos WAGE1.RAW tomada de Wooldridge (2002).

  • 3

    a. Estadsticas descriptivas bsicas

    El comando summarize obtiene las estadsticas descriptivas bsicas de las variables que tengamos en la base de datos. .summarize

    La tabla que arroja Stata tras introducir este comando es la siguiente:

    Tabla 1. Estadsticas descriptivas bsicas

    Como se observa, este comando permite obtener, por ejemplo, la media que representa el valor promedio que alcanza determinada variable en la muestra con la que se trabaja; la desviacin estndar, que representa el valor promedio en que se desvan las observaciones de la media muestral; el valor mnimo y el valor mximo que alcanzan las variables dentro de la muestra, y el nmero de observaciones que se tienen para cada variable de la base de datos. Para la realizacin de la descripcin estadstica de cada una de las variables por separado, se debe utilizar el mismo comando anterior pero con la especificacin de la variable que se desea describir: .summarize var1

    tenursq 526 78.15019 199.4347 0 1936 expersq 526 473.4354 616.0448 1 2601 lwage 526 1.623268 .5315382 -.6348783 3.218076 servocc 526 .1406844 .3480267 0 1

    clerocc 526 .1673004 .3735991 0 1 profocc 526 .3669202 .4824233 0 1 profserv 526 .2585551 .4382574 0 1 services 526 .1007605 .3012978 0 1 trade 526 .2870722 .4528262 0 1

    trcommpu 526 .0437262 .20468 0 1 ndurman 526 .1140684 .318197 0 1 construc 526 .0456274 .2088743 0 1 west 526 .1692015 .3752867 0 1 south 526 .3555133 .4791242 0 1

    northcen 526 .2509506 .4339728 0 1 smsa 526 .7224335 .4482246 0 1 numdep 526 1.043726 1.261891 0 6 married 526 .608365 .4885804 0 1 female 526 .4790875 .500038 0 1

    nonwhite 526 .1026616 .3038053 0 1 tenure 526 5.104563 7.224462 0 44 exper 526 17.01711 13.57216 1 51 educ 526 12.56274 2.769022 0 18 wage 526 5.896103 3.693086 .53 24.98

    Variable Obs Mean Std. Dev. Min Max

    .::UdecomBooks::.

  • 4

    Este comando obtiene las estadsticas descriptivas de la variable var1. Se puede tambin usar el comando para obtener las estadsticas de un conjunto de variables a la vez: .summariza var1 var2 var3

    Igualmente, se puede entrar en detalle de las estadsticas descriptivas de la siguiente manera: .summarize var1, detail

    La siguiente tabla muestra los detalles que se obtienen con el uso de este comando:

    Tabla 2. Estadsticas descriptivas en detalle

    Como se observa, para la variable aos de educacin (Wooldridge (2002)), se obtuvo la descripcin por percentiles de la muestra, adems de la media, la desviacin estndar, la varianza, la asimetra y la curtosis.

    b. Tablas

    Con frecuencia, es necesario realizar tablas con algunas estadsticas como las frecuencias, entre otras. Por esto, en esta seccin se introduce el tema de cmo realizar algunas tablas que permitan obtener mayor informacin estadstica y dems informacin relevante para el anlisis de los datos. El comando que nos permite obtener una tabla con la frecuencia de una o dos variables es: . tabulate, var1

    Lo que se observa en la ventana de resultados tras digitar dicho comando es:

    99% 18 18 Kurtosis 4.88424595% 17 18 Skewness -.619574190% 16 18 Variance 7.66748575% 14 18 Largest Std. Dev. 2.76902250% 12 Mean 12.56274

    25% 12 3 Sum of Wgt. 52610% 9 2 Obs 526 5% 8 0 1% 4 0 Percentiles Smallest

    years of education

  • 5

    Tabla 3. Frecuencias de los aos de educacin

    Este comando permite obtener la frecuencia de los datos. Por defecto, aparecen las frecuencias absolutas, las porcentuales y las porcentuales acumuladas. Algunas opciones adicionales para este comando son: . tabulate var1, plot

    . tabulate var1, nolabel

    Con la primera opcin se obtienen las frecuencias absolutas junto con un pequeo grfico de barras que representa dichas frecuencias. Con la segunda opcin, se obtienen en la tabla los valores de las variables, en lugar de las etiquetas de esos valores, eso si, solamente cuando se tiene asignada una etiqueta a dichos valores. Adicionalmente a esto, el comando tabulate arroja tambin tablas de cruce de variables (tambin llamadas tablas de doble entrada). As por ejemplo, si se desea cruzar la variable 1 con la variable 2, simplemente se introduce: .tabulate var1 var2

    A continuacin se muestra el uso de este comando haciendo una tabla de cruce entre la variable aos de educacin y la variable gnero, esta ltima siendo una variable dummy que toma el valor de 1 si se trata de una mujer y 0 en caso contrario.

    Total 526 100.00

    18 19 3.61 100.00 17 12 2.28 96.39 16 68 12.93 94.11 15 21 3.99 81.18 14 53 10.08 77.19 13 39 7.41 67.11 12 198 37.64 59.70 11 29 5.51 22.05 10 30 5.70 16.54 9 17 3.23 10.84 8 22 4.18 7.60 7 4 0.76 3.42 6 6 1.14 2.66 5 1 0.19 1.52 4 3 0.57 1.33 3 1 0.19 0.76 2 1 0.19 0.57 0 2 0.38 0.38

    education Freq. Percent Cum. years of

    .::UdecomBooks::.

  • 6

    Tabla 4. Tabla de doble entrada: aos de educacin vs. gnero

    Por defecto, con este comando aparecen slo las frecuencias absolutas. Sin embargo, algunas de las opciones que se pueden especificar son: .tabulate var1 var2, row .tabulate var1 var2, col .tabulate var1 var2, cell .tabulate var1 var2, nofreq .tabulate var1 var2, nolabel

    .tabulate var1 var2, missing .tabulate var1 var2, chi

    Frecuencias relativas horizontales Frecuencias relativas verticales Frecuencias relativas totales No presenta las frecuencias absolutas Idntico a .tabulate var1 var2 Frecuencias con el porcentaje de valores missing Frecuencias con el estadstico chi2

    Con la opcin chi2 junto al comando tabulate, se calcula el coeficiente de chi cuadrado de Pearson para la hiptesis de que las filas y columnas, en una tabla de dos variables, son independientes. Existen, adems, dos extensiones de este comando que resultan frecuentemente muy tiles: tab1 y tab2. .tab1 var1 var2 var3

    Con la primera opcin, se obtienen tablas de frecuencias separadas de una lista de variables.

    Total 274 252 526

    18 13 6 19 17 10 2 12 16 45 23 68 15 12 9 21 14 31 22 53 13 14 25 39 12 85 113 198 11 17 12 29 10 13 17 30 9 8 9 17 8 15 7 22 7 2 2 4 6 4 2 6 5 0 1 1 4 3 0 3 3 1 0 1 2 1 0 1 0 0 2 2

    education 0 1 Total years of =1 if female

  • 7

    .tab2 var1 var2 var3

    Con la segunda opcin, se pueden obtener tablas de frecuencias para cada variable. Otras dos opciones para realizar tablas que permitan analizar las estadsticas descriptivas de la base de datos son: .tabstats y .table. El primer comando es una opcin muy recurrida para construir tablas con estadsticos:

    .tabstat

    Este comando puede calcular las estadsticas que se desean de las variables. Por ejemplo el mnimo, la mediana, la media, el mximo, el tamao de la muestra y el coeficiente de variacin.

    .tabstat var1 var2 (min median mean max n cv)

    Por otro lado, con el comando .table se pueden crear tablas de estadsticos controlando el contenido de cada casilla. Por ejemplo, crear una tabla cruzada de dos variables var1 y var2, y que est controlada por la media de la var3, se introduce: .table var1 var2, cont(mean var3)

    La tabla que Stata muestra en la ventana de resultados es:

    Tabla 5. Estadsticos controlando el contenido de cada casilla

    Esta tabla revela entonces el nmero de aos de educacin para los individuos de la muestra separndolos entre mujeres y hombres media la variable dummy female.

    18 10.6154 12.1667 17 14.9 5.5 16 12.8667 11.3478 15 14.5833 11.7778 14 17.9032 13.6364 13 18.5 12.88 12 16.8118 19.1504 11 14.3529 13.3333 10 20.9231 10.1765 9 16.125 15.7778 8 30.2667 33.8571 7 32 30.5 6 37.75 16 5 34 4 41 3 51 2 39 0 32

    education 0 1years of =1 if female

    .::UdecomBooks::.

  • 8

    c. Correlaciones

    Otro estadstico relativamente importante en econometra es el anlisis de correlaciones. El comando para realizar correlaciones es: .correlate var1 var2

    Esta opcin es til cuando se tienen dos variables, pero tambin puede utilizarse cuando se tienen ms de dos variables, de la siguiente manera: .correlate var1 var2 var3 var4

    As, con el comando anterior, se calcula el coeficiente de correlacin de Pearson y aparecer, como se muestra a continuacin, una matriz de correlaciones. Al igual que con todos los comandos anteriores, podemos usar filtros para usar slo una parte de la muestra o usar alguna variable de control.

    Tabla 6. Matriz de correlaciones

    Esta tabla ensea todas las correlaciones que hay entre dos de las cinco variables especificadas: se trata de una matriz diagonal.

    d. Algunos tests de comparacin de medias

    En ocasiones es necesario hacer una comparacin de medias antes de pasar a hacer la estimacin del modelo. Utilizando el comando ttest. Este comando se utiliza introduciendo en la ventana de comandos de Stata lo siguiente: ttest var1, by(var2)

    Con esto, se obtiene un test de comparacin de medias donde se puede contrastar la hiptesis de que las medias de la variable (var1) son iguales y no dependen de la variable (var2).

    married 0.0689 0.3170 0.2173 -0.1661 1.0000 female -0.0850 -0.0416 -0.0279 1.0000 expersq -0.3313 0.9610 1.0000 exper -0.2995 1.0000 educ 1.0000

    educ exper expersq female married

  • 9

    Tabla 7. Test de comparacin de medias

    Para que sean significativas las diferencias es necesario observar si el valor p de la Hiptesis alternativa (Ha) es cercano a cero (0,000). Como en general se sabe, un valor de 0.05 indica un t de 1,96.

    3 Grficos

    Realizar algunos grficos es esencial en econometra por lo cual esta seccin se dedica a explicar brevemente como realizar algunos grficos en Stata. En ocasiones los grficos permiten hacer anlisis intuitivo del comportamiento de algunas variables o de cmo se relacionan entre ellas. Stata ofrece numerosas posibilidades y opciones para realizar grficos. Algunos de los comandos para realizar grficos son: .graph twoway

    .graph matrix

    .graph bar

    .graph dot

    .graph box

    .graph pie

    Se puede obtener ayuda para cada uno de estos grficos con el comando .help. .help twoway

    As se puede hacer con todas las opciones antes descritas. help graph/matrix/bar,.etc. Algunos comandos que permiten grabar grficos y vuelven a dibujar grficos previamente guardados son: .graph save

    .graph use

    .graph display

    Pr(T < t) = 0.9744 Pr(|T| > |t|) = 0.0513 Pr(T > t) = 0.0256 Ha: diff < 0 Ha: diff != 0 Ha: diff > 0

    Ho: diff = 0 degrees of freedom = 524 diff = mean(0) - mean(1) t = 1.9535

    diff .4708609 .2410361 -.002655 .9443767

    combined 526 12.56274 .1207351 2.769022 12.32555 12.79992

    1 252 12.31746 .1557618 2.472642 12.01069 12.62423 0 274 12.78832 .1814107 3.002882 12.43118 13.14546

    Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]

    Two-sample t test with equal variances

    .::UdecomBooks::.

  • 10

    .graph combine

    Los comandos que permiten imprimir grficos son: .graph print

    .graph printcolor

    .graph export

    Los comandos que permiten realizar operaciones con los grficos que estn en la memoria son: .graph display

    .graph dir

    .graph rename

    .graph copy

    .graph drop

    a. Diagrama de dispersin (scatter)

    Uno de los grficos ms comunes en econometra es el diagrama de dispersin. Con el comando scatter se pueden representar las observaciones en una nube de puntos. Con las opciones line se unen las observaciones, y la opcin connected une las observaciones representadas por los puntos. .scatter var1 var2

    Grfico 1. Diagrama de dispersin entre dos variables

    El diagrama anterior muestra entonces la dispersin entre dos variables: var1 y var2. La opcin anterior muestra cmo se puede hacer un slo grfico; sin embargo tambin existe la posibilidad de hacer varios grficos.

    1020

    3040

    var1

    2,000 3,000 4,000 5,000var2

  • 11

    .scatter var1 var2, by(foreign, total)

    En este tipo de grficos tambin se puede agregar la lnea de regresin. Ya que con el comando scatter slo aparece la nube de puntos, se debe agregar el comando line.

    b. Grficos de cajas (Box Plots)

    Los grficos de cajas proporcionan informacin bsica sobre la distribucin de las variables, adems de que permite observar la asimetra y los outliers (valores atpicos). Para la realizacin de este tipo de grficos se utiliza el comando de la siguiente manera: .graph box var1

    Una vez digitado el comando acompaado de la variable de inters, Stata abre una nueva ventana que muestra el siguiente grfico:

    Grfico 2. Grfico de cajas (Box Plots)

    c. Grficos de barras

    sta es una de las opciones ms comunes de grficos que se pueden encontrar para analizar tanto la evolucin de una variable como su comportamiento. Con esta opcin se pueden realizar grficos de barras en presentacin vertical (.graph bar) y tambin horizontal (.graph hbar). Hay que tener cuidado pues el eje Y es la variable numrica y el eje X es la variable categrica.

    05

    1015

    20ye

    ars

    of

    edu

    catio

    n

    .::UdecomBooks::.

  • 12

    Tambin es importante recordar que la media de la variable numrica puede ser sustituida por cualquier estadstico (mean, median, min, max, sum, count, .etc). A continuacin se presenta un ejemplo.

    .graph bar var1, over(var2)

    El comando graph bar var1 realiza entonces el grfico con barras verticales, mientras que graph hbar var1 lo hace con las barras horizontales. A continuacin se muestran las dos opciones:

    Grfico 3. Grficos de barras

    Tambin se puede hacer el grfico con las estadsticas descriptivas:

    .graph bar (mean) var1, over(var2)

    Grfico 4. Grfico con las estadsticas descriptivas

    05

    1015

    20

    mean of wage mean of expermean of educ

    0 5 10 15 20

    mean of wage mean of expermean of educ

    05

    10m

    ean

    o

    f wa

    ge

    0 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

  • 13

    d. Grficos de dos variables

    Estos son los grficos ms comunes, se pueden hacer grficos de lneas, reas, barras entre otros muchos para una combinacin de dos variables. Por ejemplo, la evolucin de un precio en el tiempo. El comando es: . twoway

    Grfico 5. Grfico de lneas entre dos variables

    e. Histogramas

    Con este comando se pueden hacer histogramas de variables continuas y discretas. Permite la opcin fweiht y la opcin by. La opcin por defecto sobrepone al histograma el grfico de una distribucin normal. .histogram var1

    Este comando arroja un grfico como el siguiente:

    Grfico 6. Histograma de una variable

    1020

    3040

    var1

    2,000 3,000 4,000 5,000var2

    0.02

    .04

    .06

    .08

    .1

    Den

    sity

    10 20 30 40var1

    .::UdecomBooks::.

  • 14

    Como se observa en el grfico, el histograma lo que muestra es la tendencia de la variable. Las barras hacen una aproximacin a la distribucin de la variable a lo largo de la muestra. Igualmente, es posible realizar un histograma de frecuencias y distribuciones de densidad de Kernel utilizando los comandos histogram y kdensity respectivamente. Ambas funciones se pueden combinar en un solo grfico como se muestra aqu:

    Grfico 7. Histograma y Kernel

    Para obtener el grfico anterior, se debe utilizar los comandos mencionados de la siguiente manera: .histogram wage, freq kdensity xaxis(1 2) ylabel(0(20)150,grid) De esta forma, se le est especificando al programa lo que se va a mostrar en los ejes, en este caso las densidades y el salario por hora de los individuos; al igual que se est especificando el rango de valores del eje Y, en este caso es entre 0 y 150.

    f. Varios diagramas en un slo grfico

    En el momento de la presentacin de documentos, una forma til es la de mostrar varios grficos en un mismo recuadro. Esta opcin permite ahorrar espacio al tiempo que permite hacer nfasis sobre alguna variable de inters. Como primera medida, se debe realizar cada grfico por separado con los comandos anteriormente descritos y guardarlos. Una vez hecho esto, el usuario debe ir al Men de la barra de herramientas dando click en Graphics y despus en Table of graphs. Stata abre una primera ventana donde se debe entrar en Browse y ah se despliega una nueva ventana para seleccionar los grficos que se guardaron y se desean poner

    020

    4060

    8010

    012

    014

    016

    0Fr

    eque

    ncy

    0 5 10 15 20 25

    0 5 10 15 20 25average hourly earnings

  • 15

    uno junto al otro: entrando nuevamente en Browse, se buscan cada uno de los grficos:

    Al dar la opcin OK, una vez seleccionados los grficos, Stata abre inmediatamente una nueva ventana con los tres o cuatro grficos seleccionados ya todos incluidos en un mismo recuadro, de la siguiente manera:

    Grfico 8. Varios diagramas en un solo grfico

    Los grficos que se observan en la Salida de Stata que se realizaron en este ejemplo son: [1] Es el grfico que muestra la densidad del salario, realizado mediante el comando twoway kdensity wage; [2] grfico de barras que representa los salarios por divisin en gnero; [3] es el histograma que muestra una aproximacin a la

    0.05

    .1

    .15

    .2

    kden

    sity

    wag

    e

    0 5 10 15 20 25x

    02

    46

    8m

    ean of

    w

    age

    Male Female

    0.2

    .4

    .6

    .8

    Den

    sity

    -1 0 1 2 3log(wage)

    -1

    01

    23

    log(w

    age)

    0 5 10 15 20years of education

    .::UdecomBooks::.

  • 16

    distribucin del la variable logaritmo del salario; y, por ltimo, [4] es el grfico de dispersin entre el logaritmo del salario y los aos de educacin del individuo.

    4 Comentarios finales

    Este documento pretende mostrar al usuario de Stata la amplia gama de posibilidades que el programa ofrece para hacer un anlisis minucioso de los datos que se tienen con el fin de dar inicio al trabajo deseado. La revisin de los datos es un primer paso que no se debe obviar pues hace parte fundamental del trabajo del econometrista. Es importante variar en el uso de las herramientas para las estadsticas descriptivas, utilizando mtodos grficos y tablas simultneamente para as tener una mejor visin de aquellas variables de inters y de la muestra suministrada. Una vez realizado este segundo paso en el manejo de las bases de datos, el usuario puede ahora pasar a realizar las regresiones que crea pertinentes para el modelo encontrado que se ajusta al anlisis que est llevando acabo. El software Stata permite continuar an ms con las regresiones y las correcciones de los posibles problemas economtricos hallados en el camino. 5. Bibliografa

    Acock, A. C. (2006) A Gentle Introduction to Stata, Third edition. Stata Press

    Adkins L.C y Carter R. (2008). Using Stata for Principles of Econometrics. Wiley.

    Baum C. F. (2006) An Introduction to Modern Econometrics Using Stata. Stata Press

    Becker, Gary S. (1964) Human Capital: A theorical and empirical analysis, with special reference to education. New York.

    Blossfeld H-P., Golsch K., Rohwer G. (2007) Event History Analysis with Stata.

    Cameron A.C y Trivedi P.K (2009). Microeconomtrics using Stata. Stata Press

    Cleves M., Gould W., Gutierrez R., Marchenko Y. (2002) An Introduction to Survival Analysis using Stata. Thrid edition. Stata Press

    Chiswik, Barry (2003) Jacob Mincer, Experience and the distributions of earnings. Institute for the study of labor (IZA). IDEAS

    Gujarati (2010) Econometra. Mxico. Mc Graw Hill

    Gould W., Pitblado J., Sribney W. (2006) Maximum likelihood Estimation with Stata. Stata Press

    Hamilton, L.C. (2009). Statistics with STATA 8. Belmont, CA: Duxbury Press

    Kohler, U. y Kreuter, F. (2009). Data Analysis Using Stata. College Station, TX: Stata Press

    Long, J. S. (2009) The Workflow of Data Analysis Using Stata. Stata Press.

    Mincer, J. (1974) Schooling, experience and earnings, Columbia University Press.

    Mitchell M. (2008) A visual guide to Stata Graphics. Stata Press

    Murray, M. (2006) Econometrics: a modern introduction. Ed. Pearson

  • 17

    Pollock, Ph. H. (2006) A Stata Companion to Political Analysis. Washington, CQ Press.

    Rabe-Hesketh, S. y Everitt, B. (2004). A Handbook of Statistical Analysis Using STATA, London: Chapman & Hall/CRC Press

    Newton J., Cox N. (2003) Seventy-six Stata tips

    STATA CORP (2008). Users Guide, Reference Manual Release 10. Stata Press.

    Wooldridge, J. (2006) Introduccin a la econometra. Un enfoque moderno. Ed. Thomson

    Algunos recursos en Internet para usuarios Stata:

    http://www.ats.ucla.edu/stat/stata/

    http://econpapers.hhs.se/paper/bocbocoec/531.htm

    http://fmwww.bc.edu/ec/res.info.php

    http://ideas.repec.org/s/boc/bocins.html

    .::UdecomBooks::.

  • INTRODUCCIN A LA ECONOMETRA Y EL MRLS EN STATA

    Carlos Giovanni Gonzlez Espitia E-mail: [email protected]

    Departamento de Economa

    Universidad Icesi

    Resumen

    El objetivo de este documento es introducir al lector en el mbito de la econometra y

    del Modelo de Regresin Lineal Simple (MRLS), siguiendo una metodologa bsica

    sobre la especificacin, estimacin, contrastes y proyecciones del modelo, y realizando

    su aplicacin en el programa economtrico Stata.

    Palabras Clave: Econometra, software economtrico, Stata Clasificacin JEL: C01, C87.

    Stata es una marca registrada de Stata Corporation. Copyright 19962010 StataCorp LP, 4905

    Lakeway Drive, College Station, TX 77845 USA. Las opiniones contenidas en este documento, los errores

    u omisiones son de exclusiva responsabilidad del autor.

  • 2

    1 Introduccin Pocas obligaciones si alguna supera en importancia a la que los economistas

    profesionales tienen de conocer y comprender las herramientas bsicas de la

    econometra para el desarrollo de su profesin. Un deber cuyo cumplimiento importa

    cada da ms a un amplio nmero de agentes y participantes del proceso econmico.

    Adems, estos agentes precisan disponer de las conclusiones que esta herramienta les

    puede proporcionar en estudios empresariales, consultoras e investigaciones. As por

    ejemplo, algunos agentes econmicos a los cuales les debera interesar la econometra

    son, los empresarios, cuyas decisiones estn esencialmente afectadas por la

    informacin que disponen con respecto a la relacin de las variables del entorno

    empresarial y general de la economa en la que desarrollan sus actividades. Los

    polticos y servidores pblicos cuyas elecciones tienen que guardar coherencia con las

    teoras, los datos, las regularidades empricas y hechos estilizados de la economa.

    Finalmente, los ciudadanos como consumidores necesitan una herramienta para

    analizar su toma de decisiones.

    Los economistas jvenes y los que todava estn estudiando sabrn que antes de

    tener su grado como profesionales deben pasar por materias de matemticas,

    estadsticas y de teora econmica, antes de llegar a la econometra. Y es en esta

    ltima donde surge una excelente combinacin de las matemticas, estadsticas y de

    teora econmica para alcanzar lo que los economistas podramos llamar la capacidad

    de anlisis econmico. Pero sorprende que esta herramienta, considerada como vital

    para la formacin de los economistas y de otras disciplinas o profesiones similares, no

    cuente en muchos pases en vas de desarrollo con obras que pongan al da a los

    usuarios sobre los mtodos que se utilizan hoy y los softwares ms especializado para

    interpretar correctamente las realidades econmicas y no pasar el oso, por

    quedarse en meras intuiciones o anlisis estadsticos bsicos, o tal vez, por usar un

    software desconocido por la comunidad cientfica de la disciplina.

    Esa ausencia de un documento que presente los mtodos economtricos y un

    software de calidad para el anlisis econmico, se cubre en esta serie de documentos.

    De ah que el objetivo de este tercer documento sea introducir al lector en la

    econometra y en el modelo de regresin lineal simple usando un software de frontera

    como lo es Stata. A este documento lo preceden otros dos: 1. Aprendiendo a usa Stata

    y 2. Describiendo y graficando datos en Stata.

    Este documento va dirigido a todos los estudiantes, profesores e investigadores en

    economa deseosos de empezar a usar el programa, o profundizar sus conocimientos

    en la herramienta. El documento es una herramienta de apoyo y no sustituye los

    manuales de Stata, ni a los libros ms rigurosos de econometra.

    El documento consta de ocho apartados, el primero de ellos es esta introduccin. En

    el segundo apartado se hace una introduccin a la econometra, pasando por su

    definicin, algunos conceptos bsicos, los datos y la metodloga de la econometra. En

    el tercer apartado se presenta la especificacin del modelo. En el cuarto apartado se

    presenta la estimacin del modelo usando el mtodo MCO. En el quinto apartado se

    .::UdecomBooks::.

  • 3

    contrasta el modelo usando las pruebas de significancia y la bondad de jute del

    modelo. En el sexto apartado se muestra como se hacen las proyecciones. En el

    sptimo apartado se presenta una seccin de comentarios. El documento termina con

    la bibliografa.

    2 La econometra La econometra es una rama de la economa que se basa en la teora econmica

    (microeconoma y macroeconoma) y que tiene hoy en da una amplia aplicacin en

    diversas actividades del ser humano tales como el anlisis econmico de la toma de

    decisiones de los consumidores, empresas y del Estado. Segn Paul Samuelson (1915 -

    2009), uno de los economistas ms influyentes que han existido, la economa es una

    ciencia social que estudia la asignacin eficiente de los recursos escasos para satisfacer

    las necesidades humanas. En esta ciencia social es necesario medir, calcular y estimar

    las relaciones de las variables econmicas, cosa de la que se encarga la econometra.

    La palabra econometra se deriva del vocablo econo que significa economa, y

    metra que quiere decir medicin, es decir, medicin de la economa. Es entonces la

    parte de la economa que utiliza mtodos estadsticos y modelos matemticos para

    cuantificar y/o medir las relaciones econmicas. Es importante resaltar que debido a la

    continua evolucin de la ciencia econmica y de la misma econometra, existen

    diversas definiciones de econometra que en su mayora han sido propuestas por los

    economistas ms influyentes del siglo pasado.

    Una de las definiciones ms aceptadas de econometra es la propuesta por el

    economista noruego Ragnar Anton Kittil Frisch (1895-1973):

    La econometra es un rea de la economa que se basa en la teora econmica para

    analizar y/o estudiar a travs de modelos los fenmenos econmicos utilizando las

    herramientas de la estadstica y las matemticas, (adaptado de Frisch, 1927).

    Anton Kittil Frisch recibi el primer premio nobel de economa en el ao 1969, fue

    adems el fundador de la Econometric Society, y creador y editor de la prestigiosa

    revista cientfica Econometrica. Todo esto justifica pues la amplia aceptacin de su

    propuesta a lo largo de la historia.

    Es importante destacar que la econometra que se muestra en estos documentos es

    aplicada y no pretende hacer nfasis en el desarrollo terico ni en la formalizacin de

    los mtodos. Mas bien, se muestra como una herramienta de fcil aplicacin y muy

    necesaria para los economistas de hoy.

    2.1 Conceptos bsicos

    Para el estudio de la econometra y antes de continuar, es importante tener claros

    algunos conceptos fundamentales. El primero de ellos es el de economa: que es la

    ciencia social que estudia la asignacin eficiente de recursos escasos para satisfacer las

  • 4

    necesidades humanas, es importante tener en cuenta este concepto antes de empezar

    a utilizar la econometra como herramienta prctica.

    Igualmente, es importante tener siempre presente que al hablar de teora econmica,

    se est haciendo referencia a las dos ramas principales de la misma, que son la

    microeconoma y la macroeconoma. La primera se refiere al estudio de los agentes

    econmicos individuales y su comportamiento, mientras que la segunda estudia las

    variables econmicas agregadas en su conjunto.

    Otro concepto importante es la estadstica, que se puede definir como la ciencia que

    tiene como objetivo reunir una informacin cuantitativa concerniente a individuos,

    grupos o series de hechos, por ejemplo, y deducir de ella unos significados precisos o

    previsiones para el futuro, mediante el anlisis de datos.

    Es igualmente importante saber que las matemticas son aquella disciplina que,

    mediante el razonamiento deductivo, estudia las propiedades de los entes abstractos,

    nmeros, figuras geomtricas, etc., as como las relaciones que se establecen entre

    ellos.

    2.2 Anlisis de regresin

    Ya teniendo estos conceptos claros, es posible dar paso a lo que es la base del estudio

    de la econometra: el anlisis de regresin.

    En la economa como en las ciencias sociales, no es posible hacer experimentos

    exactos como en las matemticas, fsica o las ciencias naturales (tambin llamadas

    ciencias exactas), principalmente, por no poder acceder a toda la informacin de la

    poblacin en estudio. Y por lo tanto, se deben utilizar modelos para estudiar los

    fenmenos econmicos y de esta forma aproximarnos a la explicacin de la realidad.

    De ah que la simplificacin de la realidad sea necesaria a travs de modelos que son

    representaciones de la realidad.

    Segn Gujarati (2010), el anlisis de regresin trata del estudio de la dependencia de la

    variable dependiente (Y), en una o ms variables, las variables explicativas (X)

    utilizando modelos, con el objetivo de estimar y/o predecir la media o valor promedio

    poblacional de la primera en trminos de los valores conocidos o fijos (en muestras

    repetidas) de las ltimas.

    Con base en lo anterior, se puede deducir la funcin de dependencia bsica que por lo

    general se establece por la teora econmica:

    ( )Y f X=

    Esta funcin se pude tambin reescribir como modelo matemtico a manera de

    funcin lineal de la siguiente manera:

    Y a bX= +

    .::UdecomBooks::.

  • 5

    Donde Y es la variable dependiente, X es la variable independiente o explicativa, a es el

    parmetro constante y b es el parmetro dependiente. Esta ecuacin es la ecuacin de

    una recta de pendiente b y de ordenada al origen a en un eje cartesiano tradicional.

    El modelo matemtico se convierte en modelo economtrico (tambin conocido como

    modelo estadstico) en el momento en el que se agrega una variable aleatoria al

    modelo: esta variable aleatoria es el trmino de err