Econo Me Tria

A econometria é uma ferramenta da economia que busca estabelecer relações causais e

correlações entre variáveis dentro de um contexto econômico. Modelos são construídos (ex.:

) com o objetivo de descobrir o comportamento de

uma variável dado o comportamento de uma variável ( ). Em toda a estimação,

existe um termo de erro que é chamado de resíduo ( ). Tal termo de erro são fatores não

observados.

Para fazer a estimação de , antes é necessário assumir alguns pressupostos:

O valor esperado do resíduo é zero. ( ) ∑

.

O valor esperado do resíduo condicionado a é nulo, ( ) , ou seja, a variável

explicativa e o resíduo são independentes, o que também implica que ( ) .

Os dois pressupostos são importantes, pois o objetivo é estimar a partir de uma

base de dados de forma que o valor esperado de seja o valor verdadeiro da população.

( ) ( ). Caso ( ) , então ( ) .

Modelo de Regressão Simples

Um método para estimar é o método de Mínimos Quadrados Ordinários

(MQO). O objetivo do método é obter os estimadores minimizando a soma dos quadrados

dos resíduos (SQR).

( )

∑( ) ∑( )

( )

( )

∑( )( )

∑( )

Para a demonstração do método, consultar seu livro de econometria.

O estimador pode ser interpretado como ⁄ de modo que

qualquer variação de é explicada por uma variação em . A covariância entre e

( ( )) implica que se e são negativamente correlacionados então é negativo. Se

e são positivamente correlacionados então é positivo.

Uma vez estimado o modelo, a variação total de y em relação à média pode ser calculada pela

soma total dos quadrados. SQT é o quadrado da diferença entre o valor de Y observado e sua

média amostral [ ∑( ) ]. Pelo fato da regressão ser uma aproximação, fatores não

observados sempre existem. Portanto o modelo é capaz de explicar uma parte da variação de

y. A Soma dos Quadrados Explicados (SQE) é o quadrado da diferença entre valor de Y

estimado e sua média amostral ∑( ) ]. A variação de y que não pode ser

explicada pelo modelo é definida pela Soma dos Quadrados dos Resíduos. SQR é o quadrado

da diferença entre o valor de Y observado e o valor estimado [ ∑( ) ]. A Soma dos

Quadrados Total (SQT) pode ser interpretado como a soma total da variação de y que é

explicada pelo modelo e da variação de y que não é explicada [

∑( ) ∑( ) ].

Uma vez estimado o modelo com o método MQO, pode-se medir quão bem ajustado o

modelo está em relação à base amostral de dados. Essa medida da qualidade do ajuste é dada

por . Também chamado de coeficiente de determinação, é uma proporção assumindo

valores entre 0 e 1 ( ). é calculado por

. Quanto menor o

SQR, maior , portanto melhor ajustado o modelo está em relação aos dados amostrais.

Apesar de ser chamado de coeficiente de determinação, de forma alguma é uma medida

Modelo de Regressão Múltipla

O método MQO para estimar o modelo de regressão múltipla

também tem como objetivo de minimizar SQR. Porém sempre há algum nível de

correlação entre as variáveis independentes, afetando assim a estimação dos . O estimador

pode ser estimado da mesma forma que na regressão simples, ( )

( ). As estimativas

tem interpretações de efeito parcial, . Para observar a variação de

dado uma variação de , controla-se as outras variáveis, .

O estimador pode também ser expresso pelo efeito parcial de descontado o efeito das

outras variáveis. Para determinar a correlação entre as variáveis estima-se a regressão de

forma reduzida . O resíduo inclui os fatores não

observados que não são explicados pelas outras variáveis, mas que explicam . Chegamos à

fórmula ∑

∑ , sendo . Quanto maior o resíduo , menor a dispersão de .

Uma alta correlação entre as variáveis resulta uma menor ( ), que aumenta ( ).

Uma forma de medir a correlação de cada variável com as outras é calculando o coeficiente

de correlação múltipla , que nada mais é o coeficiente de determinação da regressão

.

O coeficiente de determinação múltipla é calculado da mesma forma que no modelo de

regressão simples,

. O coeficiente de determinação pode ser expresso

pelos coeficientes de correlação entre o valor real de e os valores ajustados de ,

(∑ ( )(

))

∑ ( ) ( )

. Pelo fato do sempre aumentar quando se adiciona variáveis

independentes em uma regressão, isso faz dele um instrumento fraco para decidir quais

variáveis devem ser adicionadas. Uma alternativa para medir a qualidade do ajuste é o R²

ajustado. Enquanto o R² habitual nunca diminui quando outra variável é adicionada na

regressão, o R²-adj penaliza o número de regressores e o seu valor pode diminuir quando uma

variável independente é adicionada, R²-adj ( )⁄ ( )⁄ ⁄ com

sendo o número de regressores incluindo o termo de intercepto. Isso o faz preferível para

modelos com diferentes quantidades de variáveis independentes. Porém nem o R² nem o R²-

adj podem ser usados para comparar modelos com diferentes formas funcionais de (ex.: e

). No entanto, R²-adj pode ser bastante útil para comparar modelos com diferentes

formas funcionais de (ex.: e ).

Mais importante do que procurar uma forma funcional ou um conjunto de variáveis que se

ajustem de forma ótima aos dados amostrais é obter estimativas confiáveis dos verdadeiros

coeficientes de regressão para a população e fazer inferências estatísticas sobre eles. Um bom

modelo deve ter coeficientes significativos e condizentes com a teoria e/ou lógica.

Pressupostos do método MQO

Linearidade dos parâmetros: para qualquer dado amostral de , a variável

independente tem uma mesma relação linear com a variável dependente dada

por .

Média condicional zero: o valor esperado do resíduo deve ser igual à zero, quaisquer

que sejam os valores das variáveis independentes, ( ) . Tal hipótese implica

que fatores não observados não afetam sistematicamente o valor médio de Y e sua

violação implica na existência de viés de especificação (má-especificação da forma

funcional, omissão de variável importante ou inclusão de variável desnecessária).

Ausência de multicolinearidade: uma variável não pode ter alta correlação com

outras variáveis independentes.

Homocedasticidade: o resíduo tem a mesma variância quaisquer que sejam os valores

das variáveis explicativas, ( ) .

Caso nenhum dos pressupostos seja violado, o teorema de Gauss-Markov prova que os

estimadores MQO são os estimadores não viesados mais eficientes (eficiência=mínima

variância dos estimadores).

Viés e Inconsistência

Viés no estimador pode ser definido quando para uma dada amostra ( ) . E

inconsistência pode ser definida quando a amostra tende para a população ( ) .

Problemas como multicolinearidade e erro de medida podem subestimar ou sobrestimar

( ) conduzindo a uma estimação imprecisa de , pois ( )

( ). Quando

( ) , o pressuposto da média condicional zero é violada, ( ) , conduzindo

também a uma estimação imprecisa de , pois ( ) ( ). É

importante observar que a violação da hipótese de homocedasticidade não causa viés ou

inconsistência nos estimadores, pois a estimação de não é influenciada pela variância do

resíduo.

Estatística t

Para que seja possível fazer inferência sobre os estimadores é necessário assumir alguns

pressupostos. O resíduo deve ter uma distribuição normal e ser constante, ( )

e ( ). O estimador MQO deve seguir uma distribuição normal,

( ) , para que seja possível calcular o p-valor dos testes t e F.

O verdadeiro valor de um parâmetro da função de regressão populacional

é desconhecido. No entanto é possível formular hipóteses sobre o

valor real do parâmetro . Para inferir se é significativo, ou seja, se a variável independente

tem algum efeito sobre a variável dependente , usa-se a estatística t. A estatística do teste

t é

( ) . Formula-se a hipótese nula .

Como o valor real de é desconhecido, fazemos inferência estatística sobre a partir de

uma dada amostra populacional. A estatística usada é ( ) ⁄ , pois consideramos

. Porém continuamos a testar a hipótese nula do parâmetro populacional, . A

intuição do teste é inferir quão distante está de zero, pois a estimativa pontual nunca

será exatamente zero, seja verdadeira ou não. Um valor amostral muito distante de zero

fornece evidências contra . Entretanto, existe um erro amostral inerente à

estimativa , de modo que usamos o erro-padrão de que é uma estimativa do desvio-

padrão de . Portanto mede quantos desvios-padrão estimados está afastado do zero.

Quanto maior a variabilidade de menor a variância de (lembrando que ( )

( )),

portanto mais preciso é a medição do parâmetro.

Considera-se a variância do resíduo homocedástico, ( ) ( ) constante. A

variância do resíduo é a soma quadrática do resíduo corrigido pelos graus de liberdade,

∑( )

no caso da regressão linear e

.

No modelo de regressão linear simples, o erro-padrão de é calculado da seguinte

forma ( ) √

( ) . Para o modelo de regressão múltipla o erro-padrão de é

calculado por ( ) √

( )( )

, sendo o coeficiente de correlação múltipla. Uma

vez calculado a estatística compara-se com . Se

rejeita-se a

hipótese nula e conclui-se que a variável é estatisticamente significante ao nível de

significância . Pode-se comparar através do p-valor também. Para dado um nível de

significância calcula-se o valor crítico. Se o p-valor da estatística é menor que o valor crítico,

rejeita-se . Ao aceitar a hipótese nula, isto significa que não há evidências amostrais

comprovando que a variável independente tem alguma relação com a variável independente.

Intervalo de confiança

Outra forma de estimar a significância de é construindo o intervalo de confiança de ,

( ) ( ). O uso do Intervalo de Confiança tem

algumas limitações práticas, pois para muitos problemas só há uma amostra. Caso amostras

aleatórias fossem obtidas repetidas vezes, com e sendo calculados cada vez, então o

valor populacional (desconhecido) estaria dentro do intervalo ( ) em 95% das amostras

dado um nível de significância . Porém para a única amostra usada para a construção

de IC, não se sabe se está contido no intervalo, pois não há garantias que essa única

amostra seja uma das 95% de todas as amostras em que a estimativa de intervalo contém .

Estatística F

A estatística F é usada para inferir se um grupo de variáveis independentes não tem efeito

sobre a variável dependente, testando assim a significância geral da regressão. A estatística F é

definida como ⁄

( ) ( )⁄. A hipótese nula é de que todos os parâmetros são zero,

. Outra maneira de formular a hipótese nula é

( ) ( ), ou seja, os valores de não afetam o valor

esperado de . Compara-se e , diretamente ou calculando os p-valores respectivos.

Caso a hipótese nula seja aceita, significa que o modelo é nulo ou restrito (

).

É importante observar que um aparentemente pequeno resulta em uma estatística

altamente significativa. Portanto, é importante testar a significância conjunta e não apenas

analisar o valor do .

Viés e Inconsistência na inferência

Vieses ( ( ) ) que subestimem ou sobrestimem ( ) podem subestimar ou

sobrestimar a variância ( ( )

( ) ). Isso gera problemas na inferência sobre os

estimadores, pois a estatística t [ √

( ) ⁄ ] depende do valor correto de . Portanto

estimadores viesados podem resultar em uma estatística de teste errônea. Por exemplo,

quando uma hipótese nula deveria ser rejeitada, mas por conta dos estimadores viesados essa

é aceita.

Outro problema que afeta a estatista t é a heterocedasticidade ( não é constante). Apesar

de não causar viés nos estimadores , a heterocedasticidade causa viés na estimação da

variância de ( ( )

( ) para regressão simples e ( )

( )( )

para a

regressão múltipla).

Variáveis Dummy

Informações qualitativas podem ser usadas como variáveis na análise de regressão. Essas

variáveis são conhecidas como variáveis dummies e são normalmente estimadas por MQO. A

variável dummy é binária, assumindo valores de 0 ou 1. No caso mais simples

, uma variável dummy é utilizada para fazer a distinção entre dois grupos, e o

coeficiente estimado da variável dummy estima a diferença da média ceteris paribus entre os

dois grupos. Um exemplo de variável dummy dicotômica é gênero. É possível construir

modelos com duas (ou mais) dummies dicotômicas, . A

interpretação é análoga ao modelo com uma dummy, o objetivo é também captar diferenças

da média entre os grupos. Porém os grupos agora são todas as combinações possíveis entre as

duas variáveis, (Ex.: : homens e mulheres, brancos e negros; nº de grupos=4: homens

brancos, homens negros, mulheres brancas e mulheres negras).

Em modelo com variável dummy e variável quantitativa , a intuição

é um pouco diferente. Nesse caso, o objetivo é captar diferença de níveis de entre os grupos

dado a variável . Também é possível estipular interação entre uma variável dummy e uma

variável quantitativa, . A intuição é que existe um efeito

multiplicativo onde além da diferença da média entre os grupos, existe uma variação dessa

diferença (graficamente o coeficiente angular se altera, com as retas não mais sendo

paralelas). Por fim pode-se estipular um modelo com interação entre dummies,

. A intuição é que existe uma diferença adicional à diferença de

média entre os grupos.

As variáveis dummies não são usadas somente para variáveis dicotômicas. Pode-se usar um

conjunto de variáveis dummy para categorias múltiplas (ex.: macrorregiões, religião, etc). Cada

dummy representa uma categoria. É importante ressaltar que se houver g grupos então g-1

variáveis dummy são incluídas no modelo. Ao se omitir um dos grupos, o objetivo é evitar a

multicolinearidade perfeita entre as variáveis dummies. Esse grupo omitido é chamado de

grupo-base. As variáveis dummies categorizadas também podem ser usadas para incorporar

informações ordinais, como classificações de crédito, IDH, etc.

O teste de Chow pode ser usado para detectar se existem diferenças estatisticamente

significantes entre os grupos e assim validar ou não o uso da variável dummy.

Modelo de Probabilidade Linear

O modelo de probabilidade linear MPL, que é simplesmente estimado pelo MQO, possibilita

explicar uma resposta binária usando análise de regressão, ( )

. As estimativas MQO agora são interpretadas como alterações na probabilidade de

sucesso (y=1), dado um aumento de uma unidade na variável explicativa correspondente,

( ) . O MPL tem algumas inconveniências: pode produzir probabilidades

previstas menores que zero ou maiores que um; implica um efeito marginal constante de cada

variável independente que aparece em sua forma original; e contém heterocedasticidade.

Má-especificação do modelo

Quando o valor esperado do resíduo condicionado ao valor de é diferente de zero

( ) , tal hipótese implica que fatores não observados afetam sistematicamente o valor

médio de Y e sua violação implica na existência de viés de especificação.

O viés da especificação pode ser fruto da omissão de uma variável importante, seja por

exclusão seja por subespecificação do modelo. Isso geralmente conduz a viés e inconsistência

em todos os estimadores MQO.

A má-especificação do modelo também pode ser causada pela má-especificação da forma

funcional da variável independente ou variável dependente, caso haja uma relação não linear

entre e . Um exemplo de uso inapropriado de uma forma funcional da variável dependente

é salárioh ao invés de log(salárioh). Um modelo de regressão múltipla sofre de má-

especificação da forma funcional quando não explica de maneira apropriada a relação entre as

variáveis explicativas e a variável dependente observada. Apesar de trazer sérias

consequências, o problema é secundário uma vez que temos os dados necessários de todas as

variáveis necessárias para obter uma relação funcional que se ajuste bem aos dados.

Diante de uma relação não linear entre e , pode-se fazer transformação funcional da

variável independente para corrigir o problema. A logaritmização da variável e é

apropriada para modelos de elasticidade constante ( ). Qualquer

variação percentual de provoca uma variação percentual proporcional em (

). muitas vezes é chamado elasticidade de em relação a . Para o modelo

semilogarítmico , uma variação absoluta de provoca uma variação

percentual em ( ). é chamado semi elasticidade de em relação a

. Para , uma variação percentual de provoca uma variação absoluta

em ( ).

Outra relação não linear entre e bastante comum é a forma quadrática. Para

, uma variação de causa uma variação em condicionada ao valor de

( ( ) ). A medida que se aproxima do ponto de máximo/mínimo

(máx/mín=| ⁄ |), varia a taxas decrescentes. É importante ressaltar que para o modelo

quadrático e outras formas polinomiais, não existe multicolinearidade, pois não se trata de

efeitos separados. Por fim, efeitos multiplicativos causados por interações entre as variáveis

independentes podem ocorrer, . A variação de , ceteris

paribus, causa uma variação em , mas que é amplificada pelo valor de [ (

) . Assim como o efeito da variação de é influenciada pelo valor de [ (

) ].

Para identificar problemas de má-especificação da forma funcional, o teste de erro de

especificação da regressão (RESET) é bem útil. O teste RESET adiciona polinômios aos valores

estimados MQO para detectar tipos gerais de má-especificação de formas funcionais. Na maior

parte dos casos incluem-se os termos quadráticos e cúbicos (

e são funções não lineares de ). A hipótese nula do teste é que o

modelo está corretamente especificado. A estatística do teste RESET é a estatística

(

) ( )⁄

( ) ( ⁄ )

para . Uma estatística F

significativa sugere algum tipo de problema na forma funcional. Uma desvantagem do teste

RESET é que ela não fornece uma orientação prática de como proceder se o modelo for

rejeitado. Além disso, mesmo se a forma funcional for apropriadamente especificada, o teste

RESET não tem poder para detectar heterocedasticidade.

Erro de Medida

Quando se usa uma medida imprecisa de uma variável econômica em um modelo de

regressão, o modelo conterá um erro de medida. O método MQO será consistente sob certas

hipóteses, mas existem outras sob as quais ele será inconsistente. Em alguns casos, pode-se

inferir o tamanho do viés assimptótico. O erro de medida (na população) é definido como a

diferença entre o valor observado e o valor real: . O erro de medida pode ser

estimado como . É natural supor que o erro de medida

tem média zero, caso contrário o estimador do intercepto será viesado. Se a correlação

entre e é nula, os estimadores MQO serão não viesados e consistentes. Se e não são

correlacionados, então var( )

. Isso implica que o erro de medida na

variável dependente sobrestima ( ), a estatística t é subestimado aceitando, assim, a

hipótese nula.

O erro de medida em uma variável explicativa é , podendo ser negativo, positivo

ou zero. Presume-se que ( ) e que não é correlacionado com e . Sendo assim,

formula-se a hipótese que não é correlacionado com e . Se a hipótese for falsa, o

estimador MQO não será consistente.

Variável Proxy

A omissão de uma importante variável no modelo pode conduzir a viés e inconsistência nos

estimadores MQO. Porém sua exclusão muitas vezes ocorre por indisponibilidade de dados.

Uma forma de remediar é o uso de variável proxy que é uma variável altamente

correlacionada com a variável não observada. A variável Proxy também pode ser usada para

substituir variáveis com erro de medida.

Uma variável Proxy é uma variável que possui alta correlação com outro variável. Mas mais

importante, para que uma variável seja uma boa Proxy, esta não deve ter relação causal com a

variável a ser substituída. É um tanto contra intuitivo que uma variável que tenha uma elevada

correlação com outra, não existe relação causal entre elas. Um exemplo de variável Proxy

usado em modelos econômicos é a variável PIB per capita substituindo a variável qualidade de

vida.

Como já definido, a variável Proxy busca mimetizar certa variável. Ela é uma boa solução no

caso de variáveis omitidas que sejam complicadas de obter sua mensuração. Um exemplo é

usar a Proxy QI no lugar da variável aptidão em um modelo de salário. É razoável supor que QI

e aptidão estão altamente correlacionadas, mas não há uma relação causal entre elas. Pelo

fato de não ser possível mensurar a aptidão dos indivíduos, a variável é um fator não

observado. Assim sendo, a variável Proxy QI deve ter correlação com o resíduo.

Heterocedasticidade

O problema da heterocedasticidade ocorre quando a variância do termo de erro não é

constante. Tal hipótese não provoca viés ou inconsistência (consistência: quando o tamanho

da amostra tende ao infinito, o estimador tende ao seu valor real, ) nos estimadores

MQO. Todavia os estimadores de variâncias var( ) são viesados, pois ( ) ( )⁄ ,

muitas vezes implicando em resultados não esperados. A variância não sendo constante afeta

a estatística t. Quando ( ) é subestimada, a estatística t é sobrestimado rejeitando, assim,

a hipótese nula. Quando ( ) é superestimada, a estatística t é subestimada aceitando,

assim, a hipótese nula.

Um estimador válido de ( ) para qualquer forma de heterocedasticidade, inclusive para

formas homocedásticas, é

∑ ( )

. Para o modelo de regressão múltipla, o estimador válido

de ( ) é ( )

. A sua raiz quadrada é chamada de erro-padrão robusto em

relação à heterocedasticidade. Assim é possível construir uma estatística robusta em relação à

heterocedasticidade, onde

( ). A variável que era estatisticamente significante com o

uso da estatística t habitual continua estatisticamente significante com o uso da estatística t

robusta em relação à heterocedasticidade. Em amostras de tamanho grande cuja variância

seja desconhecida pode-se usar erros-padrão robustos em relação à heterocedasticidade.

Apesar de válido, o estimador MQO não mais será o estimador linear não viesado mais

eficiente. Para usar outras ações corretivas mais eficientes é necessário realizar testes que

detectem heterocedasticidade e a sua forma.

O teste Breusch-Pagan busca captar uma relação linear entre o resíduo e as variáveis

( ). Constrói-se então a estatística

⁄

( ) ( )⁄ . Se o p-valor for abaixo do nível de significância selecionado, então

rejeita-se a hipótese nula de homocedasticidade. Já o teste de White é mais completo que o

teste Breusch-Pagan, pois acrescenta iterações e formas funcionais de xi para captar tanto

linearidades quanto não linearidades entre o resíduo e as variáveis (

). Pode-se reescrever a equação

desta forma . O teste de White que não inclui iterações será

um teste de heterocedasticidade pura. Se tais termos estiverem presentes, trata-se de um

teste tanto de heterocedasticidade quanto de viés de especificação.

Havendo, por exemplo, uma relação linear entre resíduos e a variável ( é conhecido) pode-

se usar o método de Mínimos Quadrados Ponderados (MQP). O método consiste em dividir a

equação de previsão ponderando todas as variáveis por √ ( ) , ( ) , obtendo assim

√ ( )

√ ( )

√ ( )

√ ( )

√ ( ). Se corretamente especificada a forma

da heterocedasticidade, o método MQP é mais eficiente que MQO, pois novas estatísticas t e F

são produzidas. A intuição do método é que o peso atribuído a cada observação é

inversamente proporcional a sua , ou seja, observações vindas de uma população com

maior obterão peso relativamente menor e aquelas de uma população com menor terão

peso proporcionalmente maior na minimização da SQR.

Porém na maioria dos casos, a forma exata de heterocedasticidade, h(x), não é óbvia. Para

isso, temos o método de Mínimos Quadrados Generalizados Factíveis (MQGF) que transforma

o resíduo em semilogarítmico,

. Sendo ( )

, temos a equação

de previsão ponderada igual a

( )

( )

( )

( )

( ) . Apesar de o estimador MQGF ser viesado, ele é consistente e assimptoticamente

(para uma grande amostra) mais eficiente que o MQO.

Multicolinearidade

O problema da multicolinearidade ocorre na regressão múltipla quando existe uma correlação

entre as variáveis independentes, causada geralmente por viés de omissão de variável ou viés

de erro de medida. O problema da multicolinearidade é essencialmente amostral, tanto que os

não são significativos. Uma baixa variabilidade de aumenta a dispersão do , se ( )

é sobrestimado temos uma estatística t subestimada. É importante ressaltar que formas

funcionais de xi não violam a hipótese de multicolinearidade, apesar de que o coeficiente de

correlação mostrará que e estão altamente correlacionados.

Se a multicolinearidade for perfeita, os estimadores de MQO serão indeterminados e seus

erros-padrão infinitos. Se a multicolinearidade for menos que perfeita, os estimadores

possuirão grandes erros-padrão, em relação aos próprios estimadores, o que significa que não

podem ser estimados com grande precisão ou exatidão. Os são os mais eficientes, pois a

multicolinearidade reduz ( ), porém causando viés nos ( ( )

( )). Um ( )

subestimado resulta em ( ) sobrestimado, sobrestimando a estatística t e assim

aceitando a hipótese nula. Mesmo que a razão t seja estatisticamente insignificante, o R² pode

ser muito alto.

A velocidade com a qual as variâncias e covariâncias aumentam pode ser observada pelo fator

de inflação das variáveis (FIV), definido como ( )⁄ . Quando

, coeficiente de

correlação múltipla, tende a 1, o FIV tende ao infinito. Ou seja, quanto maior a colinearidade,

maior a variância de um estimador e, no limite, pode tornar-se infinita. Se não houver

colinearidade entre Xi, o FIV será 1. A variância do estimador ( ) pode ser expressa como

∑ ( )

mostrando que a variância de é diretamente proporcional ao FIV.

Outra forma de identificar a variável independente que está correlacionada a outras variáveis

independentes do modelo é fazer uma regressão para Xi contra as demais variáveis X e calcular

o R² correspondente, . Cada uma dessas regressões (ex.: )

é chamada de regressão auxiliar. A variável Xi segue distribuição

⁄

( ) ( )⁄

.

Se o F calculado excede o crítico no nível de significância escolhido, considera-se que Xi é

colinear com os outros X, se não exceder o crítico, este não será colinear mantendo a

variável no modelo.

Para corrigir o problema, Gujarati sugere algumas opções. Em caso de uma alta

multicolinearidade, uma opção é excluir uma das variáveis colineares. Porém tal solução pode

incorrer a outro problema mais grave que é o viés de especificação. Outra possível solução que

pode atenuar o problema é aumentar o tamanho da amostra ou até mesmo obter uma nova

base de dados.

Endogeneidade

O problema da endogeneidade ocorre quando a variável independente e o resíduo são

correlacionados, ( ) . Dizemos que é endógena quando esta variável observada

quantificada tem relação com uma variável não observada. Assim como na multicolinearidade,

problema da endogeneidade ocorre por erro de medida ou omissão de variável. Variáveis

instrumentais são usadas para mitigar o problema. Uma boa variável instrumental deve ter

alta correlação com a variável endógena e mínima correlação com o resíduo, ( ) e

( ) . Um exemplo de variável instrumental é a proximidade da universidade, pois a

variável dependente fazer ensino superior é muito correlacionado com a presença de

faculdade na cidade. É importante observar que uma variável Proxy não é um instrumento,

pois para que uma variável seja uma boa variável instrumental é necessário que haja um

princípio de causalidade entre a variável instrumental e a variável a ser substituída.

O método para estimar os com a variável instrumental é denominada de Mínimos

Quadrados Dois Estágios (MQ2E). No 1º estágio, usando o método de MQO estima-se

(forma reduzida), com . Uma boa

variável instrumental tem um alto no primeiro estágio. Como ( ) ( ), a

variável instrumental é significante somente se , o que é verificado através da estatística

t. No 2º estágio, também se usa o MQO para estimar

.

No caso da estimação do modelo simples , o pode ser calculado

algebricamente. Temos que ( ) ( ) ( ). Sendo ( ) e

( ) , ( )

( )

∑( )( )

∑( )( ). Para fazer inferência sobre o estimador,

( )

∑( ) , pressupõe que ( ) . Pela fórmula da variância do estimador

observa-se que ( ) ( ), apesar de mais eficiente geralmente o

estimador MQO é inconsistente. Porém caso ( ) seja estatisticamente consistente,

descarta-se o uso da variável instrumental. Neste caso o teste de Hausman busca testar se a

variável instrumental corrige o problema de endogeneidade. Para o teste estabelece-se a

( ) . O teste usa o MQ2E, sendo o 1º estágio:

. O 2º estágio: . Se é estatisticamente significativo,

rejeita-se e a variável instrumental não corrigiu o problema da endogeneidade.

Mais de uma variável instrumental pode ser usada no MQ2E, porém tal medida corretiva pode

não contribuir efetivamente para a solução do problema. É necessário testar se uma variável

instrumental é suficiente. O teste de sobre-identificação consiste primeiramente em estimar

. Depois estima-se , sendo que

Estimado , estima-se . A estatística do

teste é , onde é o valor da estimação e q é o

número de instrumentos adicionais. Compara-se o valor do multiplicador de Lagrange

com o valor crítico da distribuição qui-quadrada .

Equações Simultâneas

Em modelos uniequacionais, existe uma relação causal unidirecional entre variáveis

independentes e variáveis dependentes. Porém existem situações onde essa relação causal

não é unidirecional, ou seja, as variáveis independentes afetam as variáveis dependentes e as

variáveis dependentes também afetam as variáveis independentes. Temos então uma situação

caracterizada por endogeneidade perfeita. Para lidar com este tipo de problema usamos

modelos de equações simultâneas, nas quais há mais do que uma equação de regressão, uma

para cada variável interdependente.

Se não há problema de simultaneidade, os estimadores MQO produzem estimadores

consistentes e eficientes. Por outro lado, se há simultaneidade, os estimadores MQO não são

sequer consistentes. Na presença da simultaneidade, o método de MQ2E oferece estimadores

consistentes e eficientes. Curiosamente, se usarmos variáveis instrumentais quando não há de

fato simultaneidade, estes nos oferecerão estimadores consistentes, mas não eficientes.

Porém antes de descartar o uso do método MQ2E, caso as variáveis dependentes não sejam

simultâneas é necessário testar se realmente o problema inexiste. Para esse propósito usamos

o teste de Hausman. Para que haja simultaneidade é essencial que o regressor endógeno seja

correlacionado com o termo de erro. A hipótese nula do teste é de que não há simultaneidade,

( ) . No 1º estágio estimamos e no 2º estágio

. Se é estatisticamente significativo, rejeita-se e há

simultaneidade entre as variáveis dependentes.

Propriedades assintóticas

Assintótico significa que o tamanho da amostra tende ao infinito, ou seja, quando o tamanho

da amostra tende à sua população. O n depende da variância de x populacional. A partir deste

conceito definimos consistência dos estimadores MQO como o valor esperado de tendendo

ao quando o tamanho da amostra tende à população, o que pode ser representado

graficamente na figura 5.1. Sob os pressupostos de Gauss-Markov, os estimadores MQO são

consistentes. A inexistência de viés dos estimadores, embora importante, não pode ser

conseguida sempre. Por exemplo, o erro-padrão da regressão não é um estimador não

viesado do desvio-padrão do erro em um modelo de regressão múltipla.

O estimador da regressão simples pode ser interpretado como sendo o parâmetro

populacional acrescido do termo de erro: ∑( )

∑( )

∑( ) ⁄

∑( ) ⁄. Usando as

propriedades dos limites da probabilidade, obtemos: ( ) ( )⁄ .

Caso não haja violação do pressuposto ( ) , então . Portanto, a

consistência pode ser definida como a probabilidade limite do estimador ser igual ao

parâmetro populacional. Quanto maior ( ), mais distante está de . Quanto maior

o tamanho de n, menor o efeito da correlação entre fatores observados e fatores não

observados sobre a estimação.

A consistência de um estimador é uma importante propriedade, mas ela sozinha não nos

permite trabalhar com inferência estatística. Para isso é necessário que os estimadores MQO

sigam uma distribuição normal. A normalidade exata dos estimadores de MQO depende

crucialmente da normalidade da distribuição do erro na população. Se os erros forem

extrações aleatórias de alguma distribuição diferente da normal, o não será normalmente

distribuído, o que significa que não será possível obter p-valores das distribuições e .

É importante observar que a não normalidade do termo de erro não implica de modo algum

em viés nos estimadores MQO. O estimador também continua sendo o mais eficiente sob as

hipóteses de Gauss-Markov. Ainda que não sigam uma distribuição normal, podemos usar o

teorema do limite central para concluir que os estimadores de MQO satisfazem a normalidade

assimptótica, o que significa que eles são, de maneira aproximada, normalmente distribuídos

em amostras de tamanhos suficientemente grandes.

Documents

Econo Me Tria