Upload
agnes-fortunato
View
21
Download
0
Embed Size (px)
Citation preview
A econometria é uma ferramenta da economia que busca estabelecer relações causais e
correlações entre variáveis dentro de um contexto econômico. Modelos são construídos (ex.:
) com o objetivo de descobrir o comportamento de
uma variável dado o comportamento de uma variável ( ). Em toda a estimação,
existe um termo de erro que é chamado de resíduo ( ). Tal termo de erro são fatores não
observados.
Para fazer a estimação de , antes é necessário assumir alguns pressupostos:
O valor esperado do resíduo é zero. ( ) ∑
.
O valor esperado do resíduo condicionado a é nulo, ( ) , ou seja, a variável
explicativa e o resíduo são independentes, o que também implica que ( ) .
Os dois pressupostos são importantes, pois o objetivo é estimar a partir de uma
base de dados de forma que o valor esperado de seja o valor verdadeiro da população.
( ) ( ). Caso ( ) , então ( ) .
Modelo de Regressão Simples
Um método para estimar é o método de Mínimos Quadrados Ordinários
(MQO). O objetivo do método é obter os estimadores minimizando a soma dos quadrados
dos resíduos (SQR).
( )
∑( ) ∑( )
( )
( )
∑( )( )
∑( )
Para a demonstração do método, consultar seu livro de econometria.
O estimador pode ser interpretado como ⁄ de modo que
qualquer variação de é explicada por uma variação em . A covariância entre e
( ( )) implica que se e são negativamente correlacionados então é negativo. Se
e são positivamente correlacionados então é positivo.
Uma vez estimado o modelo, a variação total de y em relação à média pode ser calculada pela
soma total dos quadrados. SQT é o quadrado da diferença entre o valor de Y observado e sua
média amostral [ ∑( ) ]. Pelo fato da regressão ser uma aproximação, fatores não
observados sempre existem. Portanto o modelo é capaz de explicar uma parte da variação de
y. A Soma dos Quadrados Explicados (SQE) é o quadrado da diferença entre valor de Y
estimado e sua média amostral ∑( ) ]. A variação de y que não pode ser
explicada pelo modelo é definida pela Soma dos Quadrados dos Resíduos. SQR é o quadrado
da diferença entre o valor de Y observado e o valor estimado [ ∑( ) ]. A Soma dos
Quadrados Total (SQT) pode ser interpretado como a soma total da variação de y que é
explicada pelo modelo e da variação de y que não é explicada [
∑( ) ∑( ) ].
Uma vez estimado o modelo com o método MQO, pode-se medir quão bem ajustado o
modelo está em relação à base amostral de dados. Essa medida da qualidade do ajuste é dada
por . Também chamado de coeficiente de determinação, é uma proporção assumindo
valores entre 0 e 1 ( ). é calculado por
. Quanto menor o
SQR, maior , portanto melhor ajustado o modelo está em relação aos dados amostrais.
Apesar de ser chamado de coeficiente de determinação, de forma alguma é uma medida
Modelo de Regressão Múltipla
O método MQO para estimar o modelo de regressão múltipla
também tem como objetivo de minimizar SQR. Porém sempre há algum nível de
correlação entre as variáveis independentes, afetando assim a estimação dos . O estimador
pode ser estimado da mesma forma que na regressão simples, ( )
( ). As estimativas
tem interpretações de efeito parcial, . Para observar a variação de
dado uma variação de , controla-se as outras variáveis, .
O estimador pode também ser expresso pelo efeito parcial de descontado o efeito das
outras variáveis. Para determinar a correlação entre as variáveis estima-se a regressão de
forma reduzida . O resíduo inclui os fatores não
observados que não são explicados pelas outras variáveis, mas que explicam . Chegamos à
fórmula ∑
∑ , sendo . Quanto maior o resíduo , menor a dispersão de .
Uma alta correlação entre as variáveis resulta uma menor ( ), que aumenta ( ).
Uma forma de medir a correlação de cada variável com as outras é calculando o coeficiente
de correlação múltipla , que nada mais é o coeficiente de determinação da regressão
.
O coeficiente de determinação múltipla é calculado da mesma forma que no modelo de
regressão simples,
. O coeficiente de determinação pode ser expresso
pelos coeficientes de correlação entre o valor real de e os valores ajustados de ,
(∑ ( )(
))
∑ ( ) ( )
. Pelo fato do sempre aumentar quando se adiciona variáveis
independentes em uma regressão, isso faz dele um instrumento fraco para decidir quais
variáveis devem ser adicionadas. Uma alternativa para medir a qualidade do ajuste é o R²
ajustado. Enquanto o R² habitual nunca diminui quando outra variável é adicionada na
regressão, o R²-adj penaliza o número de regressores e o seu valor pode diminuir quando uma
variável independente é adicionada, R²-adj ( )⁄ ( )⁄ ⁄ com
sendo o número de regressores incluindo o termo de intercepto. Isso o faz preferível para
modelos com diferentes quantidades de variáveis independentes. Porém nem o R² nem o R²-
adj podem ser usados para comparar modelos com diferentes formas funcionais de (ex.: e
). No entanto, R²-adj pode ser bastante útil para comparar modelos com diferentes
formas funcionais de (ex.: e ).
Mais importante do que procurar uma forma funcional ou um conjunto de variáveis que se
ajustem de forma ótima aos dados amostrais é obter estimativas confiáveis dos verdadeiros
coeficientes de regressão para a população e fazer inferências estatísticas sobre eles. Um bom
modelo deve ter coeficientes significativos e condizentes com a teoria e/ou lógica.
Pressupostos do método MQO
Linearidade dos parâmetros: para qualquer dado amostral de , a variável
independente tem uma mesma relação linear com a variável dependente dada
por .
Média condicional zero: o valor esperado do resíduo deve ser igual à zero, quaisquer
que sejam os valores das variáveis independentes, ( ) . Tal hipótese implica
que fatores não observados não afetam sistematicamente o valor médio de Y e sua
violação implica na existência de viés de especificação (má-especificação da forma
funcional, omissão de variável importante ou inclusão de variável desnecessária).
Ausência de multicolinearidade: uma variável não pode ter alta correlação com
outras variáveis independentes.
Homocedasticidade: o resíduo tem a mesma variância quaisquer que sejam os valores
das variáveis explicativas, ( ) .
Caso nenhum dos pressupostos seja violado, o teorema de Gauss-Markov prova que os
estimadores MQO são os estimadores não viesados mais eficientes (eficiência=mínima
variância dos estimadores).
Viés e Inconsistência
Viés no estimador pode ser definido quando para uma dada amostra ( ) . E
inconsistência pode ser definida quando a amostra tende para a população ( ) .
Problemas como multicolinearidade e erro de medida podem subestimar ou sobrestimar
( ) conduzindo a uma estimação imprecisa de , pois ( )
( ). Quando
( ) , o pressuposto da média condicional zero é violada, ( ) , conduzindo
também a uma estimação imprecisa de , pois ( ) ( ). É
importante observar que a violação da hipótese de homocedasticidade não causa viés ou
inconsistência nos estimadores, pois a estimação de não é influenciada pela variância do
resíduo.
Estatística t
Para que seja possível fazer inferência sobre os estimadores é necessário assumir alguns
pressupostos. O resíduo deve ter uma distribuição normal e ser constante, ( )
e ( ). O estimador MQO deve seguir uma distribuição normal,
( ) , para que seja possível calcular o p-valor dos testes t e F.
O verdadeiro valor de um parâmetro da função de regressão populacional
é desconhecido. No entanto é possível formular hipóteses sobre o
valor real do parâmetro . Para inferir se é significativo, ou seja, se a variável independente
tem algum efeito sobre a variável dependente , usa-se a estatística t. A estatística do teste
t é
( ) . Formula-se a hipótese nula .
Como o valor real de é desconhecido, fazemos inferência estatística sobre a partir de
uma dada amostra populacional. A estatística usada é ( ) ⁄ , pois consideramos
. Porém continuamos a testar a hipótese nula do parâmetro populacional, . A
intuição do teste é inferir quão distante está de zero, pois a estimativa pontual nunca
será exatamente zero, seja verdadeira ou não. Um valor amostral muito distante de zero
fornece evidências contra . Entretanto, existe um erro amostral inerente à
estimativa , de modo que usamos o erro-padrão de que é uma estimativa do desvio-
padrão de . Portanto mede quantos desvios-padrão estimados está afastado do zero.
Quanto maior a variabilidade de menor a variância de (lembrando que ( )
( )),
portanto mais preciso é a medição do parâmetro.
Considera-se a variância do resíduo homocedástico, ( ) ( ) constante. A
variância do resíduo é a soma quadrática do resíduo corrigido pelos graus de liberdade,
∑( )
no caso da regressão linear e
.
No modelo de regressão linear simples, o erro-padrão de é calculado da seguinte
forma ( ) √
( ) . Para o modelo de regressão múltipla o erro-padrão de é
calculado por ( ) √
( )( )
, sendo o coeficiente de correlação múltipla. Uma
vez calculado a estatística compara-se com . Se
rejeita-se a
hipótese nula e conclui-se que a variável é estatisticamente significante ao nível de
significância . Pode-se comparar através do p-valor também. Para dado um nível de
significância calcula-se o valor crítico. Se o p-valor da estatística é menor que o valor crítico,
rejeita-se . Ao aceitar a hipótese nula, isto significa que não há evidências amostrais
comprovando que a variável independente tem alguma relação com a variável independente.
Intervalo de confiança
Outra forma de estimar a significância de é construindo o intervalo de confiança de ,
( ) ( ). O uso do Intervalo de Confiança tem
algumas limitações práticas, pois para muitos problemas só há uma amostra. Caso amostras
aleatórias fossem obtidas repetidas vezes, com e sendo calculados cada vez, então o
valor populacional (desconhecido) estaria dentro do intervalo ( ) em 95% das amostras
dado um nível de significância . Porém para a única amostra usada para a construção
de IC, não se sabe se está contido no intervalo, pois não há garantias que essa única
amostra seja uma das 95% de todas as amostras em que a estimativa de intervalo contém .
Estatística F
A estatística F é usada para inferir se um grupo de variáveis independentes não tem efeito
sobre a variável dependente, testando assim a significância geral da regressão. A estatística F é
definida como ⁄
( ) ( )⁄. A hipótese nula é de que todos os parâmetros são zero,
. Outra maneira de formular a hipótese nula é
( ) ( ), ou seja, os valores de não afetam o valor
esperado de . Compara-se e , diretamente ou calculando os p-valores respectivos.
Caso a hipótese nula seja aceita, significa que o modelo é nulo ou restrito (
).
É importante observar que um aparentemente pequeno resulta em uma estatística
altamente significativa. Portanto, é importante testar a significância conjunta e não apenas
analisar o valor do .
Viés e Inconsistência na inferência
Vieses ( ( ) ) que subestimem ou sobrestimem ( ) podem subestimar ou
sobrestimar a variância ( ( )
( ) ). Isso gera problemas na inferência sobre os
estimadores, pois a estatística t [ √
( ) ⁄ ] depende do valor correto de . Portanto
estimadores viesados podem resultar em uma estatística de teste errônea. Por exemplo,
quando uma hipótese nula deveria ser rejeitada, mas por conta dos estimadores viesados essa
é aceita.
Outro problema que afeta a estatista t é a heterocedasticidade ( não é constante). Apesar
de não causar viés nos estimadores , a heterocedasticidade causa viés na estimação da
variância de ( ( )
( ) para regressão simples e ( )
( )( )
para a
regressão múltipla).
Variáveis Dummy
Informações qualitativas podem ser usadas como variáveis na análise de regressão. Essas
variáveis são conhecidas como variáveis dummies e são normalmente estimadas por MQO. A
variável dummy é binária, assumindo valores de 0 ou 1. No caso mais simples
, uma variável dummy é utilizada para fazer a distinção entre dois grupos, e o
coeficiente estimado da variável dummy estima a diferença da média ceteris paribus entre os
dois grupos. Um exemplo de variável dummy dicotômica é gênero. É possível construir
modelos com duas (ou mais) dummies dicotômicas, . A
interpretação é análoga ao modelo com uma dummy, o objetivo é também captar diferenças
da média entre os grupos. Porém os grupos agora são todas as combinações possíveis entre as
duas variáveis, (Ex.: : homens e mulheres, brancos e negros; nº de grupos=4: homens
brancos, homens negros, mulheres brancas e mulheres negras).
Em modelo com variável dummy e variável quantitativa , a intuição
é um pouco diferente. Nesse caso, o objetivo é captar diferença de níveis de entre os grupos
dado a variável . Também é possível estipular interação entre uma variável dummy e uma
variável quantitativa, . A intuição é que existe um efeito
multiplicativo onde além da diferença da média entre os grupos, existe uma variação dessa
diferença (graficamente o coeficiente angular se altera, com as retas não mais sendo
paralelas). Por fim pode-se estipular um modelo com interação entre dummies,
. A intuição é que existe uma diferença adicional à diferença de
média entre os grupos.
As variáveis dummies não são usadas somente para variáveis dicotômicas. Pode-se usar um
conjunto de variáveis dummy para categorias múltiplas (ex.: macrorregiões, religião, etc). Cada
dummy representa uma categoria. É importante ressaltar que se houver g grupos então g-1
variáveis dummy são incluídas no modelo. Ao se omitir um dos grupos, o objetivo é evitar a
multicolinearidade perfeita entre as variáveis dummies. Esse grupo omitido é chamado de
grupo-base. As variáveis dummies categorizadas também podem ser usadas para incorporar
informações ordinais, como classificações de crédito, IDH, etc.
O teste de Chow pode ser usado para detectar se existem diferenças estatisticamente
significantes entre os grupos e assim validar ou não o uso da variável dummy.
Modelo de Probabilidade Linear
O modelo de probabilidade linear MPL, que é simplesmente estimado pelo MQO, possibilita
explicar uma resposta binária usando análise de regressão, ( )
. As estimativas MQO agora são interpretadas como alterações na probabilidade de
sucesso (y=1), dado um aumento de uma unidade na variável explicativa correspondente,
( ) . O MPL tem algumas inconveniências: pode produzir probabilidades
previstas menores que zero ou maiores que um; implica um efeito marginal constante de cada
variável independente que aparece em sua forma original; e contém heterocedasticidade.
Má-especificação do modelo
Quando o valor esperado do resíduo condicionado ao valor de é diferente de zero
( ) , tal hipótese implica que fatores não observados afetam sistematicamente o valor
médio de Y e sua violação implica na existência de viés de especificação.
O viés da especificação pode ser fruto da omissão de uma variável importante, seja por
exclusão seja por subespecificação do modelo. Isso geralmente conduz a viés e inconsistência
em todos os estimadores MQO.
A má-especificação do modelo também pode ser causada pela má-especificação da forma
funcional da variável independente ou variável dependente, caso haja uma relação não linear
entre e . Um exemplo de uso inapropriado de uma forma funcional da variável dependente
é salárioh ao invés de log(salárioh). Um modelo de regressão múltipla sofre de má-
especificação da forma funcional quando não explica de maneira apropriada a relação entre as
variáveis explicativas e a variável dependente observada. Apesar de trazer sérias
consequências, o problema é secundário uma vez que temos os dados necessários de todas as
variáveis necessárias para obter uma relação funcional que se ajuste bem aos dados.
Diante de uma relação não linear entre e , pode-se fazer transformação funcional da
variável independente para corrigir o problema. A logaritmização da variável e é
apropriada para modelos de elasticidade constante ( ). Qualquer
variação percentual de provoca uma variação percentual proporcional em (
). muitas vezes é chamado elasticidade de em relação a . Para o modelo
semilogarítmico , uma variação absoluta de provoca uma variação
percentual em ( ). é chamado semi elasticidade de em relação a
. Para , uma variação percentual de provoca uma variação absoluta
em ( ).
Outra relação não linear entre e bastante comum é a forma quadrática. Para
, uma variação de causa uma variação em condicionada ao valor de
( ( ) ). A medida que se aproxima do ponto de máximo/mínimo
(máx/mín=| ⁄ |), varia a taxas decrescentes. É importante ressaltar que para o modelo
quadrático e outras formas polinomiais, não existe multicolinearidade, pois não se trata de
efeitos separados. Por fim, efeitos multiplicativos causados por interações entre as variáveis
independentes podem ocorrer, . A variação de , ceteris
paribus, causa uma variação em , mas que é amplificada pelo valor de [ (
) . Assim como o efeito da variação de é influenciada pelo valor de [ (
) ].
Para identificar problemas de má-especificação da forma funcional, o teste de erro de
especificação da regressão (RESET) é bem útil. O teste RESET adiciona polinômios aos valores
estimados MQO para detectar tipos gerais de má-especificação de formas funcionais. Na maior
parte dos casos incluem-se os termos quadráticos e cúbicos (
e são funções não lineares de ). A hipótese nula do teste é que o
modelo está corretamente especificado. A estatística do teste RESET é a estatística
(
) ( )⁄
( ) ( ⁄ )
para . Uma estatística F
significativa sugere algum tipo de problema na forma funcional. Uma desvantagem do teste
RESET é que ela não fornece uma orientação prática de como proceder se o modelo for
rejeitado. Além disso, mesmo se a forma funcional for apropriadamente especificada, o teste
RESET não tem poder para detectar heterocedasticidade.
Erro de Medida
Quando se usa uma medida imprecisa de uma variável econômica em um modelo de
regressão, o modelo conterá um erro de medida. O método MQO será consistente sob certas
hipóteses, mas existem outras sob as quais ele será inconsistente. Em alguns casos, pode-se
inferir o tamanho do viés assimptótico. O erro de medida (na população) é definido como a
diferença entre o valor observado e o valor real: . O erro de medida pode ser
estimado como . É natural supor que o erro de medida
tem média zero, caso contrário o estimador do intercepto será viesado. Se a correlação
entre e é nula, os estimadores MQO serão não viesados e consistentes. Se e não são
correlacionados, então var( )
. Isso implica que o erro de medida na
variável dependente sobrestima ( ), a estatística t é subestimado aceitando, assim, a
hipótese nula.
O erro de medida em uma variável explicativa é , podendo ser negativo, positivo
ou zero. Presume-se que ( ) e que não é correlacionado com e . Sendo assim,
formula-se a hipótese que não é correlacionado com e . Se a hipótese for falsa, o
estimador MQO não será consistente.
Variável Proxy
A omissão de uma importante variável no modelo pode conduzir a viés e inconsistência nos
estimadores MQO. Porém sua exclusão muitas vezes ocorre por indisponibilidade de dados.
Uma forma de remediar é o uso de variável proxy que é uma variável altamente
correlacionada com a variável não observada. A variável Proxy também pode ser usada para
substituir variáveis com erro de medida.
Uma variável Proxy é uma variável que possui alta correlação com outro variável. Mas mais
importante, para que uma variável seja uma boa Proxy, esta não deve ter relação causal com a
variável a ser substituída. É um tanto contra intuitivo que uma variável que tenha uma elevada
correlação com outra, não existe relação causal entre elas. Um exemplo de variável Proxy
usado em modelos econômicos é a variável PIB per capita substituindo a variável qualidade de
vida.
Como já definido, a variável Proxy busca mimetizar certa variável. Ela é uma boa solução no
caso de variáveis omitidas que sejam complicadas de obter sua mensuração. Um exemplo é
usar a Proxy QI no lugar da variável aptidão em um modelo de salário. É razoável supor que QI
e aptidão estão altamente correlacionadas, mas não há uma relação causal entre elas. Pelo
fato de não ser possível mensurar a aptidão dos indivíduos, a variável é um fator não
observado. Assim sendo, a variável Proxy QI deve ter correlação com o resíduo.
Heterocedasticidade
O problema da heterocedasticidade ocorre quando a variância do termo de erro não é
constante. Tal hipótese não provoca viés ou inconsistência (consistência: quando o tamanho
da amostra tende ao infinito, o estimador tende ao seu valor real, ) nos estimadores
MQO. Todavia os estimadores de variâncias var( ) são viesados, pois ( ) ( )⁄ ,
muitas vezes implicando em resultados não esperados. A variância não sendo constante afeta
a estatística t. Quando ( ) é subestimada, a estatística t é sobrestimado rejeitando, assim,
a hipótese nula. Quando ( ) é superestimada, a estatística t é subestimada aceitando,
assim, a hipótese nula.
Um estimador válido de ( ) para qualquer forma de heterocedasticidade, inclusive para
formas homocedásticas, é
∑ ( )
. Para o modelo de regressão múltipla, o estimador válido
de ( ) é ( )
. A sua raiz quadrada é chamada de erro-padrão robusto em
relação à heterocedasticidade. Assim é possível construir uma estatística robusta em relação à
heterocedasticidade, onde
( ). A variável que era estatisticamente significante com o
uso da estatística t habitual continua estatisticamente significante com o uso da estatística t
robusta em relação à heterocedasticidade. Em amostras de tamanho grande cuja variância
seja desconhecida pode-se usar erros-padrão robustos em relação à heterocedasticidade.
Apesar de válido, o estimador MQO não mais será o estimador linear não viesado mais
eficiente. Para usar outras ações corretivas mais eficientes é necessário realizar testes que
detectem heterocedasticidade e a sua forma.
O teste Breusch-Pagan busca captar uma relação linear entre o resíduo e as variáveis
( ). Constrói-se então a estatística
⁄
( ) ( )⁄ . Se o p-valor for abaixo do nível de significância selecionado, então
rejeita-se a hipótese nula de homocedasticidade. Já o teste de White é mais completo que o
teste Breusch-Pagan, pois acrescenta iterações e formas funcionais de xi para captar tanto
linearidades quanto não linearidades entre o resíduo e as variáveis (
). Pode-se reescrever a equação
desta forma . O teste de White que não inclui iterações será
um teste de heterocedasticidade pura. Se tais termos estiverem presentes, trata-se de um
teste tanto de heterocedasticidade quanto de viés de especificação.
Havendo, por exemplo, uma relação linear entre resíduos e a variável ( é conhecido) pode-
se usar o método de Mínimos Quadrados Ponderados (MQP). O método consiste em dividir a
equação de previsão ponderando todas as variáveis por √ ( ) , ( ) , obtendo assim
√ ( )
√ ( )
√ ( )
√ ( )
√ ( ). Se corretamente especificada a forma
da heterocedasticidade, o método MQP é mais eficiente que MQO, pois novas estatísticas t e F
são produzidas. A intuição do método é que o peso atribuído a cada observação é
inversamente proporcional a sua , ou seja, observações vindas de uma população com
maior obterão peso relativamente menor e aquelas de uma população com menor terão
peso proporcionalmente maior na minimização da SQR.
Porém na maioria dos casos, a forma exata de heterocedasticidade, h(x), não é óbvia. Para
isso, temos o método de Mínimos Quadrados Generalizados Factíveis (MQGF) que transforma
o resíduo em semilogarítmico,
. Sendo ( )
, temos a equação
de previsão ponderada igual a
( )
( )
( )
( )
( ) . Apesar de o estimador MQGF ser viesado, ele é consistente e assimptoticamente
(para uma grande amostra) mais eficiente que o MQO.
Multicolinearidade
O problema da multicolinearidade ocorre na regressão múltipla quando existe uma correlação
entre as variáveis independentes, causada geralmente por viés de omissão de variável ou viés
de erro de medida. O problema da multicolinearidade é essencialmente amostral, tanto que os
não são significativos. Uma baixa variabilidade de aumenta a dispersão do , se ( )
é sobrestimado temos uma estatística t subestimada. É importante ressaltar que formas
funcionais de xi não violam a hipótese de multicolinearidade, apesar de que o coeficiente de
correlação mostrará que e estão altamente correlacionados.
Se a multicolinearidade for perfeita, os estimadores de MQO serão indeterminados e seus
erros-padrão infinitos. Se a multicolinearidade for menos que perfeita, os estimadores
possuirão grandes erros-padrão, em relação aos próprios estimadores, o que significa que não
podem ser estimados com grande precisão ou exatidão. Os são os mais eficientes, pois a
multicolinearidade reduz ( ), porém causando viés nos ( ( )
( )). Um ( )
subestimado resulta em ( ) sobrestimado, sobrestimando a estatística t e assim
aceitando a hipótese nula. Mesmo que a razão t seja estatisticamente insignificante, o R² pode
ser muito alto.
A velocidade com a qual as variâncias e covariâncias aumentam pode ser observada pelo fator
de inflação das variáveis (FIV), definido como ( )⁄ . Quando
, coeficiente de
correlação múltipla, tende a 1, o FIV tende ao infinito. Ou seja, quanto maior a colinearidade,
maior a variância de um estimador e, no limite, pode tornar-se infinita. Se não houver
colinearidade entre Xi, o FIV será 1. A variância do estimador ( ) pode ser expressa como
∑ ( )
mostrando que a variância de é diretamente proporcional ao FIV.
Outra forma de identificar a variável independente que está correlacionada a outras variáveis
independentes do modelo é fazer uma regressão para Xi contra as demais variáveis X e calcular
o R² correspondente, . Cada uma dessas regressões (ex.: )
é chamada de regressão auxiliar. A variável Xi segue distribuição
⁄
( ) ( )⁄
.
Se o F calculado excede o crítico no nível de significância escolhido, considera-se que Xi é
colinear com os outros X, se não exceder o crítico, este não será colinear mantendo a
variável no modelo.
Para corrigir o problema, Gujarati sugere algumas opções. Em caso de uma alta
multicolinearidade, uma opção é excluir uma das variáveis colineares. Porém tal solução pode
incorrer a outro problema mais grave que é o viés de especificação. Outra possível solução que
pode atenuar o problema é aumentar o tamanho da amostra ou até mesmo obter uma nova
base de dados.
Endogeneidade
O problema da endogeneidade ocorre quando a variável independente e o resíduo são
correlacionados, ( ) . Dizemos que é endógena quando esta variável observada
quantificada tem relação com uma variável não observada. Assim como na multicolinearidade,
problema da endogeneidade ocorre por erro de medida ou omissão de variável. Variáveis
instrumentais são usadas para mitigar o problema. Uma boa variável instrumental deve ter
alta correlação com a variável endógena e mínima correlação com o resíduo, ( ) e
( ) . Um exemplo de variável instrumental é a proximidade da universidade, pois a
variável dependente fazer ensino superior é muito correlacionado com a presença de
faculdade na cidade. É importante observar que uma variável Proxy não é um instrumento,
pois para que uma variável seja uma boa variável instrumental é necessário que haja um
princípio de causalidade entre a variável instrumental e a variável a ser substituída.
O método para estimar os com a variável instrumental é denominada de Mínimos
Quadrados Dois Estágios (MQ2E). No 1º estágio, usando o método de MQO estima-se
(forma reduzida), com . Uma boa
variável instrumental tem um alto no primeiro estágio. Como ( ) ( ), a
variável instrumental é significante somente se , o que é verificado através da estatística
t. No 2º estágio, também se usa o MQO para estimar
.
No caso da estimação do modelo simples , o pode ser calculado
algebricamente. Temos que ( ) ( ) ( ). Sendo ( ) e
( ) , ( )
( )
∑( )( )
∑( )( ). Para fazer inferência sobre o estimador,
( )
∑( ) , pressupõe que ( ) . Pela fórmula da variância do estimador
observa-se que ( ) ( ), apesar de mais eficiente geralmente o
estimador MQO é inconsistente. Porém caso ( ) seja estatisticamente consistente,
descarta-se o uso da variável instrumental. Neste caso o teste de Hausman busca testar se a
variável instrumental corrige o problema de endogeneidade. Para o teste estabelece-se a
( ) . O teste usa o MQ2E, sendo o 1º estágio:
. O 2º estágio: . Se é estatisticamente significativo,
rejeita-se e a variável instrumental não corrigiu o problema da endogeneidade.
Mais de uma variável instrumental pode ser usada no MQ2E, porém tal medida corretiva pode
não contribuir efetivamente para a solução do problema. É necessário testar se uma variável
instrumental é suficiente. O teste de sobre-identificação consiste primeiramente em estimar
. Depois estima-se , sendo que
Estimado , estima-se . A estatística do
teste é , onde é o valor da estimação e q é o
número de instrumentos adicionais. Compara-se o valor do multiplicador de Lagrange
com o valor crítico da distribuição qui-quadrada .
Equações Simultâneas
Em modelos uniequacionais, existe uma relação causal unidirecional entre variáveis
independentes e variáveis dependentes. Porém existem situações onde essa relação causal
não é unidirecional, ou seja, as variáveis independentes afetam as variáveis dependentes e as
variáveis dependentes também afetam as variáveis independentes. Temos então uma situação
caracterizada por endogeneidade perfeita. Para lidar com este tipo de problema usamos
modelos de equações simultâneas, nas quais há mais do que uma equação de regressão, uma
para cada variável interdependente.
Se não há problema de simultaneidade, os estimadores MQO produzem estimadores
consistentes e eficientes. Por outro lado, se há simultaneidade, os estimadores MQO não são
sequer consistentes. Na presença da simultaneidade, o método de MQ2E oferece estimadores
consistentes e eficientes. Curiosamente, se usarmos variáveis instrumentais quando não há de
fato simultaneidade, estes nos oferecerão estimadores consistentes, mas não eficientes.
Porém antes de descartar o uso do método MQ2E, caso as variáveis dependentes não sejam
simultâneas é necessário testar se realmente o problema inexiste. Para esse propósito usamos
o teste de Hausman. Para que haja simultaneidade é essencial que o regressor endógeno seja
correlacionado com o termo de erro. A hipótese nula do teste é de que não há simultaneidade,
( ) . No 1º estágio estimamos e no 2º estágio
. Se é estatisticamente significativo, rejeita-se e há
simultaneidade entre as variáveis dependentes.
Propriedades assintóticas
Assintótico significa que o tamanho da amostra tende ao infinito, ou seja, quando o tamanho
da amostra tende à sua população. O n depende da variância de x populacional. A partir deste
conceito definimos consistência dos estimadores MQO como o valor esperado de tendendo
ao quando o tamanho da amostra tende à população, o que pode ser representado
graficamente na figura 5.1. Sob os pressupostos de Gauss-Markov, os estimadores MQO são
consistentes. A inexistência de viés dos estimadores, embora importante, não pode ser
conseguida sempre. Por exemplo, o erro-padrão da regressão não é um estimador não
viesado do desvio-padrão do erro em um modelo de regressão múltipla.
O estimador da regressão simples pode ser interpretado como sendo o parâmetro
populacional acrescido do termo de erro: ∑( )
∑( )
∑( ) ⁄
∑( ) ⁄. Usando as
propriedades dos limites da probabilidade, obtemos: ( ) ( )⁄ .
Caso não haja violação do pressuposto ( ) , então . Portanto, a
consistência pode ser definida como a probabilidade limite do estimador ser igual ao
parâmetro populacional. Quanto maior ( ), mais distante está de . Quanto maior
o tamanho de n, menor o efeito da correlação entre fatores observados e fatores não
observados sobre a estimação.
A consistência de um estimador é uma importante propriedade, mas ela sozinha não nos
permite trabalhar com inferência estatística. Para isso é necessário que os estimadores MQO
sigam uma distribuição normal. A normalidade exata dos estimadores de MQO depende
crucialmente da normalidade da distribuição do erro na população. Se os erros forem
extrações aleatórias de alguma distribuição diferente da normal, o não será normalmente
distribuído, o que significa que não será possível obter p-valores das distribuições e .
É importante observar que a não normalidade do termo de erro não implica de modo algum
em viés nos estimadores MQO. O estimador também continua sendo o mais eficiente sob as
hipóteses de Gauss-Markov. Ainda que não sigam uma distribuição normal, podemos usar o
teorema do limite central para concluir que os estimadores de MQO satisfazem a normalidade
assimptótica, o que significa que eles são, de maneira aproximada, normalmente distribuídos
em amostras de tamanhos suficientemente grandes.