Upload
internet
View
145
Download
12
Embed Size (px)
Citation preview
Econometria
1. Propriedades finitas dos estimadores MQO
2. Estimação da Variância do estimador de MQO
Algumas considerações
Parâmetros, estimativas e estimadores Propriedades de um estimador – a
distribuição amostral Propriedades de “Amostras Finitas” Propriedades “assintóticas” ou de
“grandes amostras”.
Algumas considerações
Resultados de Amostras finitas: Não viés Distribuição precisa de algumas estatísticas
de testes.
Hipóteses fortes necessárias: regressores não estocásticos e distúrbios normalmente distribuídos.
MQO
1
1 1
n1 1i ii 1
n1i ii 1
n 1i ii 1
n
i ii 1
( )
= ( ) ( )
Also
( ) = ( ) y
( )
= ( )
= (Influence functions)
b X'X X'y
X'X X'(X + )= X'X X'
b X'X X'y X'X x
= X'X x
X'X x
v
Derivando as Propriedades
Desta forma, b = um vetor de parâmetros + uma combinação linear de distúrbios, cada um vezes um vetor.
b é um vetor de variáveis aleatórias.
Regressores (X) não são estocásticos. A análise é feita condicional a X, ou seja, os
resultados não dependem de um X particular. O resultado é geral, independente de X.
Propriedades do estimador de MQO
b não é viesado!Valor esperado de b:E[b|X] = E[ + (XX)-1X|X] = + (XX)-1XE[|X] = + 0E[b] = EX{E[b|X]} = E[b].(Lei das expectativas iteradas!!!)
Propriedades do Estimador MQO
Um resultado importante sobre especificação
Omissão de variáveis: y = X11 + X22 + (modelo
verdadeiro)
Dois conjuntos de variáveis. O que acontece se o segundo conjunto de variáveis é excluído da minha regressão?
Propriedades do Estimador MQO
Qual a esperança do estimador desta regressão menor?
E[b1|(y = X11 + X22 + )] b1 = (X1X1)-1X1y = = (X1X1)-1X1(X11 + X22 + )
E[b1] = 1 + (X1X1)-1X1X22
O estimador é viesado.
Um resultado importante sobre especificação (inclusão de uma variável irrelevante):
y = X11 + X22 + (modelo verdadeiro, mas 2 é igual a 0).
O que acontece se a regressão for computada usando X1 e X2?
E[b1.2| 2 = 0] = 1
O estimador não será viesado. Contudo, perde-se eficiência.
Propriedades do Estimador MQO
Aplicação empírica: Quantidade = 1Preço + 2Renda +
Se regredimos Quantidade em Preço. O que encontramos?
Propriedades do Estimador MQO
Usualmente, 1 < 0, 2 > 0, Cov[Preço,Renda] >
0.Desta forma, a regressão que omite variável (omite
renda), irá super-estimar o coeficiente de preço (podendo até reverter o sinal do coeficiente).
Propriedades do Estimador MQO
211 .)var(
),cov()(
preço
rendapreçobE
Outro exemplo práticoDeterminar os efeitos que fumar durante a
gravidez exerce sobre a saúde do recém-nascido. A medida de saúde do recém nascido é o peso de nascimento (bwght). Como outros fatores que afetam o peso de nascimento, além de fumar, estão provavelmente correlacionados com o fumo, devemos levar em consideração tais fatores. Por exemplo, uma renda maior geralmente permite acesso a pré-natais melhores, bem como uma melhor nutrição da mulher. Considere o modelo: ucfacigsbwght min.. 210
14
Outro exemplo práticoModelo 1: Estimativas OLS usando as 1388 observações 1-1388
Variável dependente: bwght
Variável Coeficiente Erro Padrão estatística-t p-valor const 116,974 1,04898 111,5118 <0,00001 *** cigs -0,463408 0,0915768 -5,0603 <0,00001 *** faminc 0,0927647 0,0291879 3,1782 0,00151 ***
Média da variável dependente = 118,7 Desvio padrão da variável dependente = 20,354 Soma dos resíduos quadrados = 557486 Erro padrão dos resíduos = 20,0628 R2 não-ajustado = 0,0298048 R2 ajustado = 0,0284038 Estatística-F (2, 1385) = 21,2739 (p-valor < 0,0000
15
Outro exemplo práticoModelo 2: Estimativas OLS usando as 1388 observações 1-1388
Variável dependente: bwght
Variável Coeficiente Erro Padrão estatística-t p-valor const 119,772 0,572341 209,2668 <0,00001 *** cigs -0,513772 0,0904909 -5,6776 <0,00001 ***
Média da variável dependente = 118,7 Desvio padrão da variável dependente = 20,354 Soma dos resíduos quadrados = 561551 Erro padrão dos resíduos = 20,1286 R2 não-ajustado = 0,0227291 R2 ajustado = 0,022024 Graus de liberdade = 1386
16
Equações estimadas
023,0 1388
.513,077,119
030,0 1388
min.093,0.463,097,116
2
2
Rn
cigsbwghtest
Rn
cfacigsbwghtest
17
Resultados O efeito de fumar é relativamente menor quando a renda familiar é adicionada na regressão, mas a diferença não é grande.
Isto decorre do fato de faminc e cigs não serem muito correlacionados e do coeficente de faminc ser praticamente pequeno. (A variável faminc está em milhares, logo, R$10,000 a mais aumenta o peso de nascimento somente em 0,93 quilos).
Corr(faminc, cigs)=-0,173
18
Viés de variável omitida
A variável omitida é faminc
Espera-se que o efeito de faminc sobre o peso de nascimento seja positivo (β2>0)
Corr(faminc, cigs)=-0,173
O coeficiente passou de -0,463 para -0,513.
21
2111 .
)var(
),cov()(
x
xxbE
19
Direção do viés
Corr(x1, x2) > 0 Corr(x1, x2) < 0
b2 > 0 Viés positivo Viés negativo
b2 < 0 Viés negativo Viés positivo
20
Outro exemplo prático
educIQ
eI
veducl
uIQeduclwage
10
1
10
210
~~:
~ achamos ,duc em Q de regressão da Onde
~~wage estimamos
que mas ,
por dado seja o verdadeirmodelo o que Suponha
21
Outro exemplo práticoModelo 1: Estimativas OLS usando as 935 observações 1-935
Variável dependente: IQ
Variável Coeficiente Erro Padrão estatística-t p-valor const 53,6872 2,62293 20,4684 <0,00001 *** educ 3,53383 0,19221 18,3853 <0,00001 ***
Média da variável dependente = 101,282 Desvio padrão da variável dependente = 15,0526 Soma dos resíduos quadrados = 155347 Erro padrão dos resíduos = 12,9036 R2 não-ajustado = 0,265943 R2 ajustado = 0,265157 Graus de liberdade = 933
1~
22
Outro exemplo prático
Modelo 3: Estimativas OLS usando as 935 observações 1-935 Variável dependente: lwage
Variável Coeficiente Erro Padrão estatística-t p-valor
const 5,97306 0,0813737 73,4029 <0,00001 *** educ 0,0598392 0,00596309 10,0349 <0,00001 ***
Média da variável dependente = 6,779 Desvio padrão da variável dependente = 0,421144 Soma dos resíduos quadrados = 149,519 Erro padrão dos resíduos = 0,40032 R2 não-ajustado = 0,0974168 R2 ajustado = 0,0964494 Graus de liberdade = 933 1
~
23
Outro exemplo prático
Modelo 4: Estimativas OLS usando as 935 observações 1-935 Variável dependente: lwage
Variável Coeficiente Erro Padrão estatística-t p-valor
const 5,65829 0,0962408 58,7930 <0,00001 *** educ 0,0391199 0,00683821 5,7208 <0,00001 *** IQ 0,00586313 0,00099791 5,8754 <0,00001 ***
Média da variável dependente = 6,779 Desvio padrão da variável dependente = 0,421144 Soma dos resíduos quadrados = 144,178 Erro padrão dos resíduos = 0,393316 R2 não-ajustado = 0,129654 R2 ajustado = 0,127786 Estatística-F (2, 932) = 69,4191 (p-valor < 0,00001)
24
Direção do viés
Corr(x1, x2) > 0 Corr(x1, x2) < 0
b2 > 0 Viés positivo Viés negativo
b2 < 0 Viés negativo Viés positivo
Variância do Estimador MQO Hipóteses sobres os distúrbios: i tem média zero e não é correlacionado
com qualquer outro elemento j Var[i|X] = 2. A variância de i não
depende do dado da amostra. Não depende de X. 2
1
22 2
2n
0 ... 0
0 ... 0Var |
... 0 0 0
0 0 ...
X I
Variância do Estimador MQO2
1
22 2
2n
1 1 1
2 2 2
n n n
0 ... 0
0 ... 0Var |
... 0 0 0
0 0 ...
Var E Var | Var E... ... ...
X
X
I
2 2
|
0
0 E Var = .
...
0
X
I I
Variância do Estimador MQO
1
1 1
1
1 1
1 2 1
( )
= ( ) ( ) ( )
E[ | ]= ( ) | as |
Var[ | ] E[( )( ) '|
( ) '| ( )
( ) ( )
b X'X X'y
X'X X' X + = X'X X'
b X X'X X'E[ X]= E[ X]= 0
b X b b X]
= X'X X'E[ X] X X'X
= X'X X' I X X'X
2 1 1
2 1 1
2 1
( ) ( )
( ) ( )
( )
= X'X X'I X X'X
= X'X X'X X'X
= X'X
Erros de especificação
Omitindo variáveis relevantes: Suponha que o modelo correto é
y = X11 + X22 + .
Computar MQO omitindo X2. É fácil provar que:
Var[b1] é menor que a Var[b1.2].
Temos uma menor variância quando omitimos X2. (Omitindo X2 , 2 = 0 posso usar mais informação extra para estimação). Mesmo que a informação não seja correta, reduz a variância.
Erro de especificação(Não há almoço grátis!!) E[b1] = 1 + (X1X1)-
1X1X22 1. Desta forma, b1 é viesado.(!!!) O viés pode reverter até o sinal do coeficiente. b1 deve ser mais preciso
A variância é menor contudo o viés é positivo. Se o viés é pequeno se favorece a regressão mais simples.
Suponha X1X2 = 0. Viés vai embora A informação não está correta, é irrelevante. b1 é igual a b1.2.
Erro de especificação: Inclusão de variável irrelevante
Os resultados são contrários aos encontrados acima.
Inserir resultados supérfluos aumenta a variância. (reduz precisão)
Não causa viés, se X2 é supérflua, 2 = 0, e E[b1.2] = 1.
Teorema de Gauss-Markov
O EMQO é o melhor estimador linear dentro da classe de estimadores lineares não viesados.
1. Estimador linear
2. Não viesado: E[b|X] = β
Teorema: Var[b*|X] – Var[b|X] é uma matriz definida não negativa para qualquer outro estimador linear não viesado b* que não seja igual a b.
Definição: b é eficiente na classe de estimadores.
n
i ii 1 =
v
Teorema de Gauss-Markov
Resultado geral para a classe de estimadores lineares e não viesados
1-0
*
XC e X de tesindependen elinearment linhas primeirask
pelas formado é C que Suponha C. para candidatos váriosExistem
:forma Desta
ter viés)não (para )/()/(
ICX
CX
XCECXXCyE
Cyb
Teorema de Gauss-Markov
Como achar a Matriz de variância-covariância de b*?
Dybb
DyyXXXCy
DXXXC
CCCXCE
XCCEXbbE
CXCCybICX
XbbEXb
*
´)´(
´)´(
´´)´/(
])´/)([(])´/*)(*[(
)(* e :que Lembre
])´/*)(*[()/*var(
1
1
2
Teorema de Gauss-Markov
Como D é uma matriz definida não negativa, temos que a var(b*/x) é sempre maior que a var(b/x).
´)/var()/*var(
)´(´)/*var(
zero) a igual será DX logo ,´)´(DXICX que lembre(
´)´])´(´)()´([(´)/*var(
2
122
1
1122
DDXbXb
XXDDXb
IDXXXXX
XXXDXXXDCCXb
Fixar X ou Condicionar em X?
O papel da hipótese dos regressores não estocásticos,
Incondicional: Tomar a média em torno de X:
Os resultados valem para X estocástico bem como para X não estocástico.
X de médio valor um para valerá tambémisto ))/(var(Evar(b)
:que temos,particular X um para valeisto se Logo,
.específico X um para e b qq para )/var()/var(
])´[()]/([)]/[var()var(
x
00
12
Xb
bXbXb
XXEXbEVarXbEb xxx
Contexto
A variância verdadeira de b é 2E[(XX)-1] Como usamos os dados da amostra para estimar esta matriz?
Como queremos formar intervalos de confiança das estimativas da regressão bem como formular hipóteses, temos que ter estimativas da variabilidade da distribuição.
Estimando 2
Usaremos os resíduos ao invés dos distúrbios:
Análogo amostral: ee/n para /n
Observação imperfeita de i = ei + ( - b)xi
Viés para baixo de ee/n. E[ee] = (n-K)2
Esperança de e’e
1
1
( ' ) '
[ ( ' ) ']
( )
( '(
e y- Xb
y X X X X y
I X X X X y
My M X MX M M
e'e M M
'M'M 'MM 'M
Valor esperado do quadrado dos resíduos
E[ ]
E[ trace ( ) ] scalar = its trace
E[ trace ( ) ] permute in trace
[ trace E ( ) ] linear operators
e'e| X 'M | X
'M | X
M '| X
M '| X
2
2
2
[ trace E ( ) ] conditioned on X
[ trace ] model assumption
[trace ] scalar multiplication and matrix
trace [ - ( ) ]
-1
M '| X
M I
M I
I X X'X X'
2
2
2
2
{trace [ ] - trace[ ( ) ]}
{n - trace[( ) ]} permute in trace
{n - trace[ ]}
{n - K}
-1
-1
I X X'X X'
X'X X'X
I
Traço: soma dos elementos da diagonal
Estimando σ2
O estimador não viesado é s2 = ee/(n-K).
s2 = ee/(n-K) = M/(n-K).
Est [Var (b/X)] = s2 [(XX)-1
“Erro padrão” de coeficiente individual é a raiz quadrada do elemento da diagonal.
----------------------------------------------------------------------Ordinary least squares regression ........LHS=G Mean = 226.09444 Standard deviation = 50.59182 Number of observs. = 36Model size Parameters = 7 Degrees of freedom = 29Residuals Sum of squares = 778.70227 Standard error of e = 5.18187 <= sqr[778.70227/(36 – 7)]Fit R-squared = .99131 Adjusted R-squared = .98951--------+-------------------------------------------------------------Variable| Coefficient Standard Error t-ratio P[|T|>t] Mean of X--------+-------------------------------------------------------------Constant| -7.73975 49.95915 -.155 .8780 PG| -15.3008*** 2.42171 -6.318 .0000 2.31661 Y| .02365*** .00779 3.037 .0050 9232.86 TREND| 4.14359** 1.91513 2.164 .0389 17.5000 PNC| 15.4387 15.21899 1.014 .3188 1.67078 PUC| -5.63438 5.02666 -1.121 .2715 2.34364 PPT| -12.4378** 5.20697 -2.389 .0236 2.74486--------+-------------------------------------------------------------