Upload
irma
View
163
Download
0
Embed Size (px)
DESCRIPTION
第八章 扩展的单方程计量经济学模型. §8.1 变参数线性单方程计量经济学模型 §8.2 非线性单方程计量经济学模型 §8.3 二元离散选择模型 * §8.4 平行数据计量经济学模型. §8.1 变参数单方程计量经济学模型. 一、 确定性变参数模型 *二、 随机变参数模型. 说明. 常参数模型 与 变参数模型 。真正的常参数模型只存在于假设之中,变参数的情况是经常发生的。 模型参数是变量,但不是随机变量,而是确定性变量,称为 确定性变参数模型 。 模型参数不仅是变量,而且是随机变量,称为 随机变参数模型 。 - PowerPoint PPT Presentation
Citation preview
第八章 扩展的单方程计量经济学模型
• §8.1 变参数线性单方程计量经济学模型
• §8.2 非线性单方程计量经济学模型
• §8.3 二元离散选择模型
• §8.4 平行数据计量经济学模型
§8.1 变参数单方程计量经济学模型
一、 确定性变参数模型
*二、随机变参数模型
说明• 常参数模型与变参数模型。真正的常参数模型只存在于假设之中,变参数的情况是经常发生的。
• 模型参数是变量,但不是随机变量,而是确定性变量,称为确定性变参数模型。
• 模型参数不仅是变量,而且是随机变量,称为随机变参数模型。
• 内容广泛,本节仅讨论最简单的变参数模型。
一、确定性变参数模型
⒈参数随某一个变量呈规律性变化 y xt t t t t
t t
t t
p
p
0 1
0 1
y p x p xt t t t t t 0 1 0 1
• 实际经济问题中的实例:具有经济意义的参数受某一因素的影响。
• 模型的估计
p为确定性变量,与随机误差项不相关,可以用 OLS方法估计,得到参数估计量。
可以通过检验 α1、 β1是否为 0来检验变量
p是否对 α、 β 有影响。
⒉参数作间断性变化
t t
t t
p
p
0 1
0 1
1 0
10
0
t n p
n t n pt
t
• 在实际经济问题中,往往表示某项政策的实 施在某一时点上发生了变化。
• 这类变参数模型的估计,分 3种不同情况。
( 1) n0已知• 可以分段建立模型,分段估计模型( CHOW方法)
Chow 检验
分段参数估计量不等
分段参数估计量相等
:
:
1
0
H
H
))1(2/()(
)1/()(
21
21
knSSESSE
kSSESSESSEF
save income
1964 0.36 8.8
1965 0.21 9.4
1966 0.08 10
1967 0.2 10.6
1968 0.1 11
1969 0.12 11.9
1970 0.41 12.7
1971 0.5 13.5
1972 0.43 14.3
1973 0.59 15.5
1974 0.9 16.7
1975 0.95 17.7
1976 0.82 18.6
1977 1.04 19.7
1978 1.53 21.1
1979 1.94 22.8
1980 1.99 25.2
例 8.1.1 数据
0.0
0.5
1.0
1.5
2.0
2.5
5 10 15 20 25 30
INCOME
SA
VE
例 8.1.1 散点图
1964—1972 估计结果
Dependent Variable: SAVE
Method: Least Squares
Date: 09/15/04 Time: 22:22
Sample: 1964 1972
Included observations: 9
Variable Coefficient Std. Error t-Statistic Prob.
C -0.266249 0.305353 -0.871940 0.4121
INCOME 0.047028 0.026569 1.770053 0.1200
R-squared 0.309194 Mean dependent var 0.267778
Adjusted R-squared 0.210507 S.D. dependent var 0.158964
S.E. of regression 0.141245 Akaike info criterion -0.883517
Sum squared resid 0.139650 Schwarz criterion -0.839689
Log likelihood 5.975825 F-statistic 3.133086
Durbin-Watson stat 1.130344 Prob(F-statistic) 0.120027
1973—1980 估计结果
Dependent Variable: SAVE
Method: Least Squares
Date: 09/15/04 Time: 22:25
Sample: 1973 1980
Included observations: 8
Variable Coefficient Std. Error t-Statistic Prob.
C -1.846345 0.402197 -4.590648 0.0037
INCOME 0.155949 0.020216 7.714237 0.0002
R-squared 0.908410 Mean dependent var 1.220000
Adjusted R-squared 0.893145 S.D. dependent var 0.530768
S.E. of regression 0.173501 Akaike info criterion -0.452951
Sum squared resid 0.180615 Schwarz criterion -0.433091
Log likelihood 3.811805 F-statistic 59.50946
Durbin-Watson stat 1.670473 Prob(F-statistic) 0.000249
1964—1980 估计结果Dependent Variable: SAVE
Method: Least Squares
Date: 09/18/04 Time: 17:58
Sample: 1964 1980
Included observations: 17
Variable Coefficient Std. Error t-Statistic Prob.
C -1.077779 0.157422 -6.846443 0.0000
INCOME 0.117504 0.009835 11.94745 0.0000
R-squared 0.904908 Mean dependent var 0.715882
Adjusted R-squared 0.898568 S.D. dependent var 0.613107
S.E. of regression 0.195265 Akaike info criterion -0.318792
Sum squared resid 0.571924 Schwarz criterion -0.220767
Log likelihood 4.709730 F-statistic 142.7416
Durbin-Watson stat 0.851219 Prob(F-statistic) 0.000000
Chow Test
Chow Breakpoint Test: 1972
F-statistic 5.091499
Probability
0.023282
Log likelihood ratio 9.833988
Probability
0.007321
3.80( 1%显著性水平)< 5.09< 6.70( 5%显著性水平),在 0.023的显著性水平下拒绝 H0。
• 也可以引入虚变量,建立一个统一的模型( Gujarati方法)
y D x D xt t t t t t 0 1 0 1
0
0
1 1
0
t n D
n t n D
)(1034.04843.11505.07502.1ˆ DXDXY
. . ( )
. . ( )
Y X
Y X
1 1
2 2
0 2659 0 0471 1964 1972
17502 01505 1973 1981
. . ( )
. . ( )
Y X
Y X
1 1
2 2
0 2645 0 0474 1964 1972
175017 015045 1973 1981
分段
• n0未知,但 Var Vart t( ) ( ) 1 2
一般可以选择不同的 n0 ,进行试估计,然
后从多次试估计中选择最优者。选择的标准是使得两段方程的残差平方和之和最小。
• n0未知,且 Var Vart t( ) ( ) 1 2 将 n0看作待估参数,用最大或然法进行估计。
( 2) n0未知
*二、随机变参数模型
⒈ 参数在一常数附近随机变化
• 将原模型转换为具有异方差性的模型,而且已经推导出随机误差项的方差与解释变量之间的函数关系。
t t t t
• 可以采用经典线性计量经济学模型中介绍的估计方法,例如加权最小二乘法等方法很方便地估计参数。
• 一种普遍的形式是 1968 年提出的的变参数Hildreth-Houck 模型 。
⒉ 参数随某一变量作规律性变化,同时受随机因素影响
• 将原模型转换为具有异方差性的多元线性模型。
t t tp t t tp
tttttttttt xxpxpy
• 可以采用经典线性计量经济学模型中介绍的估计方法,例如加权最小二乘法等方法很方便地估计参数。
⒊ 自适应回归模型
• 由影响常数项的变量具有一阶自相关性所引起。
• 是实际经济活动中常见的现象。
• 采用广义最小二乘法( GLS )估计模型参数 。
t t t
t
t
E
Var
1 1
2
0( )
( )
t
§8.2简单的非线性单方程计量经济学模型
一、 非线性单方程计量经济学模型概述
二、非线性普通最小二乘法
三、例题及讨论
说明
• 非线性计量经济学模型在计量经济学模型中 占据重要的位置 ;已经形成内容广泛的体
系,包括变量非线性模型、参数非线性模型、随机误差项违背基本假设的非线性问题等;
• 非线性模型理论与方法已经形成了一个与线性模型相对应的体系,包括从最小二乘原理出发的一整套方法和从最大或然原理出发的一整套方法。
• 本节仅涉及最基础的、具有广泛应用价值的非线性单方程模型的最小二乘估计。
一、非线性单方程计量经济学模型概述
⒈ 解释变量非线性问题
• 现实经济现象中变量之间往往呈现非线性关系 需求量与价格之间的关系 成本与产量的关系 税收与税率的关系 基尼系数与经济发展水平的关系
• 通过变量置换就可以化为线性模型
⒉ 可以化为线性的包含参数非线性的问题 • 函数变换
Q AK L
• 级数展开
Q A K L ( )
1 2
1
ln ln ln( ) lnQ A K L 11 2
ln ln ln ln (ln( )) lnQ A K LK
L 1 2 1 2
21
2
ln ln ln ln lnQ A K L
⒊不可以化为线性的包含参数非线性的问题
Q AK L
Q A K L ( )
1 2
1
•与上页的方程比较,哪种形式更合理?•直接作为非线性模型更合理。
二、非线性普通最小二乘法
⒈ 普通最小二乘原理
y f xi i i ( , )
S y f xi ii
n
( ) ( ( , )) 2
1
dS
dy f x
df x
di i
i
i
n
( ( , )(( , )
)
2 0
1
( ( , )(( , )
)y f xdf x
di i
i
i
n
1
0
残差平方和
取极小值的一阶条件
如何求解非 线性方程?
⒉ 高斯-牛顿 (Gauss-Newton)迭代法
• 高斯-牛顿迭代法的原理
对原始模型展开台劳级数,取一阶近似值
f x f xdf x
di i
i( , ) ( , )( , )
( )( ) ( )( )
0 0
0
zdf x
di
i( )( , )
S y f x zi i ii
n
( ) ( ( , ) ( )( ))( ) ( ) ( ) 0 0 0
1
2
( ( , ) ( ) ( ) )( ) ( ) ( ) ( )y f x z zi i i ii
n
0 0 0 01
2
(~ ( ) ( ) )( ) ( )y zii
n
i 01
02
构造并估计线性伪模型
iii zy )ˆ()ˆ(~)0()0( 构造线性模型
S y zii
n
i( ) (~ ( ) ( ) )( ) ( ) ( ) ( ) 1 01
0 12
估计得到参数的第 1次迭代值 ( ) 1
迭代
• 高斯-牛顿迭代法的步骤
第一步:给出参数估计值 的初值 ( ) 0 ,将 f xi( , ) 在
( ) 0 处展开台劳级数,
取一阶近似值;
第二步:计算 zdf x
di
i( , )
( )
0
和 ~ ( , ) ( ) ( )y y f x zi i i i 0 0 的样本观测值;
第三步:采用普通最小二乘法估计模型 iii zy ~ ,得到 的估计值 ( ) 1 ;
第四步:用 ( ) 1 代替第一步中的
( ) 0 ,重复这一过程,直至收敛。
⒊ 牛顿-拉夫森 (Newton-Raphson)迭代法
• 自学,掌握以下 2个要点
• 牛顿-拉夫森迭代法的原理– 对残差平方和展开台劳级数,取二阶近似值;
– 对残差平方和的近似值求极值;
– 迭代。
• 与高斯-牛顿迭代法的区别–直接对残差平方和展开台劳级数,而不是对其中的原模型展开;
–取二阶近似值,而不是取一阶近似值。
⒋应用中的一个困难
• 如何保证迭代所逼近的是总体极小值(即最小值)而不是局部极小值?
• 需要选择不同的初值,进行多次迭代求解。
⒌非线性普通最小二乘法在软件中的实现
• 给定初值• 写出模型• 估计模型• 改变初值• 反复估计
三、例题与讨论
例 8.2.1 农民收入影响因素分析模型
• 分析与建模:经过反复模拟,剔除从直观上看可能对农民收入产生影响但实际上并不显著的变量后,得到如下结论:改革开放以来,影响我国农民收入总量水平的主要因素是从事非农产业的农村劳动者人数、农副产品收购价格和
农业生产的发展规模。
• 用 I表示农民纯收入总量水平、 Q表示农业生产的发展规模、 P表示农副产品收购价格、 L表示从事非农产业的农村劳动者人数。收入采用当年价格;农业生产的发展规模以按可比价格计算的、包括种植业、林业、牧业、副业和渔业的农业总产值指数为样本数据;农副产品收购价格以
价格指数为样本数据。
I AQ P L 1 2 3
• 农民收入及相关变量数据年份
I( 10亿元) Q (1978=100) P (1978=100) L( 100万人)
1978 62.45 100.0 100.0 31.52
1979 79.30 107.5 122.1 31.90
1980 96.50 109.0 130.8 35.02
1981 107.65 115.3 138.5 36.92
1982 120.80 128.4 141.5 38.05
1983 142.40 138.4 147.8 43.40
1984 185.85 155.4 153.7 58.88
1985 238.70 160.7 166.9 67.13
1986 285.52 166.1 177.6 75.22
1987 343.80 175.8 198.9 81.30
1988 442.60 182.6 244.6 86.11
1989 495.30 188.3 281.3 84.98
1990 524.66 202.6 274.0 86.74
1991 559.30 210.1 268.4 89.06
1992 613.66 223.5 277.5 97.65
1993 743.49 241.0 314.7 109.98
1994 979.39 261.7 440.3 119.64
1995 1271.16 290.2 527.9 127.07
1996 1567.33 317.5 550.1 130.28
1997 1721.71 333.7 525.3 135.27
• 线性化模型估计结果Dependent Variable: LNPI
Method: Least Squares
Date: 09/15/04 Time: 18:46
Sample(adjusted): 1980 1997
Included observations: 18 after adjusting endpoints
Convergence achieved after 14 iterations
Variable Coefficient Std. Error t-Statistic Prob.
C -4.721864 0.565057 -8.356441 0.0000
LNPQ 0.511107 0.318194 1.606273 0.1342
LNPP 0.786022 0.150837 5.211071 0.0002
LNNPL 0.855205 0.139567 6.127566 0.0001
AR(1) 0.825105 0.248375 3.322013 0.0061
AR(2) -0.663146 0.235130 -2.820340 0.0155
R-squared 0.998421 Mean dependent var 5.997589
Adjusted R-squared 0.997762 S.D. dependent var 0.913254
S.E. of regression 0.043199 Akaike info criterion -3.184790
Sum squared resid 0.022394 Schwarz criterion -2.888000
Log likelihood 34.66311 F-statistic 1517.138
Durbin-Watson stat 2.303586 Prob(F-statistic) 0.000000
Inverted AR Roots .41+.70i .41 -.70i
• 非线性模型估计结果( 1978-1997)Dependent Variable: PI
Method: Least Squares
Date: 09/11/03 Time: 23:14
Sample: 1978 1997
Included observations: 20
Convergence achieved after 34 iterations
PI=C(1)*PQ^C(2)*PP^C(3)*NPL^C(4)
Coefficient Std. Error t-Statistic Prob.
C(1) 0.001531 0.000505 3.028304 0.0080
C(2) 1.775685 0.185239 9.585891 0.0000
C(3) 0.263793 0.101856 2.589860 0.0197
C(4) 0.398177 0.181057 2.199178 0.0429
R-squared 0.997286 Mean dependent var 529.0785
Adjusted R-squared 0.996777 S.D. dependent var 498.0612
S.E. of regression 28.27622 Akaike info criterion 9.698776
Sum squared resid 12792.72 Schwarz criterion 9.897923
Log likelihood -92.98776 Durbin-Watson stat 0.606942
• 非线性模型估计结果( 1980-1997)Dependent Variable: PI
Method: Least Squares
Date: 09/15/04 Time: 21:23
Sample: 1980 1997
Included observations: 18
Convergence achieved after 6 iterations
PI=C(1)*PQ^C(2)*PP^C(3)*NPL^C(4)
Coefficient Std. Error t-Statistic Prob.
C(1) 0.001578 0.000562 2.808677 0.0139
C(2) 1.786238 0.197815 9.029839 0.0000
C(3) 0.271197 0.109334 2.480443 0.0264
C(4) 0.370004 0.202251 1.829430 0.0887
R-squared 0.997032 Mean dependent var 579.9900
Adjusted R-squared 0.996396 S.D. dependent var 499.7962
S.E. of regression 30.00259 Akaike info criterion 9.833575
Sum squared resid 12602.18 Schwarz criterion 10.03143
Log likelihood -84.50217 Durbin-Watson stat 0.595724
• 拟合结果( PIFIS-线性、 PIFNIS-非线性)
0
500
1000
1500
2000
80 82 84 86 88 90 92 94 96
PI PIFIS PIFNIS
• 结构分析
LNPI = -4.722 + 0.511*LNPQ + 0.786*LNPP + 0.855*LNNPL + [AR(1)=0.825,AR(2)=-0.663]
PI=0.00158*PQ^1.786*PP^0.271*NPL^0.370
结构参数(弹性)差异很大
从经济意义方面分析,哪个更合理?
§8.3 二元离散选择模型 Binary Discrete Choice Model
一、 二元离散选择模型的经济背景
二、 二元离散选择模型
三、二元Probit 离散选择模型及其参数估计
*四、二元Logit 离散选择模型及其参数估计
五、一个实例
说明• 在经典计量经济学模型中,被解释变量通常被假定为
连续变量。
• 离散被解释变量数据计量经济学模型( Models with Discrete Dependent Variables)和离散选择模型 (DCM, Discrete Choice Model)。
• 二元选择模型 (Binary Choice Model)和多元选择模型 (Multiple Choice Model)。
• 本节只介绍二元选择模型。
一、二元离散选择模型的经济背景
• 研究选择结果与影响因素之间的关系。
• 影响因素包括两部分:决策者的属性和备选方案的属性。
• 对于两个方案的选择。例如,两种出行方式的选择,两种商品的选择。由决策者的属性和备选方案的属性共同决定。
• 对于单个方案的取舍。例如,购买者对某种商 品的购买决策问题 ,求职者对某种职业的选
择问题,投票人对某候选人的投票决策,银行对某客户的贷款决策。由决策者的属性决定。
二、二元离散选择模型
1、原始模型
其中 Y为观测值为 1和 0的决策被解释变量, X为解释变量,包括选择对象所具有的属性和选择主体所具有的属性。
Y X yi X i i
因为 0)( iE ,所以 iX)( iyE 。
令 )0(1)1( iiii yPpyPp
于是 iiii pyPyPyE )0(0)1(1)(
所以有 E y P yi i( ) ( ) 1 Xi
E y P yi i( ) ( ) 1 X i• 对于
问题在于:该式右端并没有处于 [0, 1]范围内的限制,实际上很可能超出 [0, 1]的范围;而该式左端,则要求处于 [0, 1]范围内。于是产生了矛盾。
• 对于随机误差项 ,具有异方差性 。因为 :
ii
i
y
y
1 1
0 1
X X
X Xi i
i i
当 ,其概率为当 ,其概率为
• 所以原始模型不能作为实际研究二元选择问题的模型。
2、效用模型
作为研究对象的二元选择模型
U i i i1 1 X 1
U i i i0 0 0 X
U Ui i i i i1 0 1 0 X 1 0( ) ( )
yi i* * X i
第 i 个个体 选择 1的效用
第 i 个个体 选择 0的效用
P y P y Pi i i( ) ( ) ( )* * 1 0 X i
3、最大似然估计 • 欲使得效用模型可以估计,就必须为随机误差项选择一种特定的概率分布。
• 两种最常用的分布是标准正态分布和逻辑( logistic)分布,于是形成了两种最常用的
—二元选择模型 Probit模型和 Logit模型。
• 最大似然函数及其估计过程如下:
F t F t( ) ( ) 1
P y P y P
P
F F
i i i
i
( ) ( ) ( )
( )
( ) ( )
* *
*
1 0
1
1
X
X
X X
i
i
i i
P y y y F Fny yi i
( , , , ) ( ( )) ( )1 20 1
1
X Xi i
L F Fi
n
( ( )) ( ( ))X Xi
yi
1 yi i 11
标准正态分布或逻辑分布的对称性
ln ( ln ( ) ( ) ln( ( )))L y F y Fi ii
n
X Xi i 1 1
1
ln
( )( )
L y f
Fy
f
Fi i
ii
i
ii
n
1
11
X 0i
• 在样本数据的支持下,如果知道概率分布函数和概率密度函数,求解该方程组,可以得到模型参数估计量。
三、二元 Probit离散选择模型及其参数估计
1、标准正态分布的概率分布函数
F t x dx
t
( ) ( ) exp( )
2 2
12 2
f x x( ) ( ) exp( )
2 21
2 2
2、重复观测值不可以得到情况下二元
Probit离散选择模型的参数估计
ln
( )
( )
L f
F
f
F
q f q
F q
i
iy
i
ii
y
i i i
i ii
n
ii
n
i i
10 1
1
1
X X
X
XX
X
0
i
i
i
q yi i 2 1
• 关于参数的非线性函数,不能直接求解,需采用完全信息最大似然法中所采用的迭代方法。
• 应用计量经济学软件。
• “ ”这里所谓 重复观测值不可以得到 ,是指对每个决策者只有一个观测值。即使有多个观测
值,也将其看成为多个不同的决策者。
3、重复观测值可以得到情况下二元Probit离散选择模型的参数估计
• 对每个决策者有多个重复(例如 10次左右)观测值。
• 对第 i个决策者重复观测 ni次,选择 yi=1的
次数比例为 pi,那么可以将 pi作为真实概率
Pi的一个估计量。
• “ ” 建立 概率单位模型 ,采用广义最小二 乘法估计 。
• 实际中并不常用。
• 详见教科书。
*四、二元 Logit离散选择模型及其参数估计
1、逻辑分布的概率分布函数
F te t( )
1
1
f te
e
t
t( )
( )
1 2
2、重复观测值不可以得到情况下二元logit离散选择模型的参数估计
• 关于参数的非线性函数,不能直接求解,需采用完全信息最大似然法中所采用的迭代方法。
• 应用计量经济学软件。
ln
( )( )
( ( ))
L y f
Fy
f
F
y
i i
ii
i
ii
n
ii
n
11
1
1
X
X X 0
i
i i
3、重复观测值可以得到情况下二元logit离散选择模型的参数估计
• 对每个决策者有多个重复(例如 10次左右)观测值。
• 对第 i个决策者重复观测 ni次,选择 yi=1的次
数比例为 pi,那么可以将 pi作为真实概率 Pi的
一个估计量。
• “ ” 建立 对数成败比例模型 ,采用广义最小二 乘法估计 。
• 实际中并不常用。
• 详见教科书。
五、例题
例 8.3.2 贷款决策模型
• 分析与建模:某商业银行从历史贷款客户中随机抽取 78个样本,根据设计的指标体系分别计算它
“ ”们的 商业信用支持度 ( XY “)和 市场竞争地”位等级 ( SC),对它们贷款的结果( JG)采
用二元离散变量, 1表示贷款成功, 0表示贷款失败。目的是研究 JG与 XY、 SC之间的关系,
并为正确贷款决策提供支持。
• 样本观测值
J G XY SC J GF J G XY SC J GF J G XY SC J GF
0 125. 0 -2 0. 0000 0 1500 -2 0. 0000 0 54. 00 -1 0. 0000
0 599. 0 -2 0. 0000 0 96. 00 0 0. 0000 1 42. 00 2 1. 0000
0 100. 0 -2 0. 0000 1 -8. 000 0 1. 0000 0 42. 00 0 0. 0209
0 160. 0 -2 0. 0000 0 375. 0 -2 0. 0000 1 18. 00 2 1. 0000
0 46. 00 -2 0. 0000 0 42. 00 -1 6. 5E-13 0 80. 00 1 6. 4E-12
0 80. 00 -2 0. 0000 1 5. 000 2 1. 0000 1 -5. 000 0 1. 0000
0 133. 0 -2 0. 0000 0 172. 0 -2 0. 0000 0 326. 0 2 0. 0000
0 350. 0 -1 0. 0000 1 -8. 000 0 1. 0000 0 261. 0 1 0. 0000
1 23. 00 0 0. 9979 0 89. 00 -2 0. 0000 1 -2. 000 -1 0. 9999
0 60. 00 -2 0. 0000 0 128. 0 -2 0. 0000 0 14. 00 -2 3. 9E-07
0 70. 00 -1 0. 0000 1 6. 000 0 1. 0000 1 22. 00 0 0. 9991
1 -8. 000 0 1. 0000 0 150. 0 -1 0. 0000 0 113. 0 1 0. 0000
0 400. 0 -2 0. 0000 1 54. 00 2 1. 0000 1 42. 00 1 0. 9987
0 72. 00 0 0. 0000 0 28. 00 -2 0. 0000 1 57. 00 2 0. 9999
0 120. 0 -1 0. 0000 1 25. 00 0 0. 9906 0 146. 0 0 0. 0000
1 40. 00 1 0. 9998 1 23. 00 0 0. 9979 1 15. 00 0 1. 0000
1 35. 00 1 0. 9999 1 14. 00 0 1. 0000 0 26. 00 -2 4. 4E-16
1 26. 00 1 1. 0000 0 49. 00 -1 0. 0000 0 89. 00 -2 0. 0000
1 15. 00 -1 0. 4472 0 14. 00 -1 0. 5498 1 5. 000 1 1. 0000
0 69. 00 -1 0. 0000 0 61. 00 0 2. 1E-12 1 -9. 000 -1 1. 0000
0 107. 0 1 0. 0000 1 40. 00 2 1. 0000 1 4. 000 1 1. 0000
1 29. 00 1 1. 0000 0 30. 00 -2 0. 0000 0 54. 00 -2 0. 0000
1 2. 000 1 1. 0000 0 112. 0 -1 0. 0000 1 32. 00 1 1. 0000
1 37. 00 1 0. 9999 0 78. 00 -2 0. 0000 0 54. 00 0 1. 4E-07
0 53. 00 -1 0. 0000 1 0. 000 0 1. 0000 0 131. 0 -2 0. 0000
0 194. 0 0 0. 0000 0 131. 0 -2 0. 0000 1 15. 00 0 1. 0000
•模型估计输出结果 Dependent Variable: JG
Method: ML - Binary Probit
Date: 10/06/04 Time: 23:25
Sample: 1 78
Included observations: 78
Convergence achieved after 13 iterations
Covariance matrix computed using second derivatives
Variable Coefficient Std. Error z-Statistic Prob.
C 8.797358 7.544042 1.166133 0.2436
XY -0.257882 0.228894 -1.126645 0.2599
SC 5.061789 4.458465 1.135321 0.2562
Mean dependent var 0.410256 S.D. dependent var 0.495064
S.E. of regression 0.090067 Akaike info criterion 0.118973
Sum squared resid 0.608402 Schwarz criterion 0.209616
Log likelihood -1.639954 Hannan-Quinn criter. 0.155259
Restr. log likelihood -52.80224 Avg. log likelihood -0.021025
LR statistic (2 df) 102.3246 McFadden R-squared 0.968942
Probability(LR stat) 0.000000
Obs with Dep=0 46 Total obs 78
Obs with Dep=1 32
• 回归方程表示如下:
JGF = 1-@CNORM(-(8.797358375 - 0.2578816624*XY + 5.061788664*SC))
• 模拟:该方程表示,当 XY和 SC已知时,代入方程,可以计算贷款成功的概率 JGF。例如,将表中第 19个样本观测值 XY=15、 SC=- 1代入方程右边,计算括号内的值为 0.1326552;
查标准正态分布表,对应于 0.1326552的累积正态分布为 0.5517;于是, JG的预测值JGF=1- 0.5517=0.4483,即对应于该客户,贷款成功的概率为 0.4483。
• 预测:如果有一个新客户,根据客户资料,计“ ”算的 商业信用支持度 ( XY “)和 市场竞争地
”位等级 ( SC),代入模型,就可以得到贷款成功的概率,以此决定是否给予贷款。
*§8.4固定影响平行数据模型Panel Data Model with Fixed-
Effects 一、平行数据模型概述
二、模型的设定——F检验
三、 固定影响变截距模型
四、固定影响变系数模型
一、平行数据模型概述
1、平行数据( Panel Data,面板数据)
• 时间序列数据
• 截面数据
• 平行数据
• 平行数据模型( Panel Data Model)已经成为计量经济学的一个独立分支
2、经济分析中的平行数据问题
• 宏观经济分析中的平行数据问题
– 目前应用较多
– 数据较容易获得,例如多个地区的时间序列数据
• 微观经济分析中的平行数据问题
– 目前应用较少
– 很难获得微观个体(家庭、个人)的时间序列数据
3、平行数据模型的三种情形
• 情形 1,在横截面上无个体影响、无结构变化,则普通最小二乘估计给出了和的一致有效估计。相当于将多个时期的截面数据放在一起作为样本数据。
itiitiit uxy
ni ,,1 Tt ,,1
ji ji
• 情形 2,变截距模型 (Panel Data Models
with Variable Intercepts) 。在横截面上个体影响不同,个体影响表现为模型中被忽略的反映个体差异的变量的影响,又分为固定影响和随机影响两种情况。
ji ji
• 情形 3,变系数模型 (Panel Data Models
with Variable Coefficient) 。除了存在个体影响外 ,在横截面上还存在变化的经济结构,因而结构参数在不同横截面单位上是不同的。
ji ji
——二、模型的设定 F检验
1、任务• 确定所研究的对象属于三种模型中的哪一种,作为研究平行数据的第一步。
• 采用假设检验
• 一般采用 F检验,也称为协变分析检验 (Analysis
of Covariance)
• 对于固定影响 (Fixed-Effects)和随机影响(Random-Effects) 两种情况 ,则要采用其它检验方法,本节不予介绍,只讨论固定影响模型。
⒉F检验• 假设 1:斜率在不同的横截面样本点上和时间上都相同,但截距不相同,即情形 2 。
• 假设 2:截距和斜率在不同的横截面样本点和时间上都相同,即情形 1 。
• 如果接收了假设 2,则没有必要进行进一步的检验。如果拒绝了假设 2,就应该检验假设1,判断是否斜率都相等。如果假设 1被拒绝,就应该采用情形 3的模型。
• F统计量的计算方法
采用OLS分别估计变系数模型、变截距模型和经典模型,得到残差平方和分别为 S1、 S2、 S3 ;
由此可以得到下列结论:
1) )]1([~/ 221 KTnS u ;
2) 在 2H 下, )]1([~/ 223 KnTS u 和 )]1)(1[(~/)( 22
13 KnSS u ;
3) 213 /)( uSS 与 2
1 / uS 独立。
检验假设 2的 F统计量 :
)]1(),1)(1[(~)]1(/[
)]1)(1/[()(
1
132
KTnKnFKnnTS
KnSSF
从直观上看,如 S3- S1很小, F2则很
小,低于临界值,接受 H2 。 S3为截距、系数都
不变的模型的残差平方和, S1为截距、系数都变
化的模型的残差平方和。
检验假设 1的 F统计量 :
从直观上看,如 S2- S1很小, F1则很
小,低于临界值,接受 H1 。 S2为截距变化、
系数不变的模型的残差平方和, S1为截距、系
数都变化的模型的残差平方和。
)]1(,)1[(~)]1(/[
])1/[()(
1
121
KTnKnFKnnTS
KnSSF
三、固定影响变截距模型
1.固定影响变截距模型• 固定影响与随机影响
如果横截面的个体影响可以用常数项的差别来说明,该不同的常数项是一个待估未知参数,称为固定影响变截距模型。如果横截面的个体影响可以用不变的常数项和变化的随机项之和的差别来说明,称为随机影响变截距模型。
• 固定影响变截距模型形式:
Ttniuxy ititiit ,,2,1;,,2,1
2. LSDV模型
ititiit uxy
iiii uXey
uXdddy n
],,,,[ 21
nnT
n
e
e
e
ddd
00
00
00
],,,[ 21
11
1
1
T
e
最小二乘虚拟变量模型(LSDV,Least-Squares Dummy-Variable)
3.参数估计
• 如果 n充分小,此模型可以当作具有( n+K)个参数的多元回归模型,由普通最小二乘进行估计。
• 当 n很大,可用下列分块回归的方法进行计算。
• 分块回归过程见教材。
eeT
IQ T 1
n
iii
n
iiiCV QyXQXX
1
1
1
CViii Xy ˆˆ
4、通过 F检验检验变截距假设
可以利用 F检验来检验 ji 的假设,在该假设下
)/()1(
)1/()(2
22
KnnTR
nRRF
u
pu
服从 ),1( KnnTnF 。其中 2R 为判定系数,下标u表示非约束模型,
而 p表示约束模型。
5、用 Eviews估计固定影响变截距模型
• 北京、天津、河北、山西、内蒙 5地区消费总额 COM与 GDP关系
• 数据表
COMBJ GDPBJ COMTJ GDPTJ COMHB
1997 703 1871 554 1240 1740
1998 810 2046 623 1336 1819
1999 954 2174 717 1450 1984
2000 1221 2479 805 1639 2241
2001 1468 2846 902 1840 2509
2002 1700 3213 990 2051 2820
2003 1968 3663 1135 2448 3260
GDPHB COMSX GDPSX COMNM GDPNM
1997 3954 852 1473 640 1083
1998 4256 791 1596 664 1169
1999 4569 857 1501 725 1255
2000 5089 946 1638 787 1392
2001 5578 1046 1788 936 1545
2002 6123 1184 2042 1092 1763
2003 7099 1374 2516 1218 2171
—讨论 固定影响的输出Dependent Variable: COM?
Method: Pooled Least Squares
Date: 11/12/04 Time: 22:56
Sample: 1997 2003
Included observations: 7
Number of cross-sections used: 5
Total panel (balanced) observations: 35
Variable Coefficient Std. Error t-Statistic Prob.
GDP? 0.550205 0.019529 28.17358 0.0000
Fixed Effects
BJ--C -177.1921
TJ--C -125.5225
HB--C -543.1295
SX--C 20.39002
NM--C 50.28222
R-squared 0.990569 Mean dependent var 1258.143
Adjusted R-squared 0.988943 S.D. dependent var 666.1618
S.E. of regression 70.04712 Sum squared resid 142291.4
Log likelihood -195.0928 Durbin-Watson stat 0.767855
—讨论 固定影响的输出
COMBJ = -177.19207 + 0.5502047064*GDPBJ
COMTJ = -125.5224709 + 0.5502047064*GDPTJ
COMHB = -543.1294537 + 0.5502047064*GDPHB
COMSX = 20.39001648 + 0.5502047064*GDPSX
COMNM = 50.28222237 + 0.5502047064*GDPNM
—讨论 固定影响(考虑序列相关)的输出Dependent Variable: COM?
Method: Pooled Least Squares
Date: 11/12/04 Time: 23:01
Sample: 1997 2003
Included observations: 7
Number of cross-sections used: 5
Total panel (balanced) observations: 30
Convergence achieved after 32 iteration(s)
Variable Coefficient Std. Error t-Statistic Prob.
GDP? 0.185886 0.108947 1.706209 0.1014
AR(1) 1.170504 0.058300 20.07738 0.0000
Fixed Effects
BJ--C -221.7370
TJ--C 120.5728
HB--C 354.7340
SX--C 314.1527
NM--C 185.6647
R-squared 0.996117 Mean dependent var 1318.200
Adjusted R-squared 0.995104 S.D. dependent var 679.6750
S.E. of regression 47.55928 Sum squared resid 52023.35
Log likelihood -154.4419 F-statistic 5899.842
Durbin-Watson stat 1.600886 Prob(F-statistic) 0.000000
—讨论 固定影响(考虑序列相关)的输出
COMBJ = -221.736973 + 0.1858864287*GDPBJ +[AR(1)=1.170504437]
COMTJ = 120.5727643 + 0.1858864287*GDPTJ +[AR(1)=1.170504437]
COMHB = 354.7339615 + 0.1858864287*GDPHB +[AR(1)=1.170504437]
COMSX = 314.1527343 + 0.1858864287*GDPSX + [AR(1)=1.170504437]
COMNM = 185.6646976 + 0.1858864287*GDPNM +[AR(1)=1.170504437]
—讨论 固定影响(考虑异方差)的输出Dependent Variable: COM?
Method: GLS (Cross Section Weights)
Date: 11/12/04 Time: 23:03
Sample: 1997 2003
Included observations: 7
Number of cross-sections used: 5
Total panel (balanced) observations: 35
Variable Coefficient Std. Error t-Statistic Prob.
GDP? 0.523388 0.016232 32.24436 0.0000
Fixed Effects
BJ--C -107.1156
TJ--C -79.53526
HB--C -402.6547
SX--C 68.48428
NM--C 90.04025
Weighted Statistics
R-squared 0.992583 Mean dependent var 1496.286
Adjusted R-squared 0.991305 S.D. dependent var 718.1464
S.E. of regression 66.96654 Sum squared resid 130051.0
Log likelihood -185.8013 Durbin-Watson stat 1.228460
Unweighted Statistics
R-squared 0.989956 Mean dependent var 1258.143
Adjusted R-squared 0.988224 S.D. dependent var 666.1618
S.E. of regression 72.28853 Sum squared resid 151543.3
Durbin-Watson stat 0.670974
四、固定影响变系数模型
1、固定影响变系数模型的表达式
TtniuXy itiitit ,,2,1;,,2,1
uXy
1
2
1
nTny
y
y
y
nKnTnX
X
X
X
00
00
00
2
1
1
2
1
nKn
1
2
1
nTnu
u
u
u
2、随机干扰项在不同横截面个体之间不相——关 OLS估计
• 以每个截面个体的时间序列数据为样本,采用经典单方程模型的估计方法分别估计其参数。
0jiuEu IuEu iii2
3、随机干扰项在不同横截面个体之间相——关 GLS估计
• 采用 GLS估计同时得到所有 β的 GLS估计量。
0jiuEu
nTnTnnnn
n
n
V
21
22221
11211
jiij uEu
yVXXVXGLS111 )(ˆ =
• 如何得到协方差矩阵的估计量?
一种可行的方法是:首先采用采用经典单方程模型的估计方法分别估计每个横截面个体上 βi,计算残差估计值,以此构造协方
差矩阵的估计量,类似于经典单方程模型的GLS 那样。