第二章回归模型学习要求：掌握一元及多元线性回归模型的基本理论与方法、参数的普通最小二乘估计式及相关性质、对模型的经济意

第二章回归模型

学习要求：掌握一元及多元线性回归模型的基本理论与方

法、参数的普通最小二乘估计式及相关性质、对模型的经济意义检验和统计检验，能应用 Eviews 软件进行最小二乘估计与统计检验，利用模型进行预测。

本章主要教学内容：

第一节一元与多元线性回归模型第二节最小二乘估计及其性质第三节回归系数的区间估计与假设检验第四节回归模型的统计检验第五节回归预测第六节非线性回归模型

第一节一元与多元回归模型

一、回归与相关经济变量之间的关系通常可分成两类：确定性函数关系——一个（一些）变量的值给定后，另一个变量的值完全确定；不确定性的统计关系——一个（一些）变量的值给定后，另一个变量的值不能完全确定。例：无息票债券的面值、到期期限与债券的现价完全决定债券的到期收益率， y = f(x) 。居民的可支配收入不能完全决定居民的消费支出，

y = f(x,u) ， u为一个随机变量。

1. 两个变量之间的线性相关关系若一个变量变化时，另一个变量倾向于同向变化，称两个变量间存在正相关关系；若一个变量变化时，另一个变量倾向于反向变化，称两个变量间存在负相关关系；若一个变量的变化不会造成另一个变量的具有倾向性的变化，称两个变量不相关。相关关系不是确定的函数关系。

例：两个变量的相关关系 * 小学生年龄与 60米短跑的用时（负相关） * 企业信用等级与企业债券（贷款）的利率（负相关） * 一般情况下，债券的期限与债券的利率（正相关） * 一般商品的价格与商品的供应量（正相关） * 汽油的价格与对冰淇淋的需求量（不相关）

2. 两个变量线性相关的度量方法 * 两个变量的分布已知，得到相关系数的精确值：

* 若只有变量的样本数据，得到相关系数的估计值：

相关系数的估计值与样本取值有关。

))((),cov( , )()(

),cov(EyyExxEyx

yVarxVar

yxxy

n

ii

n

ii

n

iii

xy

yyxx

yyxxr

1

2_

1

2_

1

__

)()(

))((

注意 :

* 相关系数只能度量两个变量是否具有线性相关性，而不能度量其他，如： x 服从 [-1 ， 1] 上的均匀分布，显然， y与 x存在确定的函数关系，但它们的线性相关系数为 0。 * 相关关系不是因果关系，经济变量之间的因果关系只能从经济理论中导出，而不能从统计分析中直接得到。

例：太阳黑子爆发的次数与澳大利亚的野狼数

2xy

3. 条件均值与总体回归函数 y 与 x之间存在不确定的关系：， x给定后 y的数学

期望，，称为 y关于 x的条件均值， g(x)也称为总体回归函数。在许多实际经济、金融问题中，真正需要了解的是一个变量关于另一个（另一些）变量的总体回归函数： 4. 回归分析回归分析研究变量 y与变量 x之间的具体的统计依存关系，特别是研究 y 关于 x的条件均值的具体形式，即研究总体回归函数g（ x）。回归分析中， x看成解释变量， y为被解释变量，回归分析研究 y 的条件平均值如何随 x的变化而变化，即回归关系研究变量之间的随机因果关系，这与相关关系不同。

),( uxfy )(]|),([)|( xgxuxfExyE

),,()|( )()|( 21 nxxxgyExgxyE X

二、一元线性回归模型与基本假设1. 概念假设总体回归函数为线性函数 ,即 :

我们关心参数究竟取什么值。考虑模型：，称为一元线性回归模型，其中称为随机扰动项（随机误差项），加入此项的原因在于： * 未知的对 y有较大影响的因素； * 已知但无法获得观测数据的对 y有较大影响的因素； * 众多对 y有很小影响的因素；其他还包括： * 模型的设定误差； * 变量的观察误差；等。

xxyE 10)|(

iii uxy 10

iu

2. 回归分析方法 * 采集样本数据 : * 采用适当的方法估计模型参数； * 得到样本回归函数：， * 将样本回归函数作为总体回归函数的估计。3. 一元回归模型的基本假设在回归分析中，为采用适当的方法估计模型参数 ,需要对回归模型提出一些基本假设，这些假设包括： * 解释变量为非随机变量 * ，意味着，表明模型设置无系统性偏差； * 同方差：各随机扰动项的方差相同 * 无自相关：各随机扰动项互不相关 * 误差项与解释变量不相关； * 随机扰动项均服从正态分布。

niyx ii , , ,2 1),,(

xxyE

10)|(

0)|( ii xuEiii xxyE 10)|(

2)|( ii xuVar

jiuuEuu jiji , 0)(),cov(

4.由基本假设衍生的性质

),(~ ),0(~ *

0),cov( 0),cov( *

)|( )|( *

)|( 0)|( *

210

2

22

10

iii

jiji

iiii

iiiii

xNyNu

yyuu

xyVarxuVar

xxyExuE

三、多元线性回归模型与基本假设 1. 多元线性回归模型一般形式 :

矩阵形式 :

ikikiii uxxxy 22110

UXβY

1

1

1

2

1

1

0

21

22212

12111

2

1

nkknnn

k

k

n u

u

u

xxx

xxx

xxx

y

y

y

2. 多元线性回归模型的基本假设

* 解释变量为非随机变量； * ； * 各随机扰动项的方差相同； * 各随机扰动项互不相关； * 随机扰动项与各解释变量互不相关； * 随机扰动项均服从正态分布； * 无多重共线性，即满足：

思考题：从多元线性回归模型的基本假设，可以得到哪些衍

生性质？

0)|( ii xuE

1)( , 1)( / kRankkRank XXX

第二节最小二乘估计及性质一、最小二乘估计 1. 概念一元回归模型

中，使

达到最小值的称为模型参数的最小二乘估计（ OLS ）

2. 最小二乘估计的计算方法

iii uxy 10

n

iii xyf

1

21010 )]([),(

10 ,

0),(

0),(

20/

2

10/

1

f

f

_

1

_

0

2_

_

2_

__

1

1

21

10

n

1i

110

/2

_

10

_

110

/1

)(

)(

)(

))((

0)]([0

0)]([0

xy

xx

yxx

xx

yyxx

xxyx

xyxf

xy

xyf

i

ii

i

ii

n

ii

n

iiii

n

iiii

n

iii

3. 最小二乘估计的 Eviews实现例 1: sjk21给出我国 1985-1998年期间每年税收收入y和国内生产总值（ GDP）x 的统计资料，假设y与 x的关系可以表示为

试利用 Eviews软件计算模型参数的最小二乘估计。解： * 启动Eviews、建立工作文件：file\new\workfile,确定频率项; * 导入 sjk1: procs＼ import\read text-lotus-Excel,输入相关项; * 在主窗口输入命令 : ls y c x,回车后,系统输出模型参数的最小二乘估计 (附后),估计得到的方程为

iii uxy 10

xy 0946.05.987

4. 随机扰动项的方差的估计当解释变量取时 ,模型预测的 y的条件期望值

令

则可看成随机扰动项的估计值，随机扰动项的方差的估计可表示为：

ix

iii xxyEy

10)|(

iii yye

ie

n

iien 1

22

2

1

5. 多元线性回归模型的最小二乘估计多元线性回归模型

中，使

达到最小时的参数值，称为模型参数的最小二乘估计。多元线性回归模型的矩阵形式：

由一阶条件得到（证明附后）：于是

ikikiii uxxxy 22110

n

ikikiik xxyf

1

211010 )]([),,,(

UXβY

0/ UX

YXXXβXβXYX /1/// )(

0

iki

ii

i

nknkk

n

ikikikiiki

iikikiii

ikikii

ux

ux

u

u

u

u

xxx

xxx

uxxxyx

uxxxyx

uxxy

12

1

21

12111

110

11101

110

1 1 1

0)]([

0)]([

0)]([

例 2：我国国有独立核算工业企业生产函数。根据生产函数理论，生产函数的基本形式为其中， L、 K分别为生产过程中投入的劳动与资金，时间变量 t反映技术进步的影响。 Sjk22给出我国 1978-1994年期间国有独立核算工业企业的有关统计资料，其中 y为工业总产值（可比价）， L、 K分别为年末职工人数和固定资产净值（可比价）。试利用Eviews软件建立线性生产函数

解：在主窗口输入命令： Ls y c t L k，估计得到的方程

),,,( KLtfy

KLty 3210

K L t y804 . 0 01 . 1 36 . 31 1720

6. 多元回归模型中扰动项方差的估计

)(

1

1

110

1

22

kikiii

n

ii

xxye

ekn

二、最小二乘估计的性质1. 参数估计量的评价标准 ① 无偏性 : ，参数估计无系统性偏差

② 有效性，即最小方差性，参数估计精度较好、更接近于真值；

③ 一致性：

E

1)|(|limn

nprob

2. 最小二乘估计的数值性质无须对回归模型作任何假设，就可得到的最小二乘估

计的性质称为最小二乘估计的数值性质，这些性质有： ①

② 样本回归直线通过样本均值点

③

性质③由同学自己推导，作为今天的一个作业。

011

][][1

111

）（

——

iii

iii

yyn

en

e

yxxyxxyn

y

xy 10

0 , 0 iiii exey

3. 最小二乘估计的统计性质统计性质：满足模型基本假设时所拥有的性质。 ① 最小二乘估计为线性估计

由于模型参数为线性估计，因此当随机扰动项服从正态

分布时，参数估计量与服从正态分布，这为对模型的统计推断提供了便利。

i

n

in

ii

i

n

iin

ii

i

yxx

xxx

n

yxx

xx

1

1

20

1

1

21

])(

)(1[

])(

)([

② 最小二乘估计为无偏估计

同样可以证明，。

③ 在所有的线性估计中，最小二乘估计具有最小方差（证明见后）

高斯—马尔柯夫定理在满足线性回归模型基本假设的条件下，模型参数的最小

二乘估计具有线性性、无偏性、最小方差性。

11

11

0

1101

)(

n

iii

n

ii

n

iiii

kxk

EuxkE

00

E

)()()(

0)(

1

)(

1

)(

)(2)(

])[()()(

1 , 0

,

1

n

1i

22n

1i

22n

1i

22*1

n

1i

2n

1i

2

n

1i

2n

1i

n

1i

n

1i

2n

1i

22n

1i

22

n

1i

22n

1i

*1

n

1i

n

1i1

*1

n

1i

n

1i1

n

1i0

n

1i

*1

n

1i1

VarkkkdVar

xxxx

kkdkkd

kkdkkd

kkdydVarVar

xddE

udxddydyk

iiii

ii

iiiiii

iiiiii

iiiii

iii

iiiiiiiii

第三节回归系数的区间估计与假设检验一、最小二乘估计量的分布满足基本假设时，参数的最小二乘估计量服从正态分

布

n

1i

2n

1i

22

22

2

n

1i

2

n

1i

22

00

n

1i

2_

2

11

2

1)(

2

1

)2( ~ )2(

) )(

, ( ~

))(

, ( ~

iii

i

i

i

en

yyn

nn

xxn

xN

xxN

参数估计量标准差

2

21

2

22

0

)(

1)(

)()(

xxSe

xxn

xSe

i

i

i

二、回归系数的显著性检验回归系数的显著性检验，就是检验以下假设是否为真

很显然，如果第二个原假设为真，则 x 的变动对 y 的变动没有影

响，已建立的模型不适当。

数理统计知识复习：

0 0 1000 :: HH 或

~

~~

~ ~ 1 0~

212

1

22

12

2

），（

相互独立，），（），（

）（）（，），（

mmFm

m

mm

mtm

mN

当第二个原假设为真时

构造检验统计量：

）（）（

）（

），（）（

））（

，（

2~

/

/

1 0~

/

0~

1

1

22

221

22

1

2

2

1

ntSe

xx

N

xxxxN

i

ii

）（

1

1

Set

同样，当第一个原假设为真时，检验统计量

对多元回归模型，检验统计量为

)2(~)(

t

0

0

ntSe

)1(~)(

kntSe

t

i

i

检验方法：给定显著性水平，时拒绝原假设，回归系数通过显著性检验；时接受原假设，回归系数没有通过显著性

检验。

在 Eviews 中，回归分析后系统直接给出检验统计量（ t ）值和

伴随概率 Prob ，检验方法为：若伴随概率小于给定的显著性水平，拒绝原假设，回归系数通过显著性检验；若伴随概率小于等于给定的显著性水平，接受原假设，回归系数没有通过显著性检验，模型需要调整。

2/|| tt

2/|| tt

例：对例 1 、例 1 中所构建的模型，进行各回归系数的显著性检验，取显著性水平为 0.05 。

例 1 中，回归系数均能通过显著性检验。

例 2 中，除资本 k 的系数外，其余回归系数

（包括截距）均不能通过显著性性检验，模型需要调整。

三、回归系数的区间估计有时人们关心回归系数在一定置信度下的置信区间，这比系

数的点估计更有价值。如何进行区间估计？在一元线性回归模型中

这样，从数理统计知识，对选定的置信度，参数的

置信区间为

在多元回归模型中，有

)2(~)(

))(

, (~

1

11

2

2

11

nt

SexxN

i

)1(

))( , )(( 12/112/1

SetSet

)1(~)(

kntSe i

ii

例：给定置信度为 95% ，给出例 4 中参数的置信区间

解

置信区间为

1

003626.0)( , 094631.0

179.2)12( , 14

11

025.0

Se

tn

)10253.0 , 08673.0(

第四节回归模型的统计检验一、拟合优度检验如果模型适当，回归直线与样本的拟合程度应较好，拟合

优度检验就是对拟合程度的一种检验。1 . 平方和分解公式

总平方和 = 回归平方和 + 残差平方和（ TSS ）（ ESS ）

（ RSS ）

222

22

22

22

)()(

)(

)(2)(

)]()[()(

iii

ii

iiii

iiiii

eyyyy

eyy

yyeeyy

yyyyyy

2. 可决系数显然，回归平方和占总平方和的比例越大，回归直

线与样本的拟合度越好，可用以下系数（可决系数）度量拟合度

可决系数取值落在 [0 1] ，越接近 1 ，样本与回归直

线拟合越好；越接近 0 ，样本与回归直线拟合越差。

参数估计后， Eviews 给出可决系数的值（ R-

squared ）。例 4 中，这个值为 0.9827 ，样本与模型的拟合程度较好。

TSS

RSS

TSS

ESSR 12

3. 可决系数与相关系数的关系

考虑一元回归模型，相关系数是 x 与 y 线性相关程度的度量，

相关系数越强， x 与 y就越接近于线性相依关系，线性回归模型与样本的拟合程度就越好。

2

22

2

2

2212

22

)()(

]))(([

)(

)(

)()(

))((

ryyxx

yyxx

yy

xx

TSS

ESSR

yyxx

yyxxr

ii

ii

i

i

ii

ii

4. 修正的可决系数在模型中增加解释变量数一般会提高可决系数，在多元回归模型中，为消除因增加不必要的解释变量对可决系数的影响，通采用修正后的可决系数来检验回归直线与样本的拟合程度。

参数估计后， Eviews 给出修正的可决系数的值（ Adjusted R-squared ）。例 2 中，可决系数与修正的可决系数的值分别为 0.996085 、 0995181 。修正的可决系数总是小于可决系数。

1

1)1(1 22

kn

nRR

二、回归方程的显著性检验 1. 回归模型的 F 检验在多元回归模型中，除对回归系数作显著性检验外，还需要对回归方程本身进行显著性检验，即对下面原假设进行检验，不能通过此项 F 检验的模型是无意义的。此项检验的检验统计量为

因此可对原假设进行 F 检验。

参数估计后， Eviews 给出对模型的 F 检验统计量值，以及对

应的相伴概率。

0

0

1

210

不全为i

k

H

H

:

:

)1 , (~)1/(

/

knkF

knRSS

kESSF

2 . F 统计量、可决系数、修正可决系数的关系

kFkn

nR

R

R

k

knF

knRSS

kESSF

TSS

ESSR

RSSESSTSS

1

11

1

1

)1/(

/,

2

2

2

2

系数与模型的统计检验

对一元回归模型，需进行系数的显著性检验、模

型的拟合优度检验，这些检验都能通过的模型是适当模型。

对多元回归模型，需要进行系数的显著性检验、模型的修正的拟合优度检验、模型的 F 检验，这些检验都能通过的模型是适当的，若某些系数的显著性检验不能通过，模型需要调整；若 F 检验不能通过，模型没有意义。

例：对例 2模型的调整在例 2的回归结果中，模型的 F检验可以通过、修正

的拟合优度较高，但某些系数的显著性检验通不过，说明模型整体有价值，但需要调整，通常做法是首先剔除最不显著的变量，建立模型：参数估计与统计检验的结果附后，调整后的模型的系数均能通过显著性检验、模型的 F检验和拟合优度检验较好。于是我国国有独立核算企业的生产函数为

iiii uKLy 210

KLy 8280.02195.19.2388

第五节回归预测

回归模型的主要应用之一是预测，即利用解释变

量的预期值对应变量的取值作预测。预测的前提条件是经济结构在样本期与预测期无多大变化，回归模型描述的解释变量与应变量的关系 ( 经济结构 ) 在预测期依

然成立。

回归预测包括点预测与区间预测，前者用一个值、

后者用一个区间 (置信区间 ) 对应变量作预测。

一、点预测 1 . ( 条件 )平均值的点预测给定解释变量的值的条件下，对应变量的平均取值进行预测。样本回归函数是总体回归函数

的估计，给定解释变量取值后，平均值的点预测为

2. 个别值的点预测给定解释变量值的条件下，对应变量的取值进行预测。由于

而对残差的预测为 0 ，因此对个别值的预测为

xxyE 10)|(

FF xxyE

10)|(

exy FF

10

FF xy

10

二、区间预测 1. 平均值的置信区间

），（

置信区间为

）（

2/2/

2_

2

2

22

1010

)2(~

)(

)(1

)(

])(

)(1[)(

)( ,

aFaF

FF

i

F

FF

i

FF

FFFF

tyty

ntyEy

xx

xxn

yEyt

xx

xx

nyVar

xyExy

2. 个别值的置信区间

），（

置信区间为

）（

2/2/

2_

2

2

22

1010

)2(~

)(

)(11

)(

])(

)(11[)(

)( ,

aFaF

FF

i

F

FF

i

FF

FFFF

tyty

ntyEy

xx

xxn

yEyt

xx

xx

nyVar

xyEuxy

3. 平均值估计与个别值估计的精度比较

由于平均值估计量的标准差小于个别值估计量

的标准差 ,平均值估计的精度大于个别值估计的精度。

同样在区间估计中，在相同的置信水平下，平均

值的置信区间长度要小于个别值的置信区间长度。

例 3 ：研究某省城镇居民消费支出与可支配收入之间的关系。由经济理论可知，收入是影响居民消费支出的主要因素，消费支出 y 随收入 x 的增加而增加，但支出增加的幅度小于收入增加的幅度。若忽略其他因素对居民消费支出的影响，可建立线性回归模型

该省城镇居民 1978—1998 年的数据由 sjk23 给出，试估计模型参数，并对模型进行经济意义与统计检验。如果预测 1999 年该省城镇居民的可支配收入为 5500 元，试

估计 1999 年该省城镇居民消费支出的平均值的点估计与置信区间（置信水平为 0.05) 。

iii uxy 10

回归分析与检验：输入命令： range 1978 1998 ， ls y c x ，回归分析结果见

下页。模型可以通过经济意义检验、统计检验，模型拟合程度较高。平均值的点预测：输入命令： expand 1978 1999 ， forecast 1999 1999 ，得到平均值的点估计为 4680 。平均值的置信区间：在 x 的数据框中 view / Descriptive stats / Histogram and stats

现在：

），置信区间为：（，

4722 4638

07.20 41.35 , 64.13911482)(

,39.50859384)1()(

093.2)19( , 669.1594 , 19.1770

2

22_

025.0

xx

nxx

tx

F

xi

x

第六节非线性回归模型

前面讨论的线性回归模型的形式为：模型中解释变量与应

变量的关系是线性关系，应变量与模型参数的关系也是线性关系，但在实际中，许多经济变量之间的关系为非线性关系，如

C-D 生产函数的形式为：

本节讨论当经济变量之间为非线性关系时，如何通过变量的适当变化来构造线性回归模型。

ttt KALQ

一、可线性化模型在对经济变量间的关系建立计量经济模型时，有些模型

从本身看解释变量与应变量之间的关系不是线性关系，但通过适当变换后，可将其转化为线性回归模型，这类模型称为可线性化的模型。1. 倒数变换模型 (双曲函数模型 )

可以通过倒数变换，将模型转化为回归模型，如在上两例

中，分别令

iii

ii

i

uxy

ux

y

11

1

10

10

iiii

ii

xxyy

xx

/1 , /1

/1**

*

2. 双对数模型 (幂函数模型 )

若对 C-D 生产函数两边取对数，则就可建立计量经济模型

这样模型称为双对数模型，双对数模型也可以通过变量变换方式转化为线性回归模型。如上例可转化为

tttt ukLAQ lnlnlnln

ln ln ln ln 0***

**0

*

AkzLxQy

uzxy

tttttt

tttt

，，，

其中

例：试利用 C-D 生产函数对我国国有独立核算企业的生产函

数建模，数据在 sjk22 。解：建立线性回归模型

Eviews 估计方法如下： * 建立工作文件，引入数据库 * 生成新变量，方法为 Quick / Generate Series ，在窗口中逐个输入新变量的表示式，完成新变量的建立。 * 对新变量进行回归分析，得到结果见下页，因此模型为

,**0

*tttt uzxy

*** ,, zxy

6446.07014.0

***

081.0

6446.07014.0508.2

KLQ

zxy

即：

3.半对数模型：

4. 多项式模型：

5. 一些其他模型

二、不可线性化的模型有些模型不能通过类似以上的方法转化为线性回归模

型 ,这些模型称为不可线性化的模型，对这类模型的估计问题已超出本课程教学大纲范围。

iii

iii

uxy

uxy

10

10

ln

ln

ikikiii uxxxy 2

210

本章复习要点：

* 理解回归与相关的关系； * 总体回归函数与样本回归函数的实质与联系； * 线性回归模型的基本假设及其意义； * 普通最小二乘估计及其数值性质与统计性质； * 各模型参数的估计量及估计量的分布； * 对模型参数的显著性检验的方法及意义； * 对模型的拟合优度检验、 F 检验的方法及意义； * 参数的点估计与区间估计； * 平均值、个别值的点预测与置信区间； * 可转化为线性回归模型的非线性模型的转化方法； * 运用 Eviews 进行回归分析的具体操作。

Documents

第二章 回归模型 学习要求：掌握一元及多元线性回归模型的基本理论与方 法、参数的普通最小二乘估计式及相关性质、对模型的经济意

第二章回归模型学习要求：掌握一元及多元线性回归模型的基本理论与方法、参数的普通最小二乘估计式及相关性质、对模型的经济意