31
10 ε + + + + + + = k k x b x b x b x b a y L 3 3 2 2 1 1 1990 , 1990 , 3 1990 , 2 1990 , 1 1990 , , , , , k x x x x y L L t k t t t t x x x x y , , 3 , 2 , 1 , , , , , L L 2005 , 2005 , 3 2005 , 2 2005 , 1 2005 , , , , , k x x x x y L L 1 , 1 , 3 1 , 2 1 , 1 1 , , , , , k x x x x y L L j k j j j j x x x x y , , 3 , 2 , 1 , , , , , L L 47 , 47 , 3 47 , 2 47 , 1 47 , , , , , k x x x x y L L

第 章. パネルデータによる計量分析の基礎 · PDF file45 Baltagi(2005)“Econometric Analysis of Panel Data” (Third Edition),“1.2 Why Should We Use Panel

  • Upload
    lynga

  • View
    215

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 第 章. パネルデータによる計量分析の基礎 · PDF file45 Baltagi(2005)“Econometric Analysis of Panel Data” (Third Edition),“1.2 Why Should We Use Panel

第 10 章. パネルデータによる計量分析の基礎

182

第 10 章. パネルデータによる計量分析の基礎

10-1.パネルデータとは

10-1-1.時系列データと横断面データ

従属変数(y)を定数項と k個の独立変数で回帰するモデルを想定する。

ε+⋅++⋅+⋅+⋅+= kk xbxbxbxbay L332211 (10-1)

①時系列データ(Time Series Data)による推定

時間(t)を通じて変動する標本が用いられる。

例)1990 年~2005 年までの年次データで構成されるデータセット

1990,1990,31990,21990,11990 ,,,,, kxxxxy LL

: : : : :

: : : : :

tktttt xxxxy ,,3,2,1 ,,,,, LL

: : : : :

: : : : :

2005,2005,32005,22005,12005 ,,,,, kxxxxy LL

②横断面データ(Cross Section Data)による推定

個体(j)に応じて変動する標本が用いられる。

例)47都道府県(j=1,2,‥‥,47)で構成されるデータセット

1,1,31,21,11 ,,,,, kxxxxy LL

: : : : :

: : : : :

jkjjjj xxxxy ,,3,2,1 ,,,,, LL

: : : : :

: : : : :

47,47,347,247,147 ,,,,, kxxxxy LL

10-1-2.パネルデータの概要

時系列データと横断面データを組み合わせた標本をパネルデータ(Panel Data)という。

Page 2: 第 章. パネルデータによる計量分析の基礎 · PDF file45 Baltagi(2005)“Econometric Analysis of Panel Data” (Third Edition),“1.2 Why Should We Use Panel

第 10 章. パネルデータによる計量分析の基礎

183

1)マイクロパネルデータとマクロパネルデータ

①マイクロパネルデータ

個表をベースとするパネルデータは、Baltagi(2005)の言葉を借りれば“Micro Panel

Data”と呼ぶことができる。41 第 1 に、特定の個人・世帯に対して継続的にアンケート

調査を行うケースがこれに該当する。アメリカではミシガン大学が 1968 年から“Panel

Study of Iccome Dynamics(PSID)”を実施している。PSID では世帯・個人に対して継続

的(1996 年までは毎年、1997 年からは 2年に 1度)に面接調査を行っている。42 日本に

おける同様の調査として家計経済研究所の『消費生活のパネル調査』がある。この調査は

1993 年から毎年実施され、若年女性を対象として、収入、支出、貯蓄、就業行動、家族

関係など多岐にわたる項目について継続調査を行っている。現在では先進国の多くでこう

したパネル調査が行われている。43 第 2に、多数の企業の財務諸表データを複数年にわ

たって集めることによっても、やはり個表ベースのパネルデータを構築できる。

個人・世帯を対象とするパネル調査の多くはまだ歴史が浅い。また、同一個体に対する

継続調査を大きな規模で行うとかなりのコストがかかるため、たかだか毎年ないし 2年に

1回しか調査が実施されないものが多い。他方、企業の財務諸表データを大量に集めよう

とすると有料の民間データベースに依存せざるをえず、特に個人研究者にとって重い負担

となる。こうした事情もあり、個表ベースのパネルデータは、横断面方向の「個体数」は

十分に多いものの、時系列方向の「期間」は少ないものが一般的である。

②マクロパネルデータ

ある程度集計されたデータをベースとするパネルデータは、やはり Baltagi(2005)

の言葉を借りると“Macro Panel Data”と呼べよう。具体的には、OECD 等の国際機関が

発表する国別のマクロデータや、各国統計部局が作成する地域別統計(例:県民経済計

算など)の集合がこれに該当する。

これらのデータは、横断面方向にある程度集計されているので「個体数」はそれほど

多くならない。他方、(SNA 体系が変更されるなどの例外的なケースを除けば)時系列方

向の「期間」はかなり長くとれることが一般的である。

41 Baltagi(2005)“Econometric Analysis of Panel Data”(Third Edition)パネル推計に関するもっとも定評ある

テキストの1つである。なお、初版は 1995 年発行。 42 この他に米国労働省労働統計局(Bureau of Labor Statistics, US Department of Labor)の“National Longitudinal

Surveys(NLS)”も有名である。この調査でも各種コーホートに対して、継続的に就労・所得等に関するインタビュー

調査が行われている。 43 例えば、英国 Institute for Social and Economic Research による“British Household Panel Survey”、韓国 Korean

Labor Institute による“Korea Labor and Income Panel Study”など。

Page 3: 第 章. パネルデータによる計量分析の基礎 · PDF file45 Baltagi(2005)“Econometric Analysis of Panel Data” (Third Edition),“1.2 Why Should We Use Panel

第 10 章. パネルデータによる計量分析の基礎

184

2)パネルデータの構築方法

Excel 等で分析用にパネルデータを構築する場合、以下の 2通りの方法がある。

①個体ごとにスタックされたパネルデータ

説明変数 個体 年

従属

変数

(y) x1 x1 xk

北海道 1990 205.2 4.23 ‥ 50.7 ‥ 1000 :

北海道 2005 260.7 3.58 ‥ 61.2 ‥ 800

青森 1990 125.1 6.48 ‥ 50.7 ‥ 2500 :

青森 2005 315.0 8.19 ‥ 61.2 ‥ 1264

和歌山 1990 624.0 7.98 ‥ 40.8 ‥ 3155 :

和歌山 2005 999.7 10.52 ‥ 80.0 ‥ 3826

沖縄 1990 50.8 1.31 ‥ 12.9 ‥ 525 :

沖縄 2005 111.1 7.45 ‥ 36.3 ‥ 411

②時点ごとにスタックされたパネルデータ

説明変数 個体 年

従属

変数

(y) x1 x1 xk

北海道 1990 205.2 4.23 ‥ 50.7 ‥ 1000 :

沖縄 1990 50.8 1.31 ‥ 12.9 ‥ 525

北海道 1991 125.1 6.48 ‥ 50.7 ‥ 2500 :

沖縄 1991 315.0 8.19 ‥ 61.2 ‥ 1264

北海道 1996 750.2 5.00 ‥ 62.6 ‥ 913 :

沖縄 1996 90.4 3.58 ‥ 20.1 ‥ 482

北海道 2005 260.7 3.58 ‥ 61.2 ‥ 800 :

沖縄 2005 111.1 7.45 ‥ 36.3 ‥ 411

個体別の時系列データを

縦に並べるイメージ。

年別の横断面データを

縦に並べるイメージ。

Page 4: 第 章. パネルデータによる計量分析の基礎 · PDF file45 Baltagi(2005)“Econometric Analysis of Panel Data” (Third Edition),“1.2 Why Should We Use Panel

第 10 章. パネルデータによる計量分析の基礎

185

以下では、分析者が「①個体ごとにスタックされたパネルデータ」を構築していることを前

提として説明を行う。44

3)バランスパネルと非バランスパネル

全ての固体について全期間のデータが存在するパネルデータを「バランスパネル(Balanced

Panel)」という。しかし、被調査対象にとって定期的に調査に応じることには負担感もあるた

め、個人や世帯向けのパネルデータでは、個体の一部について欠落が生じることはやむをえな

い。また、調査に応じなくなった個体が増えれば途中から標本の補充も必要となる。こうした

ケースでは、個体の一部について欠落値のあるパネルデータになる。これを「非バランスパネ

ル(Unbalanced Panel Data)」という。

非バランスパネルでも計量分析を行うことは可能である。特に E-Views では、両者の違いを

ほとんど意識することなく分析することができる。

10-2.パネル分析の利点

Baltagi(2005)によれば、パネル分析を行う主なメリットは以下のようにまとめられる。45

まず、比較的単純かつ明快な利点として、

利点 1:標本数が増えることで自由度が大きくなり、推計の信頼性が高まる。

これについては説明を要しないであろう。また、標本が大きくなることによるもうひとつの

利点として、

利点 2:変数間の変動がより起こり、多重共線性の問題が回避される。

例として、借入需要関数の推計について考えよう。従属変数は新規借入額、独立変数は貸出

金利、GDP、地価(土地の担保価値)とする。これをマクロレベルの時系列データで推計する場

合、GDP と地価は高い相関を持ち、多重共線性の問題が生じる可能性が高い。これに対し、同

じ定式化のもとで地域別のパネルデータを用いて推計する場合はどうであろうか。地域によっ

ては、空洞化などの別の要因が強くはたらき、景気変動と地価がそれほど連動しないところも

あるだろう。したがって、GDP と地価のデータの2変数関係により「バラツキ」が生じる。こ

の結果、多重共線性の問題は緩和される。パネルデータにはこの他にも多くの利点がある。

44 E-Views でパネルデータによる計量分析を行う場合、読み込み手順さえ間違わなければ、どちらの方法でデータセッ

トを構築しても結果に影響はない。 45 Baltagi(2005)“Econometric Analysis of Panel Data”(Third Edition),“1.2 Why Should We Use Panel Data?

Their Benefits and Limitations”,pp.4-9

Page 5: 第 章. パネルデータによる計量分析の基礎 · PDF file45 Baltagi(2005)“Econometric Analysis of Panel Data” (Third Edition),“1.2 Why Should We Use Panel

第 10 章. パネルデータによる計量分析の基礎

186

失業者が新たな職を見つけることができたきっかけ、ないしは、長期失業者がいつまでも新

しい職をみつけられない理由を知ることは有効な雇用政策を立案していくうえで重要な手がか

りとなる。しかし、横断面データでは特定の1時点における個人の就業状態しか把握できず、

「個人の就業状態の変化」をとらえられない。また、たとえ継続的に実施される調査であって

も、調査毎に標本が無作為抽出されるようなものではやはり「個人の就業状態の変化」を分析

することはできない。では、同一個人の就業状態が継続的に記録され、かつ、そうした記録が

多数の個人について得られるパネルデータであればどうだろうか。例えば、(t-1)期には無業

であったがt期に有業となった標本を抽出し、該当標本について他の要因の変化を考察すると

何らかの共通性が見出せるかもしれない。 このようにパネルデータを用いることで、

利点 3:経済主体の行動を動学的に分析することができる。

経済主体の行動の変化を規定する要因の分析方法について、例を改めてさらに検討していこ

う。いま、スーツ工場の従業員に対し、自主参加型の研修を受けたか否かによって仕事の処理

能力に差が生じるかどうかを検証したい。最初にクロスセクションデータでしか推計できない

場合について考えよう。方法としては、まず各従業員が 1時間あたりに何着のスーツを仕上げ

たかを調べ、研修の受講データと照合させたうえで以下のような回帰を行うことが考えられる。

jjjj SXV εγβα +⋅+⋅+= (10-1)

Vj:従業員 jが 1時間当たりで仕上げるスーツの着数

Xj:従業員 jの仕事能力に関係しそうな諸変数のベクトル

Sj:自主参加型の研修を受講した従業員は「1」、していないと「0」をとるダミー

(10-1)式を推計してγが有意に正であれば研修の効果があったとみなせるであろうか。こ

れは必ずしも正しくない。なぜなら、自主研修に参加するような意欲の高い人はもともと能力

が高いだけであり、研修の内容自体は仕事能力に影響を及ぼしていない可能性も否定できない

からだ。次に、パネルデータを用いた推計を考える。推計式は以下のようになる。

tjtjtjtj SXV ,,,, εγβα +⋅+⋅+= (10-2)

Vj,t:t期に従業員 j が 1 時間当たりで仕上げるスーツの着数

Xj,t:t期に従業員 j の仕事能力に関係しそうな諸変数のベクトル

Sj,t:t期に自主参加型の研修を受講した従業員は「1」、していないと「0」をとるダミー

(10-1)式とは異なり、各変数には時間をあらわす添字tが付されている。さて、このよう

に時系列方向のデータが加わった場合、変数 Sはもはや研修の受講経験を示すだけの変数では

Page 6: 第 章. パネルデータによる計量分析の基礎 · PDF file45 Baltagi(2005)“Econometric Analysis of Panel Data” (Third Edition),“1.2 Why Should We Use Panel

第 10 章. パネルデータによる計量分析の基礎

187

ない。というのも、変数 S には新たに「第(t-1)期に研修を受けていなかった(Sj,t-1=0)従

業員が第t期に研修を受けた(Sj,t=1)」という同一個人内での動学的な情報も加わるからだ。

継続的に研修を受けていた者がある期を境に受講をやめてしまったケースについても同様であ

る。よって、γの推計値はより純粋に研修の効果を反映した係数になる。この手法は政策効果

を分析する際に広く用いることができる。以上に示されるようにパネルデータは、

利点 4:ある変数が及ぼす効果をより正確に識別できる46

個体別のデータをプールして分析に用いる場合、個体固有の要因に配慮する必要がある。

Baltagi(2005)では米国のユタ州が例示されている。47 いま、州ごとの時系列データをプー

ルしてパネルデータを構築し、1 人当たりのタバコの消費関数を推定することを考える。説明

変数は①タバコ価格、②所得、③タバコ消費量のラグ項とする。すなわち推計式は、

tjtjtjtjtj CbYbpbaC ,1,2,1,00, ε+⋅+⋅+⋅+= − (10-3)

Cj,t:t期における第j州の 1 人当たりタバコ消費量

pj,t:t期における第j州のタバコ価格

Yj,t:t期における第j州の 1 人当たり所得

ユタ州はモルモン教徒が非常に多いことで知られているが、モルモン教徒はタバコやコーヒ

ーが禁止されている。よって、このことを考慮せずに(10-3)式を推計すると結果にバイアス

が生じてしまう。理想的な対処方法はモルモン教徒の比率を説明変数に加えることであろう。

しかし、仮にユタ州におけるモルモン教徒比率の時系列データが得られたとしても、モルモン

教徒の比率が高くない他の州において同様のデータを得ることは困難である。そこで、次善の

策として、ユタ州の特殊性をダミー変数で吸収することを考える。

tjtjtjtjjtj CbYbpbUtahaaC ,1,2,1,010, ε+⋅+⋅+⋅+⋅+= − (10-4)

ここでダミー変数 Utah には時間の添字 tがない。つまり、ユタ州においてはどの時期にも係

数 a1分だけタバコの消費量が少ないと想定されている。このように地域固有の要因を制御する

ことにより、バイアスのない価格感応度や所得感応度の推計値を得ることができる。つまり、

パネル分析では、

利点 5:個体の異質性を制御したうえで、個体共通の変数間の関係を抽出できる

もちろん、横断面データによる推計でも地域ダミーを入れることはできるが、これは実質的

46 この点は“Difference in differences”と呼ばれる分析手法の考え方とも関連している。 47 ただし、もとの出典は Baltagi and Levin(1992)

Page 7: 第 章. パネルデータによる計量分析の基礎 · PDF file45 Baltagi(2005)“Econometric Analysis of Panel Data” (Third Edition),“1.2 Why Should We Use Panel

第 10 章. パネルデータによる計量分析の基礎

188

に回帰からユタ州の観測値を除く効果をもつ(Baltagi(2005),p.5)。他方、パネル推計におけ

る地域ダミーの効果は、横断面データによる推計でのそれとは本質的に異なる。 (10-4)式の

階差をとると以下のようになる。

tjtjtjtjtj CbYbpbaC ,1,2,1,00, η+∆⋅+∆⋅+∆⋅+′=∆ − (10-5)

すなわち、パネル推計では、地域ダミーによってユタ州特有の要因は除去したうえで、(地域

特殊要因除去後の)ユタ州の説明変数の情報を“remove”せずに係数b0,b1,b2の推計に用い

ることができる。

10-3.E-Views へのパネルデータの読み込み

パネルデータによる計量分析の方法の説明に先立ち、まずは実習問題を交えて E-Views へのパ

ネルデータの読み込み手順について説明する。

Q10-1 (保存 Workfile 名:Q10-1.wf1)

“Q10 実習用パネルデータ.xls” では、1990 年~2002 年における都道府県別の

①CP95:実質 民間消費、

②IH95:実質 民間住宅投資(=実質 民間総固定資本形成 住宅)

③IP95:実質 民間設備投資(=実質 民間総固定資本形成 企業設備)

④IF95:実質 公的企業設備投資(=実質 公的総固定資本形成 企業設備)

⑤IG95:実質 公的企業設備投資(=実質 公的総固定資本形成 一般政府)

⑥YY95:実質 県内総支出

⑦NI95:実質 県民総所得

⑧P95 :県庁所在地における消費者物価指数(1995 年基準)

⑨DEPO:名目 預金残高 (※ 1998 年以降のみ)

⑩LOAN:名目 貸出金残高(※ 1998 年以降のみ)

のデータ(実質値は 1995 年基準、単位:10 億円)が個体ごとにスタックされたパネル

として収録されている。 なお、①~⑩の変数とともに県別識別番号(PREFNUM)と年度

(YEAR)の 2つの系列も定義されている。これら全てのデータを E-Views に読み込み、パ

ネルデータによる計量分析の準備を整えよ。

Page 8: 第 章. パネルデータによる計量分析の基礎 · PDF file45 Baltagi(2005)“Econometric Analysis of Panel Data” (Third Edition),“1.2 Why Should We Use Panel

第 10 章. パネルデータによる計量分析の基礎

189

【作業手順】

1)Excel で“Q10 実習用パネルデータ.xls”を開き、典型的なパネルデータセットの Excel 上

での構築例を確認せよ。

《推奨》

① 各個体に識別番号を割り当てておく。

② 各個体の時系列の長さが一致しない場合(Unbalanced Panel)でも、時系列部分を

・開始:もっとも過去までデータが存在する個体の期初

・終了:もっとも最新までデータが存在する個体の期末

にあわせてあたかも Balanced Panel であるかのようにデータセットを構築し、欠損

部分は空白にしておく

2)E-Views で新規の Workfile を作成する。

①メニューバーより 「File → New → Workfile」とすすみ、

・Workfile Structure : Balanced Panel 48

・Frequency :(この実習例では)Annual

・Start Date :(この実習例では)1990

・End Date :(この実習例では)2002

・Number of Cross Section:(この実習例では)47

② 開いた Workfile の“Range”と“Sample”欄が以下の表示になっていることを確認する。

Range : 1990 2002 × 47 --- 611obs

Sample: 1990 2002 --- 611obs

3)Excel のデータを E-Views の Workfile へと読み込む

Excel からデータを読み込む方法は2とおりある。それぞれについて説明する。

[1] Excel のワークシートをインポートする方法

※ Excel 上での操作と E-Views 上での操作の 2パートに分かれる。

48 実際には非バランスパネルであっても、手順 1)に示されたようにパネルデータを構築しておけば“Balanced Panel”

と設定してよい。

Page 9: 第 章. パネルデータによる計量分析の基礎 · PDF file45 Baltagi(2005)“Econometric Analysis of Panel Data” (Third Edition),“1.2 Why Should We Use Panel

第 10 章. パネルデータによる計量分析の基礎

190

A:EXCEL 上での作業

① 読込み元の Excel のシート(“Q10 実習用パネルデータ.xls”)を開く。

② 変数名を全てコピーしておく(後で E-VIEWS に貼り付ける)

→ PREFNUM,YEAR,CP95,IH95,IP95,IF95,IG95,YY95,NI95,P95,DEPO,LOAN

③ データ(除:変数名)がどのセルからはじまるかを覚えておく。 →“C8”セル

⇒ 以上の作業が終わったら、EXCEL のシートは閉じる。

B:E-Views 上での作業

① Workfile より“Procs → Import → Read Text-Lotus- Excel”とすすみ、読み込

むワークシートがあるフォルダを選択したうえで、当該ファイル名を指定する。

② 本実習のように個体ごとにスタックされたパネルデータの場合、

・Data Order: By Observation ‐ series in columns

③ 以下の欄には「A:Excel 上での作業」に示された内容を入力する。

・Names for series or ~ : A-①でコピーしておいた変数名をペーストする。

・Upper left data cell : A-②で覚えておいたセル番地を入力する

④ 最後に「OK」を押し、読み込んだ変数が Workfile で認識されたことを確認する。

【注意】 もとの EXCEL ファイルが複数のシートから構成されている場合には、

“Excel 5+ file name”欄にデータのあるシート名を明記すること

[2] Excel のデータをコピー&ペーストする方法

① Excel の Worksheet で、全変数の全データ範囲(含:変数名)をコピーする。

② E-Views のメニューバーより、“Quick → Empty Group”とすすむ。

③ ワークシート状のウィンドウがあらわれたら、右端のスクロールバーを上方に移動さ

せ、左側に“obs”が見えるようにする。(最初は“obs”は隠れている)

④ カーソルを左上端セルに移動し、Excel でコピーした内容をペーストする。

⑤ E-Views の Workfile で読み込んだ変数が認識されたことを確認する。

⑥ Group Untitled という画面は“Delete”してよい。

Page 10: 第 章. パネルデータによる計量分析の基礎 · PDF file45 Baltagi(2005)“Econometric Analysis of Panel Data” (Third Edition),“1.2 Why Should We Use Panel

第 10 章. パネルデータによる計量分析の基礎

191

※ 操作に慣れない段階では、データを不正確に読み込んでしまうことがままある。パネ

ルデータの場合、1セル分のズレ(例:北海道の 2002 年のデータが青森県の 1990 年のデ

ータとして読み込まれてしまう)が致命的な問題を引き起こす。よって、Workfile にデー

タを読み込んだ時点でいくつかの系列を表示し、必ず確認してほしい。

Q10-2

任意にいくつかの系列を選択し、以下の作業を行いなさい。

1)都道府県別・年度別に記述統計量を表示せよ。

2)都道府県別に時系列の折れ線グラフを表示せよ。

⇒ 操作手順は以下のとおり (“YY95:実質 GDP”についての解答例は巻末〔P312〕に掲載されてい

る)

【操作手順】(以下では、全て変数“YY95:実質 GDP”を例として操作手法を説明する)

A:Workfile より変数“YY95”を選択しダブルリック [ 1)~3)に共通 ]

1.記述統計量

①“View → Descriptive Statistics → Stats by Classification”とすすむ。

②“Statistics”で見たい指標にチェックを入れる。

③“Series / Group for Classify”については以下のように入力せよ。

・都道府県別に算出する場合:(この実習例では)prefnum

・年度別に算出する場合 :(この実習例では)year

2.線グラフ

“View → Graph → Line → Individual cross section graphs”として“OK”を押す

10-4.パネルデータの計量分析

10-4-1.基本的なモデル

いま以下の単純なモデルをパネルデータで推計するケースを考える。

ε+⋅+= xbay (10-6)

Page 11: 第 章. パネルデータによる計量分析の基礎 · PDF file45 Baltagi(2005)“Econometric Analysis of Panel Data” (Third Edition),“1.2 Why Should We Use Panel

第 10 章. パネルデータによる計量分析の基礎

192

ただし、

=

TN

N

N

tj

T

y

yy

y

y

yy

y

,

2,

1,

,

,1

2,1

1,1

M

M

M

M

=

TN

N

N

tj

T

x

xx

x

x

xx

x

,

2,

1,

,

,1

2,1

1,1

M

M

M

M

=

TN

N

N

tj

T

,

2,

1,

,

,1

2,1

1,1

ε

εε

ε

ε

εε

ε

M

M

M

M

j=1,2,・・・,N t=1,2,・・・,T

ここでjは個体、tは時間をあらわす添字である。仮に(10-6)式の誤差項において

( ) 0, =tjE ε , ( ) 2, εσε =tjVar (一定) (10-7)

が成立しているのであれば、個体間・時点間での異質性はないことになる。よって、通常の

OLS を適用すればよい。しかし、パネルデータでは個体ごとに異質性があることが一般的で

ある。このうち観察可能な個別性については説明変数に加えれば制御できるが、観察できな

い個別性については誤差項の差異として定式化する。すなわち、

tjjtj ,, ηαε += (10-8)

ここでαは個体ごとの異質性を表し、一般に「個別効果」と呼ばれる。ここで個別効果(α)

には個体の添字のみが付されており、時間の添字がついていないことに注意されたい。つま

り、パネルデータを用いた計量分析では、個体ごとの異質性は時間を通じて変化しないこと

が前提とされる。加えて、個別効果(α)と全個体に共通の誤差項(η)の間には相関はない

ものとする。

0),( , =tjjCov ηα (10-9)

さらに、以下では全個体に共通の誤差項(η)については系列相関も不均一分散もないと仮

定する。

( ) 0, =tjE η , ( ) 2, ηση =tjVar , ( ) 0, ,, =tksjCov ηη for j≠k and s≠t (10-10)

Page 12: 第 章. パネルデータによる計量分析の基礎 · PDF file45 Baltagi(2005)“Econometric Analysis of Panel Data” (Third Edition),“1.2 Why Should We Use Panel

第 10 章. パネルデータによる計量分析の基礎

193

これらを整理すると、基本的なパネル推計のモデルは以下のようになる。

tjjtjtj xbay ,,, ηα ++⋅+= (10-11)

ただし、 ( ) 0, =tjE η , ( ) 2, ηση =tjVar , ( ) 0, ,, =tksjCov ηη , 0),( , =tjjCov ηα

10-4-2.固定効果と変量効果

個別効果(αj)のとらえ方は2通りある。第 1に、各個体の個別効果は、当該個体のみが有

する固有の要因に基づいて決まっているというとらえ方である。このように確定的に決まる個

別効果を「固定効果(Fixed Effect)」という。49 このとらえ方が正しいとすれば、各個体の

個別効果の大きさが1つ1つ明らかにされないかぎり、個体間の異質性を制御した推計を行う

ことはできない。しかし、10-4-1 節で述べたように、パネルデータによる計量分析では個別効

果は「観察できない個体間の異質性」と定義される。「観察できない効果」をどうすれば定量的

に把握できるであろうか。固定効果モデルないし最小二乗ダミー変数(Least Squares Dummy

Variables:LSDV)モデルと呼ばれる推計手法では、各個体別に定数項ダミー(第 2章 2-6 節参

照)をおき、個体間の異質性を推計された定数項ダミーの差異に反映させる。

図 10-1.固定効果のイメージ

個体1

個体2

個体3

個体4

個体5

個体6

個体7

個体8

個体9

個体23

個体24

個体25

個体26

個体27

個体28

個体29

個体30

つまり、(10-11)式において、個別効果(αj)は(N-1)個の説明変数(第j個体の全期間

(1,2,・・・,T)のみ「1」の値をとり、他についてはゼロの値をとるダミー変数)に対応する係

数推定値としてあつかわれる。50 固定効果モデルについては 10-4-4 節で説明する。

49 ここで「確定的」とは確率分布にしたがわないことを意味している。この用語は、この後で説明する「変量効果」

との対比で用いられている。 50基準となる個体の個別効果をゼロとし、(N-1)個の定数項ダミーは基準との差として解釈される。

個別効果の大きさ

(基準個体との差)

Page 13: 第 章. パネルデータによる計量分析の基礎 · PDF file45 Baltagi(2005)“Econometric Analysis of Panel Data” (Third Edition),“1.2 Why Should We Use Panel

第 10 章. パネルデータによる計量分析の基礎

194

第 2 に、各個体の個別効果がある確率分布から発生しているというとらえ方がある。確率

分布に従う個別効果を「変量効果」という。このとらえ方が正しいとすれば、全個体の個別

効果をヒストグラムにとると規則性をもった分布が現われるであろう。

図 10-2.変量効果のイメージ

個体2

個体5

個体10

個体6 個体13 個体7

個体9 個体17 個体11 個体1

個体3 個体14 個体23 個体12 個体4

個体20 個体8 個体18 個体26 個体15 個体27

個体24 個体21 個体16 個体29 個体28 個体25 個体30 個体19 個体22

ただし、実際には事前に個別効果の大きさは知ることはできないのでこうしたヒストグラ

ムは作成できない。よって、図 10-2 はあくまでもイメージであり、分布もアドホックな形状

が描かれている。もっとも、ここで重要なことは、事前に「個別効果が図 10-2 のように規則

的に分布したがう」と想定することだ。この想定のもとでは、分布の形状さえわかれば個体

間の異質性を制御した推計を行うことができる。換言すれば、(固定効果モデルのように)各

個体の個別効果を1つ1つ推計する必要はない。

(10-11)式において、個別効果の平均が定数項(a)に反映されると考えると、αj は各

個体の個別効果の「平均からの偏差」とみなすことができる。よって、期待値は

( ) 0=jE α (10-12)

となる。したがって、個別効果を変量効果とみなした場合には、(10-11)式においてαj

を誤差項の一部として扱うことになる。

tjtjtj xbay ,,, ε+⋅+= where tjjtj ,, ηαε += (10-13)

ところで、全個体に共通の誤差項(η)の性質については(10-10)式のように仮定されてお

り、さらに(10-9)式でαjがηと独立に分布していると仮定しているので、あとはαjの分

個別効果の平均

個別効果の大きさ

該当する個体の数

Page 14: 第 章. パネルデータによる計量分析の基礎 · PDF file45 Baltagi(2005)“Econometric Analysis of Panel Data” (Third Edition),“1.2 Why Should We Use Panel

第 10 章. パネルデータによる計量分析の基礎

195

散さえわかれば、(10-13)式の誤差項εの分散・共分散行列を特定化できる。このとき、第

3章補論の 3a-Ⅲ節で説明された一般化最小二乗法(GLS)により、パラメータ a,bの(漸近

的な)最小分散推定量を得ることができる。この推計手法は変量効果モデルと呼ばれる。こ

のように変量効果モデルでは、個別効果(αj)そのものではなく、αj の分散を推定するこ

とによって個体の異質性を制御した推計を行う。変量効果モデルについては、10-4-5 節で説

明される。

10-4-3.パネルデータセットの性質と個別効果のタイプ

W.H.Greene(2000)“Econometric Analysis(Fourth Edition)”の第 14章で指摘されて

いるように、固定効果モデルにおいては、個別効果を各標本に固有なものとして扱っている

ため、推計結果を標本外の個体に適用することはできない。したがって、手持ちのパネルデ

ータセットが母集団に近いとみなせるときにふさわしい推計手法といえる。例えば、先進国

のみにあてはまるモデルを推計しようとする場合、OECD 諸国のパネルデータを使えばほぼ母

集団がカバーされる。また、日本にのみあてはまる消費関数を推計する場合、都道府県別の

パネルデータはやはり母集団をカバーしたものになる。

他方、変量効果モデルでは、各個体の個別効果が同じ確率過程から発生していることを前

提としているため、推計結果を標本外の個体にも適用することができる。例えば、パネルデ

ータのクロスセクションが大きな母集団のごく一部を構成しているに過ぎないケースでは、

個別効果を確率変数とみなすことがより妥当かもしれない。 10-1-2 節で紹介した PSID や消

費生活のパネル調査はこれに該当しうる。

もっとも、実際にパネル推計を行う場合、固定効果モデル・変量効果モデルの選択にあた

ってこうした標本の性質はあまり考慮されず、統計的な仮説検定(Wu-Hausman 検定)による

機械的な選択が主流となっている。なお、Wu-Hausman 検定については 10-5 節で説明する。

10-4-4.固定効果モデル

1)最小二乗ダミー(LSDV:Least Square Dummy Variables)変数モデル

個別効果が確定的であるなら、(10-11)式においてαjを個体ごとの定数項ダミーとみなすこ

とができる。したがって、以下の式を OLS 推定することにより、個体の異質性を制御したうえ

でのbの係数推定値が得られる。

tjtj

N

itjitj xbiday ,,

2,, )( ηα +⋅+⋅+= ∑

=

(10-14)

Page 15: 第 章. パネルデータによる計量分析の基礎 · PDF file45 Baltagi(2005)“Econometric Analysis of Panel Data” (Third Edition),“1.2 Why Should We Use Panel

第 10 章. パネルデータによる計量分析の基礎

196

d(i):第 i個体の全期間(1,2,・・・,T)のみ「1」の値をとり、他についてはゼロの値

をとるダミー変数

この(10-14)式は「固定効果モデル」または「最小二乗ダミー(LSDV:Least Square Dummy

Variables)変数モデル」と呼ばれる。ところで、(10-14)式における係数bの LSDV 推定量は、

以下の定数項のない回帰式(10-15)の OLS 推定によって得られるβの係数推定値と等しくなる

ことが知られている。

tjjtjjtj xxyy ,,, )( ωβ +−⋅=− jtjtj ηηω −= ,, (10-15)

ただし、 ∑=

⋅=T

ttjj y

Ty

1,

1 ∑

=

⋅=T

ttjj x

Tx

1,

1 ∑

=

⋅=T

ttjj T 1

,1 ηη

ここでy-

j や x-

j を変数 y とxのグループ平均(または級平均:Group Mean)という。また、

(10-15)式の OLS 推定量を級内推定量(within Group Estimator)という。

加えて、(10-14)式における固定効果(αj)は、グループ平均と(10-15)式のβの級内推

定量を用いて算出できることも知られている。

jjj xy ⋅−= βα (10-16)

LSDV 推定量と級内推定量が同値であるという性質は、(10-14)式の残差平方和を最小化する

ときの正規方程式(係数bとαjに関する最適化の1階条件)を変形することによって簡単に証

明できる。51 一般に、パネルデータの計量分析では個別効果の大きさ自体には関心が払われ

ず、個別性を制御したうえで個体間に共通の関係を抽出すること(つまりbないしβの推計)

が重視される。その場合には、(10-15)式を OLS 推計ですれば多数の定数ダミーを推計する手

間を省くことができる。ただ、コンピュータの処理速度が遅かった時代にはこのメリットは大

きかったかもしれないが、現在では個体数の多いパネルデータに対して(10-14)式を適用した

としても係数の推定にさして時間はかからない。

2)固定効果の検定

LSDV モデル(10-14)式を推計すると、(N-1)個の固定効果が推計される。しかし、分析者

の事前の想定に反し、実際には個体間に差異は存在しない可能性もある。したがって、個体間

に統計的に有意な差異が存在するか否かを検定する必要がある。この検定の帰無仮説は、

H0: 032 ==== Nααα L

51 証明に興味があれば、W.H.Grrene“Econometric Analysis”(Prentice Hall)などを参照されたい。

Page 16: 第 章. パネルデータによる計量分析の基礎 · PDF file45 Baltagi(2005)“Econometric Analysis of Panel Data” (Third Edition),“1.2 Why Should We Use Panel

第 10 章. パネルデータによる計量分析の基礎

197

であり、対立仮説は

H1: Nααα ,,, 32 L のうち少なくともいずれかひとつはゼロではない。

である。これは複数の係数制約が同時に成立するか否かの検定とみなせる。よって、第 1に

F検定が適用できる。また、尤度比検定(Likelihood Ratio Test)を用いることもできる。制

約つきのモデルと制約のないモデルのそれぞれを最尤法で推定し、その対数尤度をそれぞれ、

制約付き回帰の尤度: L(RES) 制約なし回帰の尤度:log(UNRES)

とする。このとき、

×−=

)()(log2

UNRESLRESLLR (10-17)

の大標本分布は帰無仮説(固定効果ゼロの制約あり)が正しいもとで自由度を制約の数(この

場合は(N-1))とするカイ二乗分布になる。この性質を利用するのが尤度比検定である。 E-Views

で固定効果モデルを推計すると、簡単な手順で F検定と尤度比検定を実行できる。

参考:最尤推定と尤度比検定

※ 最尤法の厳密な解説は、蓑谷千凰彦著『統計学入門』(東京図書)第 2 巻、第 7章等を参照のこと

最尤法とは、手持ちの標本が未知パラメータをもつ確率分布から発生していると想定したうえで、

その確率分布から手持ちの標本が発生する確率が一番高くなるように(一番 尤もっと

もらしくなるよう

に)未知パラメータを推計する手法である。

例えば、単純な回帰モデルを最尤推定する場合、まず誤差項(εt=yt-(a+b・Xt))が平均 0,分

散σ2の正規分布にしたがって発生すると仮定する。ここで未知パラメータは(a,b,σ2)である。次

に、この確率過程から手持ちの(yt, Xt)の標本セットが発生する確率が最大となるように未知パ

ラメータ(a,b,σ2)を推定する。このときの目的関数を尤度関数といい、L(a,b,σ2)と表す。解

釈の仕方こそ異なるものの、尤度関数は数学的には同時確率分布関数と同値である。

2 つのモデルを推計して最大尤度の比をとったとき、直観的には、尤度比が大きくなるほど(=分

子の尤度が相対的に大きくなるほど)分子の尤度に対応するモデルがより尤もらしいと判断される。

ただし、尤度比検定の統計量は、(10-17)に示されるように尤度比に負の値(-2)が乗じてある。

よって、LR が大きな値をとることは、尤度比部分が小さくなることと同値である。これは、分母(制

約なしモデルの尤度)が相対的に大きくなること、換言すれば、帰無仮説(制約あり)が棄却され

やすくなることを意味する。

Page 17: 第 章. パネルデータによる計量分析の基礎 · PDF file45 Baltagi(2005)“Econometric Analysis of Panel Data” (Third Edition),“1.2 Why Should We Use Panel

第 10 章. パネルデータによる計量分析の基礎

198

Q10-3 (保存 Workfile 名:Q10-3.wf1)

Q10-1 で読んだデータで以下の消費関数を固定効果モデルで推計し、固定効果が統計

的に有意に存在するか否か検定したうえで、都道府県別の固定効果を表示せよ。

CP95it = α + β・YY95it +εit where ε=αi+uit

⇒ 操作手順は以下のとおり (解答例は巻末[P315]に掲載されている)

【操作手順】

A)固定効果モデルの推計

① Workfile ウィンドウから“Object → New Object → Equation”とすすみ、

“Specification”タブの“ Equation Specification”欄に以下のように入力する。

⇒ CP95 C YY95

②“Panel Option”タブにすすみ、“Effects Specification”欄で以下を選択する、

・Cross-section ⇒ Fixed ・Period ⇒ None

③ 最後に“OKを押す。”

B)固定効果の検定

・ 推計結果のウィンドウから“View → Fixed/Random Effect Testing”とすすみ、

“Redundant Fixed Effects ‐ Likelihood Ratio”を選択する。

→ “Effect Test”欄に F 検定(Cross-Section F)と尤度比検定(Cross-Section

Chi-quares)の検定統計量および p値(有意確率:帰無仮説が正しい確率)が表示

される。一般に、p 値が 5%を下回るようなら、「帰無仮説:定数項ダミーが全てゼ

ロ(個体間に異質性は全くない)」が統計的に有意に棄却されたとみなせる。

C)固定効果の表示

・推計結果のウィンドウから“View → Fixed/Random Effects”とすすみ、“Cross-section

Effects”を選ぶ。

Page 18: 第 章. パネルデータによる計量分析の基礎 · PDF file45 Baltagi(2005)“Econometric Analysis of Panel Data” (Third Edition),“1.2 Why Should We Use Panel

第 10 章. パネルデータによる計量分析の基礎

199

【注意】

本節では(10-14)式のように、基準となる個体の個別効果をゼロとし、(N-1)個の

定数項ダミーを推計するモデルを説明してきた。しかし、E-Views においては、「全ての

個体の固定効果の合計はゼロになる(固定効果の平均をゼロと仮定することと同値)」

という制約を加えたもとで、N 個全てについて非ゼロの固定効果が推計される。

3)時間に関する固定効果

これまでは個体間の異質性のみを制御対象としてきたが、同様にして時点間の差異も制

御することができる。52 すなわち、

tjtj

T

mtjm

N

itjitj xbmdiday ,,

2,

2,, )()( ηγα +⋅+⋅+⋅+= ∑∑

==

(10-18)

d(i):第 i個体の全期間(1,2,・・・,T)のみ「1」の値をとり、他についてはゼロ

の値をとるダミー変数

d(m):第 m期のみ全ての個体について「1」の値をとり、他についてはゼロの値

をとるダミー変数

E-Views では、(10-18)式についても(10-14)式とほぼ同様の方法で推計できる。

Q10-4 (保存 Workfile 名:Q10-4.wf1)

Q10-1 で読んだデータで以下の消費関数をクロスセクションと時点の両方向の固定効

果を考慮したモデルで推計せよ。そのうえで、クロスセクションと時点の固定効果が統

計的に有意に存在するか否か検定し、都道府県別・時点別に固定効果を表示せよ。

CP95it = α + β・YY95it +εit where ε=αi+γt+uit

⇒ 操作手順は以下のとおり (解答例は巻末[P317]に掲載されている)

52 パネルデータを用いた計量分析において、クロスセクションの異質性のみを考慮した定式化は“One-way Error

Component Regression Model”、クロスセクションと時系列両方向の個別性を考慮したモデルは“Two-way Error

Component Regression Model”と呼ばれる。

Page 19: 第 章. パネルデータによる計量分析の基礎 · PDF file45 Baltagi(2005)“Econometric Analysis of Panel Data” (Third Edition),“1.2 Why Should We Use Panel

第 10 章. パネルデータによる計量分析の基礎

200

【操作手順】

A)モデルの推計

① Workfile ウィンドウから“Object → New Object → Equation”とすすみ、

“Specification”タブの“ Equation Specification”欄に以下のように入力する。

⇒ CP95 C YY95

②“Panel Option”タブにすすみ、“Effects Specification”欄で以下を選択する、

・Cross-section ⇒ Fixed ・Period ⇒ Fixed

③ 最後に“OK”を押す。

B)固定効果の検定

・ 推計結果のウィンドウから“View → Fixed/Random Effect Testing”とすすみ、

“Redundant Fixed Effects ‐ Likelihood Ratio”を選択する。

→ 3つの帰無仮説に関する検定が実施される。

①Cross-section F / Cross-section Chi-square

帰無仮説: 032 ==== Nααα L

②Period F / Period Chi-square

帰無仮説: 032 ==== Tγγγ L

③Cross-Section/Period F / Cross-Section/Period Chi-square

帰無仮説: 03232 ======== TN γγγααα LL

~ F 検定と尤度比検定(Chi-quares)ともに p値が 5%を下回るようであれば、一般に

帰無仮説が棄却されたとみなされ、固定効果ありと判断できる。

C)固定効果の表示

・推計結果のウィンドウから“View → Fixed/Random Effects”とすすみ、

①“Cross-section Effects”を選ぶ → クロスセクションの固定効果を表示

②“Period Effects”を選ぶ → 時点の固定効果を表示

Page 20: 第 章. パネルデータによる計量分析の基礎 · PDF file45 Baltagi(2005)“Econometric Analysis of Panel Data” (Third Edition),“1.2 Why Should We Use Panel

第 10 章. パネルデータによる計量分析の基礎

201

4)誤差項に 1階の系列相関を考慮した固定効果モデル

E-Views では、誤差項に 1階の系列相関を考慮した固定効果モデルの推計もできる。

tjtj

N

itjitj xbiday ,,

2,, )( ηα +⋅+⋅+= ∑

=

ただし、 1,1,, −− +⋅= tjtjtj ξηρη (10-19)

ここで、ξは古典的線形回帰モデルの諸仮定を満たす誤差である。

Q10-5 (保存 Workfile 名:Q10-5.wf1)

Q10-1 で読んだデータで以下の消費関数をクロスセクションのみの固定効果モデルで

推計せよ。ただし、誤差項 uに 1階の系列相関を考慮すること。

CP95it = α + β・YY95it +εit where ε=αi+uit , uit=ρ・uit-1+ξit

⇒ 操作手順は以下のとおり (解答例は巻末[P319]に掲載されている)

【作業手順】

① Workfile ウィンドウから“Object → New Object → Equation”とすすみ、

“Specification”タブの“ Equation Specification”欄に以下のように入力する。

⇒ CP95 C YY95 AR(1)

②“Panel Option”タブにすすみ、“Effects Specification”欄で以下を選択する、

・Cross-section ⇒ Fixed ・Period ⇒ None

※ AR(1)を導入した場合には、時間の個別効果を考慮したモデルは推定できない

③ 最後に“OK”を押す。

10-4-5.変量効果モデル

前節で説明した固定効果モデルでは、個体の異質性は定数項ダミーの大きさの違いとして表

された。これに対し、変量効果モデルでは個別効果(αj)を誤差項の一部とみなし、αj その

ものではなく、αjの分散を推定することで個体の異質性を制御する。あらためて 10-4-2 節の

(10-13)式と関連する誤差項の性質をまとめると以下のようになる。

Page 21: 第 章. パネルデータによる計量分析の基礎 · PDF file45 Baltagi(2005)“Econometric Analysis of Panel Data” (Third Edition),“1.2 Why Should We Use Panel

第 10 章. パネルデータによる計量分析の基礎

202

tjtjtj xbay ,,, ε+⋅+= where tjjtj ,, ηαε += (10-20)

ただし、 ( ) 0, =tjE η , ( ) 2, ηση =tjVar , ( ) 0, ,, =tksjCov ηη , (10-21)

( ) 0=jE α , ( ) 2ασα =jVar , ( ) 0, =kjCov αα (10-22)

0),( , =tjjCov ηα (10-23)

ここで(10-20)式の誤差項(ε)の構造についてくわしく見ていこう。まず、N個の個体の

データをいったん個体別に切り離し、各固体の分散・共分散の構造についてみると、以下のよ

うに T×T行列で表記される。

+

++

22222

22222

22222

αηααα

αααηα

ααααη

σσσσσ

σσσσσσσσσσ

L

MMMM

L

L

(10-24)

全個体に共通の誤差項(η)は、(10-21)式に示されるように均一分散かつ系列相関がない。

よって、(10-24)式では対角要素のみに現れる。他方、変量効果(α)は時間に応じて変化し

ないと想定されているので、(10-22)式に示されるように時点に関係なくつねに一定となる。

よって、(10-24)式では全ての要素に現れる。いま、(10-23)式に示されるように変量効果(α)

と個体共通の誤差項(η)は独立であるから、(10-24)式の対角要素は両者の分散の和となる。

ところで、これは 1つの個体の分散・共分散行列に過ぎない。実際の推計対象である(10-20)

式の分散・共分散行列は以下の(N・T×N・T)行列となる。

Σ

ΣΣ

L

MMMM

L

L

000

000000

(10-25)

(10-22)式に示されたように、個体間の変量効果がないので( ( ) 0, =kjCov αα )、行列Ω

においてブロック対角要素以外の要素は 0となる。このように誤差項εは不均一分散である。

(なお、以下の議論については、第 3 章補論の 3a-Ⅲ節で行列表記による一般化最小二乗法に

ついて学ばなければ理解することができない。意欲ある読者はいったん 3a-Ⅲ節に戻ってほし

い。他方、統計理論に関心のない読者はこの節を読みとばし、実習問題に進まれたい)

Page 22: 第 章. パネルデータによる計量分析の基礎 · PDF file45 Baltagi(2005)“Econometric Analysis of Panel Data” (Third Edition),“1.2 Why Should We Use Panel

第 10 章. パネルデータによる計量分析の基礎

203

(10-25)式は明らかに対角行列であるから、以下を満たす正方行列 Pが存在する。

1' −Ω=PP (10-26)

(10-20)式の両辺に左から行列 Pを乗じると以下のようになる。

εβ PPXPy += ⇒ *** εβ += Xy (10-27)

(10-27)式の誤差項(ε*)の分散・共分散行列は以下のようになる。

')('')'()''()( 11*'* PPPPPPEPPEE −−Ω=Ω=== εεεεεε ε

IPPPPPPPP =′=′= −−− )')((')( 111 (10-28)

すなわち、ε*は古典的線形回帰モデルの諸仮定を満たす誤差項であるから、(10-27)式を

OLS 推定すれば係数βの BLUE(線形不偏最小分散推定量)が得られる。ところで、(10-26)

式を満たす行列 P を厳密に計算すると53、各変数に左から P を乗じる変数変換は以下のよう

になる。

⋅−

⋅−⋅−

⋅=

jTj

jj

jj

j

yy

yyyy

Py

θ

θθ

ση

,

2,

1,

1M (10-29)

ただし、 ∑=

⋅=T

ttjj y

Ty

1,

1

221

ηα

η

σσ

σθ

+⋅−=

T

このように変量効果モデルでは、一般化最小二乗法を用いて個別効果の分散を考慮したパ

ラメータ推計を行い、これによって個体間の異質性を制御している。以上が変量効果モデル

の統計理論的背景である。

もっとも、(10-27)を推計しようとると、変量効果(α)と個体共通の誤差項(η)の分散

の値が必要になる。そうでなければ(10-29)のθの値が確定せず、変数変換を行えな

い。しかし、実際には はともに未知パラメータである。よって、これらを推計する必

要が生じる。

第 1 に、個体共通の誤差項(η)の分散 については、(10-15)式の OLS 残差から推計さ

れる分散の推定値を用いる。

53 W.H.Greene(2000)“Econometric Analysis(Fourth Edition)” (Prentice Hall)の第 14 章,J.Jhonston and J.DiNardo

(1997)“Econometric Methods(Fourth Edition)”(McGRAW-Hill)の第 12 章などを参照のこと

2ησ

22 , ηα σσ22 , ηα σσ

Page 23: 第 章. パネルデータによる計量分析の基礎 · PDF file45 Baltagi(2005)“Econometric Analysis of Panel Data” (Third Edition),“1.2 Why Should We Use Panel

第 10 章. パネルデータによる計量分析の基礎

204

tjjtjjtj xxyy ,,, )( ωβ +−⋅=− jtjtj ηηω −= ,, (10-15:再掲)

ただし、 ∑=

⋅=T

ttjj y

Ty

1,

1 ∑

=

⋅=T

ttjj x

Tx

1,

1 ∑

=

⋅=T

ttjj T 1

,1 ηη

この(10-15)式は、実は以下の 2つの式の差になっている。

tjjtjtj xbay ,,, ηα ++⋅+= (10-30)

jjjj xbay ηα ++⋅+= (10-31)54

個別効果(αj)が固定効果であるか変量効果であるかに関係なく、(10-30)式と(10-31)

式の差として得られる(10-15)式では個別効果の影響が除去される。したがって、この式を

OLS で推計し、得られた残差から計算された誤差項の分散の不変推定量は、個体共通の誤差項

(η)の分散 の推計値として利用できる。さらに、10-4-4 節で述べたように、(10-15)式

の級内推定量と、(10-14)式の LSDV 推定量は同値である。つまり、結局のところ には固定

効果モデル(LSDV モデル)の推計残差から得られる分散の不偏推定量を用いればよい。固定効

果モデルの分散の不偏推定量は以下のとおりである。

kNTN

eeT

tjtj

N

j

−−⋅

−=

∑∑== 1

2,

12

)(ˆησ (10-32)

e:LSDV モデル(10-14)式の OLS 残差

k:定数項(と定数項ダミー)を除く説明変数の数

次に、変量効果(αj)の推計値 について検討する。 の推計にあたっては、最初に以下

の式を OLS 推定する。

jjj xbay ψ+⋅+= ただし、 ∑=

⋅=T

ttjj y

Ty

1,

1 ∑

=

⋅=T

ttjj x

Tx

1,

1 (10-33)

級平均を標本として回帰しているため、この回帰のサンプル数は N個である。なお(10-33)

式の OLS 推定量を「級間推定量(Between Group Estimator)」という。(10-31)式と(10-33)

式を対応させると、

jjj ηαψ += (10-34)

が成り立つ。さらに、

54 ここで(10-31)式のα が級平均になっていないのは、個別効果が時間に関して不変と仮定されているためである。

2ησ

2ησ

2ασ

2ασ

Page 24: 第 章. パネルデータによる計量分析の基礎 · PDF file45 Baltagi(2005)“Econometric Analysis of Panel Data” (Third Edition),“1.2 Why Should We Use Panel

第 10 章. パネルデータによる計量分析の基礎

205

∑=

⋅=T

ttjj T 1

,1 ηη : 個体間に共通の誤差の級平均の定義式

0),( , =tjjCov ηα : αとηの独立性

をふまえると、以下の関係が導かれる。

T

Var j

222)( ηαψ

σσσψ +== (10-35)

これを について解くと、

T

222 ηψα

σσσ −= (10-37)

このうち については既に(10-32)式で推定値が得られている。 また、 についても、

(10-33)式の OLS 残差より以下のように不偏推定量を算出できる。

)1(ˆ 1

2

2

+−=

∑=

kN

vN

jj

ψσ (10-38)

k:定数項を除く説明変数の数 v:(10-33)式の OLS 残差

ここに変量効果(α)と個体共通の誤差項(η)の分散の推定値がともに得られ、(10-29)

式の変数変化によって、(10-27)式を実際に推計することが可能になる。

もっとも、以上のような煩雑な導出過程を知らなくても、E-Views では簡単な操作によって

変量効果モデルを推計することができる。

Q10-6 (保存 Workfile 名:Q10-6.wf1)

Q10-1 で読んだデータで以下の消費関数を変量効果モデルで推計せよ。

CP95it = α + β・YY95it +εit where ε=αi+uit

⇒ 操作手順は以下のとおり (解答例は巻末[P320]に掲載されている)

【作業手順】

① Workfile ウィンドウから“Object → New Object → Equation”とすすみ、

“Specification”タブの“ Equation Specification”欄に以下のように入力する。

2ασ

2ησ

2ψσ

Page 25: 第 章. パネルデータによる計量分析の基礎 · PDF file45 Baltagi(2005)“Econometric Analysis of Panel Data” (Third Edition),“1.2 Why Should We Use Panel

第 10 章. パネルデータによる計量分析の基礎

206

⇒ CP95 C YY95

②“Panel Option”タブにすすみ、“Effects Specification”欄で以下を選択する、

・Cross-section ⇒ Random ・Period ⇒ None

③ 最後に“OK”を押す。

【補足】

a)変量効果モデルにおいても、個体間の異質性だけでなく、時点間の異質性を考慮し

た推計が可能である。(cf. Cross-section ⇒ Random / Period ⇒ Random )

b)E-Views で変量効果モデルを推計する場合、個体共通の誤差項に 1 階の系列相関を

考慮した推計は実行できない。

c)E-Views では固定効果と変量効果を組み合わせた推計も可能である。

(cf. Cross-section ⇒ Random / Period ⇒ Fixed )

10-5.固定効果モデルと変量効果モデルの選択

パネルデータによる計量分析において、しばしば問題となるのが固定効果モデルと変量効果モ

デルの選択である。10-4-3 節ではデータセットの性質に応じたモデルの適性について言及した。

しかし、これは必ずしも客観的な基準とはいえない。分析者の恣意性を排除するうえでは、

Wu-Hausman によって提唱されたワルド検定が有用である。 現在では(この検定のエッセンスが

広く理解されているかは別として)ほとんどの分析で Wu-Hausman 検定によるモデル選択が採用さ

れている。以下では、Wu-Hausman 検定の概要を説明する。

10-5-1.固定効果モデルと変量効果モデル:統計理論に則した分類

いったんパネル推定の基本的なモデルに立ち返ろう。

tjtjtj xbay ,,, ε+⋅+= where tjjtj ,, ηαε += (10-39)

ただし、 ( ) 0, =tjE η , ( ) 2, ηση =tjVar , ( ) 0, ,, =tksjCov ηη , 0),( , =tjjCov ηα

ここで、個体共通の誤差項(η)と説明変数(x)は無相関とする。

0)( ,, =⋅ tjtjxE η (10-40)

Page 26: 第 章. パネルデータによる計量分析の基礎 · PDF file45 Baltagi(2005)“Econometric Analysis of Panel Data” (Third Edition),“1.2 Why Should We Use Panel

第 10 章. パネルデータによる計量分析の基礎

207

ところで、第 5章の 5-1 節で述べたように、誤差項と説明変数の間に相関があるとき、OLS

推定量は不偏性も一致性もみたさない。これは(10-39)式において、

0)( ,, ≠⋅ tjtjxE ε (10-41)

となるケースである。(10-40)式の仮定のもとでは、これは以下と同値である

0)( , ≠⋅ jtjxE α (10-42)

つまり、説明変数と個別効果に相関があるケースでは、(10-39)式の OLS 推定値は一致性を

もたない。ところで、変量効果モデルは(10-39)式を GLS(一般化最小二乗法)で推定する

手法であった。具体的には、(10-26)式を満たす行列 Pを(10-39)式の全ての変数に左から

乗じたうえで、その変数変換後の式を OLS 推定する。

εPPXbPy += ⇒ *** ε+= bXy (10-27:再掲)

(10-41)式でxとεに非ゼロの同じ数を乗じても関係は変わらない。よって、説明変数と

個別効果に相関がある場合には、変量効果モデルの GLS 推定値もやはり一致性を満たさない。

他方、固定効果モデルの場合、個別効果(αj)を定数項ダミーとみなして OLS 推定を行う。

tjtj

N

itjitj xbiday ,,

2,, )( ηα +⋅+⋅+= ∑

=

(10-14:再掲)

仮定(10-40)より、固定効果モデルでは説明変数(x)と誤差項(η)には相関はない。

よって、固定効果モデルの OLS 推定量は一致性を満たす。55 これまでの議論は以下のように

まとめられる。

【まとめ 1】

0)( , ≠⋅ jtjxE α となるとき、

①固定効果モデルの OLS 推定量は一致性を満たす。

②変量効果モデルの GLS 推定量は一致性を満たさない。

⇒ 説明変数と個別効果に相関がある場合、固定効果モデルを採択すべきである。

55 もともとxj,tと相関のある αjを説明変数に付加することで、多重共線性の発生を懸念する読者がいるかもしれない。

しかし、多重共線性が問題となるのは、分散拡大要因(VIF)などの尺度で評価して説明変数間の相関が十分に高いと

きだけである(第 4 章を参照)。そもそも多重共線性は統計理論の問題ではなく、あくまでも標本の問題である。ゆえ

にここでは多重共線性の問題は無視してよい。

Page 27: 第 章. パネルデータによる計量分析の基礎 · PDF file45 Baltagi(2005)“Econometric Analysis of Panel Data” (Third Edition),“1.2 Why Should We Use Panel

第 10 章. パネルデータによる計量分析の基礎

208

次に、説明変数と個別効果が相関していないケースについて考えよう。すなわち、

0)( , =⋅ jtjxE α (10-43)

となるケースである。このとき(10-40)式と(10-43)式をあわせると明らかに、

0)( ,, =⋅ tjtjxE ε (10-44)

である。したがって、固定効果モデルと変量効果モデルのどちらを採用しても、少なくと

も一致性のある推定量が得られる。よって、これだけではモデルの優劣が判断できない。

ここで、個別効果の確率分布について考える。(10-39)式の誤差項(ε)の分散・共分

散行列を(10-24)式、(10-25)式のように与える。

Σ

ΣΣ

L

MMMM

L

L

000

000000

(Ωは(N・T×N・T)行列)

where

+

++

22222

22222

22222

αηααα

αααηα

ααααη

σσσσσ

σσσσσσσσσσ

L

MMMM

L

L

(Σは(T×T)行列) (10-45)

このような不均一分散が発生している状況において、(10-14)式のような固定効果モデ

ルを推定することを考えよう。定数項ダミーはあくまでも確定変数であるから、この場合

には(10-45)式で示される誤差項の不均一分散が放置されたままパラメータが OLS 推定さ

れる。しかし、第 3章の 3-1 節で述べたように、誤差項に不均一分散があるときの OLS 推

定量は最小分散推定量とはならない。他方、変量効果モデルでは(10-27)式のように誤差

項の不均一分散を考慮した GLS 推定がなされる。このとき GLS 推定量は(漸近的に)最小

分散推定量となる。以上の議論をまとめると、

【まとめ 2】

0)( , =⋅ jtjxE α となるとき、

①固定効果モデルの OLS 推定量は一致性を満たすが、最小分散推定量ではない。

②変量効果モデルの GLS 推定量は一致性を満たし、かつ(漸近的に)最小分散

推定量となる。

⇒ 説明変数と個別効果に相関がない場合、変量効果モデルを採択すべきである。

Page 28: 第 章. パネルデータによる計量分析の基礎 · PDF file45 Baltagi(2005)“Econometric Analysis of Panel Data” (Third Edition),“1.2 Why Should We Use Panel

第 10 章. パネルデータによる計量分析の基礎

209

「まとめ1」及び「まとめ2」より、説明変数と個別効果の相関の有無を検定できれば、

その結果に応じて固定効果モデルと変量効果モデルを選択することが可能になる。

10-5-2.Wu-Hausman 検定

Wu-Hausman 検定は、個別効果と説明変数の直交性(つまり、相関がないかどうか)を Wald

検定によって仮説検定する手法である。ただし、(10-39)式における説明変数(xj,t)と

個別効果(αj)の関係を直接的に検定するのではなく、10-5-1 節の「まとめ 1」と「まと

め 2」をもとに、固定効果モデルの OLS 推定量と変量効果モデルの GLS 推定量の差に関す

る仮説検定を行う。

1)Wald 検定

J 個の確率変数(x1,x2,・・・,xj)から構成されるベクトル xが以下の正規分布にしたがって

いるとする。

X ~ [ ]Σ,µN (10-46)

このとき、以下の二次形式Wは自由度 Jのカイ二乗分布に従うことが知られている。

( ) ( )µµ −Σ′−= − XXW 1 ~ )(2 Jχ (10-47)

ベクトル表記に慣れていない場合、以下の 1変数のケースをイメージすると良いだろう。

( )2

2

σµ−

=′xW ~ )1(2χ (10-48)

Wald 検定ではこの関係を利用して仮説検定が行われる。例えば、ある変数 Q が(10-46)の

ような平均・分散をもつ正規分布に従うか否かを検定したいとしよう。このときの検定統計量

は以下のようになる。

( ) ( )µµ −Σ′−= − QQW 1 もしくは 1変数では、( )

2

2

σµ−

=′qW

変数 Qの値がμから離れるほど検定統計量は大きくなり、「帰無仮説:(10-46)のような平均・

分散をもつ正規分布に従う」が棄却されやすくなる。

Wald 検定は大標本検定である。大標本検定の理論は本書の範囲を超えるのでその解説を

W.H.Greene(2000)“Econometric Analysis(Fourth Edition)”(Prentice Hall)の第 9章(一

部については第 4 章)に譲るが、極めて単純に言えば、問題となる確率分布が大標本の世界で

Page 29: 第 章. パネルデータによる計量分析の基礎 · PDF file45 Baltagi(2005)“Econometric Analysis of Panel Data” (Third Edition),“1.2 Why Should We Use Panel

第 10 章. パネルデータによる計量分析の基礎

210

近似されたもとでのみ適用できる仮説検定である。

2)Wu-Hausman 検定

OLS 推定量や GLS 推定量が一致性をみたすケースでは、それぞれの推定量の漸近分布を定義

できるので Wald 検定が適用可能になる。したがって、Wu-Hausman 検定では「まとめ 2」のよう

に「説明変数と個別効果に相関がない」が帰無仮説となる。

いま固定効果モデルの OLS 推定量をbOLS、変量効果モデルの GLS 推定量をbGLS とする。

Wu-Hausman 検定において(10-46)式の xに対応するのは、“bOLS-bGLS”である。「帰無仮説:

説明変数と個別効果に相関がない」が正しいとすれば、「まとめ 2」より両者はともに一致性を

みたす。よって、大標本の世界では両者に差が生じないはずである。すなわち、

[ ] 0=− GLSOLS bbE (10-49)

他方“bOLS-bGLS”の分散は以下のようになる。

[ ] [ ] [ ] [ ] [ ]′−−+=− GLSOLSGLSOLSGLSOLSGLSOLS bbCovbbCovbVarbVarbbVar ,, (10-50)

共分散の符号条件がわからないこともあり、“bOLS-bGLS”の分散の大きさについては

(10-50)式の定式化のままでは何ら判断することができない。

ところで、Hausman の重要な発見によれば「最小分散推定量とそうではない推定量の差は、

最小分散推定量自体とは無相関」である。ここで「まとめ 2」を思い出してほしい。「帰無仮

説:説明変数と個別効果に相関がない」が正しいとすれば、bGLSは(漸近的に)最小分散推

定量だが、bOLS は最小分散推定量ではない。よって、“bOLS-bGLS”はbGLS とは無相関であ

る。すなわち、

[ ] [ ] [ ] 0,),( =−=− GLSGLSOLSGLSGLSOLS bVarbbCovbbbCov

⇒ [ ] [ ]GLSGLSOLS bVarbbCov =, (10-51)

この Hausman の発見が重要なのは、(10-50)式を有益なかたちに変形できるからだ。(10-51)

式を(10-50)式に代入すると、以下のように各々の分散の差として表記できる。

[ ] [ ] [ ]GLSOLSGLSOLS bVarbVarbbVar −=− (10-52)

これが(10-46)式のΣに相当する。繰り返しとなるが、「まとめ 2」より「帰無仮説:説

明変数と個別効果に相関がない」が正しいとすれば、bGLSは(漸近的に)最小分散推定量だ

が、bOLSは最小分散推定量ではない。よって、(10-52)式においては、bGLSが相対的により

Page 30: 第 章. パネルデータによる計量分析の基礎 · PDF file45 Baltagi(2005)“Econometric Analysis of Panel Data” (Third Edition),“1.2 Why Should We Use Panel

第 10 章. パネルデータによる計量分析の基礎

211

効率的に推計されているほど、bOLSの分散とbGLSの分散の差が大きくなるはずだ。

最終的に Hausman 統計量は、

[ ] [ ] [ ][ ] [ ]0)(0)( 1 −−−′−−= −GLSOLSGLSOLSGLSOLS bbbVarbVarbbW

[ ] [ ] [ ][ ] [ ]GLSOLSGLSOLSGLSOLS bbbVarbVarbb −−′−= −1 ~ )(2 kχ (10-53)

となる。ここでkは説明変数の数(除:定数項)である。ベクトル表記に慣れていない場合、

以下の 1変数のケースをイメージすると良いだろう。

22

2)(GLSOLS

GLSOLS bbWσσ −

−=′ (10-54)

これまでの議論より、「帰無仮説:説明変数と個別効果に相関がない」が正しければ、大標本

の世界において

1)“bOLS-bGLS”はゼロに近いはず。

2)“Var(bOLS)-Var(bGLS)”は非負であり、bGLSが効率的であるほど大きくなる。

となるから、このとき Wは小さな値をとる。よって、Wが十分に小さい場合には、「まとめ 2」

に従って変量効果モデルを採択すればよい。逆に、Wが大きい場合には、1)と 2)のどちら

か、ないしは両方が満たされていない。これは「説明変数と個別効果に相関がない」という

そもそもの前提が誤っていることを意味する。ゆえに、「まとめ 1」に従って固定効果モデル

を採択すればよい。ここで W の大小の判断はカイ二乗統計量の棄却域に従えばよい。なお、

E-Views では簡単な手順で Wu-Hausman 検定を行うことができる。

Q10-7 (保存 Workfile 名:Q10-7.wf1)

Q10-1 で読みこんだパネルデータで以下の消費関数を推計せよ。ただし、モデルの選択は

Wu-Hausman 検定によって行うこと。

CP95it = α + β・YY95it +γ・(DEPOit/P95it)+εit where ε=αi+uit

なお、都道府県別預金残高(DEPOit)は 1998 年度以降しか収録されていない。よって、サ

ンプル数が変化することに注意されたい。

⇒ 操作手順は以下のとおり (解答例は巻末[P321]に掲載されている)

Page 31: 第 章. パネルデータによる計量分析の基礎 · PDF file45 Baltagi(2005)“Econometric Analysis of Panel Data” (Third Edition),“1.2 Why Should We Use Panel

第 10 章. パネルデータによる計量分析の基礎

212

【作業手順】

※ E-ViewsでWu-Hausman検定を実施する場合、まず変量効果モデルを推計する必要がある。

① Workfile ウィンドウから“Object → New Object → Equation”とすすみ、

“Specification”タブの“ Equation Specification”欄に以下のように入力する。

⇒ CP95 C YY95 DEPO/P95

②“Panel Option”タブにすすみ、“Effects Specification”欄で以下を選択する、

・Cross-section ⇒ Random ・Period ⇒ None

③“OK”を押す。

④ 推計結果のウィンドウから“View → Fixed/Random Effects Testing”とすすみ、

“Correlated Random Effects ‐ Hausman Test”を選ぶ。

⇒ Wald 統計量は「個別効果は変量効果である」という帰無仮説のもとで、自由度を説明

変数(除:定数項)とするカイ二乗分布に従う。この実習問題では自由度は 2である。p

値(有意確率:帰無仮説が正しい確率)が 0.05 ないし 0.10 未満であれば帰無仮説が棄

却され、「個別効果は固定効果である」とみなされる。