パネルデータ分析のメモ。
【目次】
クロスセクション、時系列、パネルデータの違い
クロスセクションデータ(Cross Section Data)
特定時点・複数変数のデータ。時間軸が無い。
時系列データ(Time Series Data)
単一変数の経時的なデータ。
パネルデータ(Panel Data)
複数変数の経時的なデータ。クロスセクションデータ&時系列データ。
固定効果モデルと変量効果モデル
パネルデータに関する回帰モデルを次の通り表す。
:個体,:時期,:誤差項
:説明変数,:個別効果(Individual Effect),:ランダム誤差
ここで、個別効果 の相関の考えにて、固定効果モデルと変量効果モデルの2つのモデルがある。
固定効果モデル(Fixed Effect Model)
個別効果 と説明変数 が相関する(内生性(Endogeneity)を持つ)と仮定する。
個別効果 は未知の定数。
⇒「未知の定数」の仮定のため、階差や個体ごとの時間平均を使って除去できる。
変量効果モデル(Random Effect Model)
個別効果 と説明変数 は相関しない(独立である)と仮定する。
個別効果 は未知の独立な確率変数。
⇒現実的には、個別効果 と説明変数 が相関しないとは考えづらい。
ハウスマン検定
説明変数と誤差項の検定としてハウスマン検定がある。
帰無仮説が棄却されれば「固定効果モデル」、棄却できなければ「変量効果モデル」を採択する。問題点もあるようで今は使われない?
ハウスマン検定
帰無仮説:固別効果と誤差項が独立である(相関しない)
対立仮設:固別効果と誤差項が独立ではない(相関する)
帰無仮説が棄却されれば「固定効果モデル」、棄却できなければ「変量効果モデル」を採択する。問題点もあるようで今は使われない?
ハウスマン検定
帰無仮説:固別効果と誤差項が独立である(相関しない)
対立仮設:固別効果と誤差項が独立ではない(相関する)
プログラムコード
library(plm) #-- 固定効果モデルの推定 fit1 <- plm(y ~ x1 + x2, data=ADS, model="within") summary(fit1) #-- 変量効果モデルの推定 fit2 <- plm(y ~ x1 + x2, data=ADS, model="random") summary(fit2) #--ハウスマン検定 phtest(fit1, fit2)
proc panel data=ADS ; id state date ; model y = x1 x2 s; run;
参考
統計学(出版:東京図書), 日本統計学会編
https://www.jil.go.jp/institute/zassi/backnumber/2015/04/pdf/006-009.pdf
SAS/ETS(R) 9.3 User's Guide