パネルデータ分析のメモ。

【目次】

クロスセクション、時系列、パネルデータの違い

クロスセクションデータ（Cross Section Data）
　特定時点・複数変数のデータ。時間軸が無い。

時系列データ（Time Series Data）
　単一変数の経時的なデータ。

パネルデータ（Panel Data）
　複数変数の経時的なデータ。クロスセクションデータ＆時系列データ。

固定効果モデルと変量効果モデル

パネルデータに関する回帰モデルを次の通り表す。

　 $y_{i,t}=\alpha + \beta X_{i,t} + u_{i,t}$
　 $u_{i,t}=\mu_{i} + \gamma_{i,t}$

　 $i$ ：個体， $t$ ：時期， $u_{i,t}$ ：誤差項
　 $X_{i,t}$ ：説明変数， $\mu_{i}$ ：個別効果（Individual Effect）， $\gamma_{i,t}$ ：ランダム誤差

誤差項は「個別効果 $\mu_{i}$ ＋ランダム誤差 $\gamma_{i,t}$ 」で構成されると考える。
ここで、個別効果 $\mu_{i}$ の相関の考えにて、固定効果モデルと変量効果モデルの２つのモデルがある。

固定効果モデル（Fixed Effect Model）
　個別効果 $\mu_{i}$ と説明変数 $X_{i,t}$ が相関する（内生性（Endogeneity）を持つ）と仮定する。
　個別効果 $\mu_{i}$ は未知の定数。
　　⇒「未知の定数」の仮定のため、階差や個体ごとの時間平均を使って除去できる。

変量効果モデル（Random Effect Model）
　個別効果 $\mu_{i}$ と説明変数 $X_{i,t}$ は相関しない（独立である）と仮定する。
　個別効果 $\mu_{i}$ は未知の独立な確率変数。
　　⇒現実的には、個別効果 $\mu_{i}$ と説明変数 $X_{i,t}$ が相関しないとは考えづらい。

ハウスマン検定

説明変数と誤差項の検定としてハウスマン検定がある。
帰無仮説が棄却されれば「固定効果モデル」、棄却できなければ「変量効果モデル」を採択する。問題点もあるようで今は使われない？

ハウスマン検定
　帰無仮説：固別効果と誤差項が独立である（相関しない）
　対立仮設：固別効果と誤差項が独立ではない（相関する）

プログラムコード

library(plm)
 
#-- 固定効果モデルの推定
fit1 <- plm(y ~ x1 + x2, data=ADS, model="within")
summary(fit1)
 
#-- 変量効果モデルの推定
fit2 <- plm(y ~ x1 + x2, data=ADS, model="random")
summary(fit2)
 
#--ハウスマン検定
phtest(fit1, fit2)

proc panel data=ADS ;
    id state date ;
    model y = x1 x2 s;
run;

参考

統計学（出版：東京図書）, 日本統計学会編
https://www.jil.go.jp/institute/zassi/backnumber/2015/04/pdf/006-009.pdf
SAS/ETS(R) 9.3 User's Guide

こちにぃるの日記

【統計】時系列分析（パネルデータ分析）

クロスセクション、時系列、パネルデータの違い

固定効果モデルと変量効果モデル

ハウスマン検定

プログラムコード

参考