【統計】時系列分析(パネルデータ分析)

パネルデータ分析のメモ。

【目次】

クロスセクション、時系列、パネルデータの違い


クロスセクションデータ(Cross Section Data)
 特定時点・複数変数のデータ。時間軸が無い。

時系列データ(Time Series Data)
 単一変数の経時的なデータ。

パネルデータ(Panel Data)
 複数変数の経時的なデータ。クロスセクションデータ&時系列データ。



固定効果モデルと変量効果モデル


パネルデータに関する回帰モデルを次の通り表す。

  y_{i,t}=\alpha + \beta X_{i,t} + u_{i,t}
  u_{i,t}=\mu_{i} + \gamma_{i,t}

  i:個体, t:時期, u_{i,t}:誤差項
  X_{i,t}:説明変数, \mu_{i}:個別効果(Individual Effect), \gamma_{i,t}:ランダム誤差

誤差項は「個別効果 \mu_{i} +ランダム誤差  \gamma_{i,t} 」で構成されると考える。
ここで、個別効果 \mu_{i} の相関の考えにて、固定効果モデルと変量効果モデルの2つのモデルがある。

固定効果モデル(Fixed Effect Model)
 個別効果 \mu_{i} と説明変数  X_{i,t} が相関する(内生性(Endogeneity)を持つ)と仮定する。
 個別効果 \mu_{i} は未知の定数。
  ⇒「未知の定数」の仮定のため、階差や個体ごとの時間平均を使って除去できる。

変量効果モデル(Random Effect Model)
 個別効果 \mu_{i} と説明変数  X_{i,t} は相関しない(独立である)と仮定する。
 個別効果 \mu_{i} は未知の独立な確率変数。
  ⇒現実的には、個別効果 \mu_{i} と説明変数  X_{i,t} が相関しないとは考えづらい。


ハウスマン検定


説明変数と誤差項の検定としてハウスマン検定がある。
帰無仮説が棄却されれば「固定効果モデル」、棄却できなければ「変量効果モデル」を採択する。問題点もあるようで今は使われない?

ハウスマン検定
 帰無仮説:固別効果と誤差項が独立である(相関しない)
 対立仮設:固別効果と誤差項が独立ではない(相関する)


プログラムコード


library(plm)
 
#-- 固定効果モデルの推定
fit1 <- plm(y ~ x1 + x2, data=ADS, model="within")
summary(fit1)
 
#-- 変量効果モデルの推定
fit2 <- plm(y ~ x1 + x2, data=ADS, model="random")
summary(fit2)
 
#--ハウスマン検定
phtest(fit1, fit2)
proc panel data=ADS ;
    id state date ;
    model y = x1 x2 s;
run;

参考


統計学(出版:東京図書), 日本統計学会編
https://www.jil.go.jp/institute/zassi/backnumber/2015/04/pdf/006-009.pdf
SAS/ETS(R) 9.3 User's Guide

本ブログは個人メモです。 本ブログの内容によって生じた損害等の一切の責任を負いかねますのでご了承ください。