パネルデータ分析

提供: miniwiki
2018/8/19/ (日) 17:21時点におけるAdmin (トーク | 投稿記録)による版 (1版 をインポートしました)
(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)
移動先:案内検索

パネル・データ: panel data)とは、統計学計量経済学等において使用される用語である。時系列データとクロスセクションデータを合わせたデータであり、観察単位を同一の個人、地域、事業所など、複数期間において観察したものである。

パネルデータの例

balanced panel: unbalanced panel:
[math]\begin{matrix} \mathrm{person} & \mathrm{year} & \mathrm{income} & \mathrm{age} & \mathrm{sex}\\ 1 & 2003 & 1500 & 27 & 1 \\ 1 & 2004 & 1700 & 28 & 1 \\ 1 & 2005 & 2000 & 29 & 1 \\ 2 & 2003 & 2100 & 41 & 2 \\ 2 & 2004 & 2100 & 42 & 2 \\ 2 & 2005 & 2200 & 43 & 2 \end{matrix}[/math] [math]\begin{matrix} \mathrm{person} & \mathrm{year} & \mathrm{income} & \mathrm{age} & \mathrm{sex}\\ 1 & 2003 & 1500 & 27 & 1 \\ 1 & 2004 & 1700 & 28 & 1 \\ 2 & 2003 & 2100 & 41 & 2 \\ 2 & 2004 & 2100 & 42 & 2 \\ 2 & 2005 & 2200 & 43 & 2 \\ 3 & 2004 & 3000 & 35 & 1 \end{matrix}[/math]

上記の例では、個人間のクロスセクション・データと期間ごとの時系列データからなる2つの例が示されている。ここでは、個人の特徴が所得(income)・年齢(age)・性別(sex)で示されている。左側の例での個人1と個人2については、データ期間が2003年・ 2004年・2005年の3期間示されており、これをバランスド・パネルと呼ぶ。一方、右側は、個人2のみ2003年・ 2004年・2005年の3期間のデータ含まれるものの、個人1は2003年・ 2004年の2期間、個人3は2004年の1期間のみであり、アンバランスド・パネルと呼ばれる。

パネルデータを用いた回帰分析

パネルデータは以下のような形式をとる。

[math]X_{it}, \; i = 1, \dots, N \; t = 1, \dots, T, [/math]

ここで、[math]i[/math] は各個人を示し、そして、 [math]t[/math] は期間を示す。

パネル・データを用いた回帰分析は一般的に以下のように示すことができる。

[math]y_{it} = \alpha + \beta' X_{it} + u_{it}.[/math]

この式の通り、誤差項[math]u_{it}[/math]が、[math]\mu_i[/math] と [math]\nu_{it}[/math] に分離されていることがパネル・データ分析の特質の1つである。

これは主に 固定効果モデルランダム効果モデルと呼ばれるモデルにてパラメータを推定する。

固定効果モデルは、

[math]y_{it} = \alpha + \beta' X_{it} + u_{it}, [/math]
[math]u_{it} = \mu_i + \nu_{it}.[/math]

であり、[math]\mu_i[/math] は個人に特有であり、時間を通じて変化しない一定な効果(例えば、クロスカントリー比較でのパネルデータであれば、地理的条件や気候など)である。

これに加えて、ランダム効果モデルとは、

[math]\mu_i \sim \text{i.i.d.} N(0, \sigma^2_{\mu})[/math]

そして、

[math]\nu_{it} \sim \text{i.i.d.} N(0, \sigma^2_{\nu}),[/math]

となり、即ち、 誤差項の構成要素が互いに独立であることを意味する。

参考文献

関連項目

外部リンク


テンプレート:Statistics-stub