パネルデータと混合モデルの違い


14

パネルデータ分析と混合モデル分析の違いを知りたいです。私の知る限り、パネルデータと混合モデルはどちらも固定効果とランダム効果を使用しています。もしそうなら、なぜ彼らは異なる名前を持っていますか?それとも同義語ですか?

固定効果、ランダム効果、混合効果の定義を説明する次の投稿を読みましたが、私の質問に正確には答えていません:固定効果モデル、ランダム効果モデル、混合効果モデルの違いは何ですか?

また、混合モデル分析に関する簡単な(約200ページ)参照を誰かが私に紹介してくれた場合もありがたいです。付け加えると、ソフトウェアの扱いに関係なく、混合モデリングのリファレンスを好むでしょう。混合モデリングの主に理論的な説明。



回答:


22

パネルデータと混合効果モデルデータの両方は、二重インデックス付きランダム変数扱います。最初のインデックスはグループ用で、2番目はグループ内の個人用です。パネルデータの場合、通常、2番目のインデックスは時間であり、時間をかけて個人を観察することを前提としています。混合効果モデルの時間が2番目のインデックスである場合、モデルは縦モデルと呼ばれます。混合効果モデルは、2レベルの回帰に関して最もよく理解されます。(説明を簡単にするために、説明変数を1つだけと仮定します)yij

最初のレベルの回帰は次のとおりです

yij=αi+xijβi+εij.

これは、各グループの個別の回帰として簡単に説明されています。第2レベルの回帰では、回帰係数の変動を説明しようとします。

β I = δ 0 + Z I 2 δ 1 + VのI

αi=γ0+zi1γ1+ui
βi=δ0+zi2δ1+vi

2番目の方程式を最初の方程式に代入すると、

yj=γ0+z1γ1+バツjδ0+バツjz2δ1+あなたは+バツjv+εj

固定効果が固定されているものです、この手段は、。ランダム効果はu iおよびγ0γ1δ0δ1あなたはです。v

パネルデータの用語は変わりましたが、共通点を見つけることができます。パネルデータのランダム効果モデルは、混合効果モデルと同じです。

β I = δ 0

α=γ0+あなたは
β=δ0

モデルになると

yt=γ0+バツtδ0+あなたは+εt

ここで、は変量効果です。あなたは

混合効果モデルとパネルデータモデルの最も重要な違いは、リグレッサーx i jの取り扱いです。バツj。混合効果モデルの場合、それらは非ランダム変数です。一方、パネルデータモデルの場合、それらは常にランダムであると想定されます。これは、パネルデータの固定効果モデルとは何かを述べるときに重要になります。

あなたはviεijxijzixijzixijxitui

yit=γ0+xitδ0+ui+εit,

xituiδ0

yity¯i.=(xitx¯i.)δ0+εitε¯i.,

uiが固定パラメーターます。したがって、名前は固定効果モデルです。

パネルデータ計量経済学における固定効果とランダム効果の用語の背後には多くの歴史がありますが、私は省略しました。私の意見では、これらのモデルはWooldridgeの「断面およびパネルデータの計量分析」で最もよく説明されています。私が知る限り、混合効果モデルにはそのような歴史はありませんが、一方で私は計量経済学の背景から来ているので、私は間違っているかもしれません。


...+xijvi+ui+εij

この説明は素晴らしいです!このような素晴らしい説明をしてくれたすべての努力に感謝します。2レベル回帰とはどういう意味ですか?
ベータ

2
@Ari、第2レベルの回帰は、第1レベルの回帰の回帰係数の回帰です。第1レベルの回帰はグループ内の変動を説明しようとしますが、第2レベルの回帰はグループ間の変動を説明しようとします。この区分は人為的ですが、少なくとも私にとっては自然に感じるので好きです。このタイプの分割は、階層型ベイズモデルでも使用されます。
mpiktas

δ0

3

ソフトウェアパッケージを参照せずに混合モデリング理論を説明するテキストを探していることを理解しています。

マルチレベル分析をお勧めします。基本および高度なマルチレベルモデリングの概要トム・スナイダースとロエル・ボスカーによる概要、約250ppのます。最後にソフトウェアに関する章があります(現在は少し時代遅れになっています)が、残りは非常に親しみやすい理論です。

ただし、Sophia Rabe-HeskethとAnders SkrondalによるStataを使用したマルチレベルおよび縦断モデルに関する上記の推奨事項に同意する必要があります。この本は非常に理論的なものであり、ソフトウェアコンポーネントは実質的なテキストへの素晴らしい追加にすぎません。私は通常Stataを使用せず、テキストを机の上に置いており、非常によく書かれていると感じています。ただし、200ppよりもはるかに長くなります。

以下のテキストはすべて、この分野の現在の専門家によって書かれたものであり、これらの手法についての詳細情報が必要な場合に役立ちます(ただし、これらは特にあなたの要求に適合しません):[私は新しいため、これらにリンクできませんユーザー、ごめんなさい]

Hoox、Joop(2010)。マルチレベル分析、手法、およびアプリケーション。

Gelman、A.、およびHill、J.(2006)回帰およびマルチレベル/階層モデルを使用したデータ分析。

Singer、J.(2003)縦断的データ分析の応用:モデリングの変化とイベント発生

Raudenbush、SW、およびBryk、A.、S。(2002)。階層線形モデル:アプリケーションとデータ分析方法

ルーク、ダグラス、(2004)。マルチレベルモデリング

また、上記のWooldridgeのテキストとRのテキストを2つ目にします。Bristol University Center for Multilevel Modelingには、多数のチュートリアルと情報があります


Playitagainに感謝します!これは非常に役立つ情報です。名前も面白いです:)
ベータ

2

私も両方の違いについて疑問に思っており、最近このトピックに関するリファレンスを見つけました。「パネルデータ」は、定期的に調査される人々の断面またはグループを表すデータセットの伝統的な名前であることを理解しています指定された期間」。したがって、「パネル」はデータセット内のグループ構造であり、このタイプのデータを分析する最も自然な方法は、混合モデリングアプローチによるものです。

混合効果モデリングに関する参考資料(Rを「話す」かどうかに関係なく)は、Douglas Batesによる(?)近刊の本(lme4:Rによる混合効果モデリング)のドラフトです。


1
参考にしてくれてありがとう!しかし、問題はまだ残っています。
ベータ


1

Stataを使用する場合、Sophia Rabe-HeskethとAnders SkrondalのStataを使用したマルチレベルおよび縦断モデルが適切な選択です。正確に何に興味を持っているかにもよりますが、200ページで十分でしょう。


参照してくれたDimitriyに感謝します。しかし、残念ながら私はSTATAを使用しません。私は主にSASを使用しますが、Rも使用します。
ベータ

2
wiley.com/WileyCDA/WileyTitle/productCd-0470073713.htmlについて良いことを聞いたことがありますが、自分で読んでいません。
Dimitriy V. Masterov

ありがとう、Dimitriy!これは本当に有望に見えます。ゴーグルではなく質問をすることの利点は、本当に良い結果が得られることです:)
ベータ

1

私の経験では、「パネル計量経済学」を使用する理論的根拠は、パネルの「固定効果」推定量を使用して、さまざまな形式の省略された変数バイアスを制御できることです。

ただし、Mundlakタイプのアプローチを使用してマルチレベルモデル内でこのタイプの推定を実行すること、つまり、追加のリグレッサーとしてグループ平均を含めることは可能です。このアプローチは、誤差項と潜在的なグループレベル省略因子との相関関係を取り除き、「内」係数を明らかにします。しかし、私には未知の理由で、これは通常、応用研究では行われません。これらのスライドとこのドキュメントでは、詳細を説明します。


(+1)社会学者はしばしばグループの意味を文脈効果として解釈します(ただし、これは時系列パネルデータよりもネストされた断面データの方が頻繁です)。関連するノートのManski(1993)ここのPDF を読む必要があります。そのような文脈効果が頻繁に特定されないことを示す記事があります。「これが行われない理由」については、社会科学の実践と何でも同じくらい違いがあると思うので、尋ねるのは良い質問かもしれません。
アンディW
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.