固定/ランダム効果モデルの背後にある概念


14
  1. 誰かが固定/ランダム効果モデルを理解するのを手伝ってくれますか?これらの概念を消化した場合は、独自の方法で説明するか、特定のアドレス(ページ番号、章など)でリソース(書籍、メモ、Webサイト)に移動して、混乱なく学習できるようにします。
  2. これは本当ですか:「一般に固定効果があり、ランダム効果は特定のケースです」?説明が一般的なモデルから固定およびランダムな効果のある特定のモデルに移行する場合に特に助けていただければ幸いです


混合モデルタグに関する書籍のリファレンスを参照してください。数1は、私が読んだすべてのマルチレベルモデリングブックの(一部の)入門章で説明されています。
アンディW

回答:


13

これは、統計学の文献(書籍、教師など)に切り替えるときに学生を混乱させる計量経済学の命名法の問題に触れるため、大きな疑問のようです。http://www.amazon.com/Econometric-Analysis-Cross-Section-Panel/dp/0262232197 10章をお勧めします。

関心のある変数が2つの次元(たとえば、個人と時間)で観測され、観測された特性x i tと観測されていない特性u i tに依存すると仮定します。場合のy I tが観測された賃金いるし、我々はそれが観測された(教育)と観測されないスキル(才能、など)によって決定されますと主張していることがあります。しかし、観察されていないスキルが教育レベルと相関している可能性があることは明らかです。したがって、それはエラー分解につながります: u i t = e i t + v i ここでv iyitxituityitあなたはt=et+vvは、と相関していると想定されるエラー(ランダム)コンポーネントです。すなわち、v iは、個人の観察されていないスキルをランダムな個人コンポーネントとしてモデル化します。バツv

したがって、モデルは次のようになります。

yt=jθjバツj+et+v

このモデルは通常、FEモデルとしてラベル付けされているが、Wooldridge、それが賢明であろう主張としてそれを呼び出すために相関誤差成分とREモデル場合に対し、に相関されていないX ' sは、それがREモデルとなります。したがって、これは2番目の質問に答えます。FEセットアップは、v ix ' sの間の相関を可能にするため、より一般的です。vバツsvバツs

計量経済学の古い本は、FEを個々の特定の定数を持つモデルに言及する傾向がありますが、残念ながらこれは今日の文献にまだ存在しています(統計では、このような混乱はなかったと思います。間違いなく、潜在的な誤解の問題を発展させるWooldridge講義をお勧めします)


(1)へのリンクのおかげで優れた資源及び(2)の素敵な説明
スタット-R

1
これは、これらのアイデアを説明するのに私が見慣れているものとは異なる方法ですが、本当にうまくできています。+1
グン-モニカの復職

15

モデルにおけるランダム効果の私の最良の例は、臨床試験研究から来ています。臨床試験では、さまざまな病院(サイトと呼ばれる)から患者を登録します。サイトは、多数の潜在的なサイトから選択されます。治療への反応に影響を与える部位に関連する要因があります。そのため、線形モデルでは、主な効果としてサイトを含めることがよくあります。

しかし、固定効果としてサイトを持つことは適切ですか?通常、私たちはそうしません。トライアルのために選択したサイトは、選択できる可能性のあるサイトからのランダムなサンプルと考えることができます。これはまったく当てはまらないかもしれませんが、サイトの効果が固定されていると仮定するよりも、より合理的な仮定である可能性があります。したがって、サイトをランダム効果として扱うと、Nサイトを含む母集団からkサイトのセットを選択することによるサイト効果の変動を組み込むことができます。

一般的な考え方は、グループは固定されていないが、より大きな母集団から選択され、グループの他の選択が可能であり、異なる結果につながっていたということです。そのため、これをランダム効果として扱うと、固定効果からは得られないような種類の変動性がモデルに組み込まれます。


@ocramリファレンスは非常に興味深いものです。FE定義に関する不均一性を指摘しています。しかし、Stat-Rはどの定義を参照していますか?彼の2番目の質問は、FEが相関ランダム成分を持つREと見なされることを示唆しています。その定義の下で、あなたの例の中で、FEは治療が観察されない(または模倣された)部位効果と相関する可能性があることを意味するでしょう?
JDav

2
ニース-あなたの最後の段落はそれを置く非常に簡潔な方法です。+1
ルーク

1
@MichaelChernick:いい例です。そのため、病院のサイトは固定効果としてではなく、ランダムなものとして扱われるべきだと主張します。しかし、これら2つのオプションの結果の実際の違いは何でしょうか?固定として扱う場合、各病院の回帰係数を取得し、たとえば病院の主な効果が重要かどうかをテストできます。ランダムに扱う場合、各病院の回帰係数は得られません(正しい?)。病院の主な効果をまだテストできますか?さらに重要なことは、モデル内の他の主な効果/相互作用の力を増加/減少させる可能性がありますか?
アメーバは、モニカを復活させる14

12
  1. 本についてはわかりませんが、ここに例があります。長期間にわたる赤ちゃんの大規模なコホートからの出生時体重のサンプルがあるとします。同じ女性から生まれた赤ちゃんの体重は、異なる母親から生まれた赤ちゃんの体重よりも似ています。男の子は女の子よりも重いです。

したがって、同じ母親から生まれた赤ちゃんの体重の相関を無視した固定効果モデルは次のとおりです。

モデル1.平均出生時体重=切片+性別

このような相関を調整する別の固定効果モデルは次のとおりです。

モデル2.平均出生時体重=切片+性別+ mother_id

ただし、まず、特定の母親ごとの影響に関心がない場合があります。また、私たちは母親をすべての母親の母集団からランダムな母親と見なします。したがって、性別の固定効果と母親のランダム効果(ランダムインターセプト)を持つ混合モデルを構築します。

モデル3:平均出生時体重=切片+性別+ u

このuは、モデル2の場合と同様に、母親ごとに異なりますが、実際には推定されません。むしろ、その分散のみが推定されます。この分散推定により、母親による重みのクラスタリングのレベルに関するアイデアが得られます。

それがいくらか理にかなっていることを願っています。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.