統計の知識を広げようとしています。私は物理学のバックグラウンドから来て、統計的テストへの「レシピベース」アプローチを採用しています。
私の読書では、ランダム効果モデル、固定効果モデル、限界モデルという用語に出くわしました。私の質問は:
- 非常に簡単に言えば、それらは何ですか?
- それらの違いは何ですか?
- それらのいずれかは同義語ですか?
- OLS回帰、ANOVA、ANCOVAなどの従来のテストは、この分類のどこに該当しますか?
自己学習で次に進むべき場所を決めようとしているだけです。
統計の知識を広げようとしています。私は物理学のバックグラウンドから来て、統計的テストへの「レシピベース」アプローチを採用しています。
私の読書では、ランダム効果モデル、固定効果モデル、限界モデルという用語に出くわしました。私の質問は:
自己学習で次に進むべき場所を決めようとしているだけです。
回答:
この質問はこのサイトで以下のように部分的に議論されており、意見はまちまちのようです。
すべての用語は通常、縦断/パネル/クラスター化/階層化されたデータと反復測定(高度な回帰とANOVAの形式)に関連していますが、異なるコンテキストでは複数の意味があります。私の知識に基づいて式で質問に答えたいと思います。
一般に、限界モデルは条件付きモデル(変量効果モデル)と比較され、前者は母平均に焦点を当てています(例として線形モデルを採用)後者は条件付き平均限界モデルと変量効果モデル間の回帰係数の解釈とスケールは、非線形モデルでは異なります(ロジスティック回帰など)。ましょう次に、
ここで間違っている場合は修正してください:
概念的には、固定インターセプト、固定係数、ランダムインターセプト、ランダム係数の4つの効果があります。ほとんどの回帰モデルは「ランダム効果」であるため、ランダムな切片とランダムな係数があります。「固定効果」とは対照的に、「ランダム効果」という用語が使用されるようになりました。
「固定効果」とは、変数がすべてではなくサンプルの一部に影響を与える場合です。(概念的に)固定効果モデルの最も単純なバージョンは、バイナリ値を持つ固定効果のダミー変数です。これらのモデルには、単一のランダム切片、固定効果係数、およびランダム変数係数があります。
複雑さの次の層(概念的に)は、固定効果がバイナリではなく、多くの値を持つ名目上の場合です。この場合、生成されるのは、多くの切片(各公称値に1つ)を持つモデルです。これは、パネルデータモデルの古典的な「複数行」を取得する場所であり、固定効果変数の「オプション」のそれぞれが独自の効果を取得します。(固定効果の各因子を独自の回帰として行うのではなく)さまざまな因子固有のデータシリーズをすべて単一の回帰にスローすることの利点は、1つの方程式ですべての異なる効果の分散をプールすることです。すべての係数に対してより良い(より確実な)値を取得します。
複雑さの「ティア3」は、「固定効果」自体がランダム変数である場合です。ただし、その効果は「固定」され、サンプルのサブセットのみに影響します。この時点で、モデルにはランダムインターセプト、複数の固定インターセプト、および複数のランダム変数があります。これは「混合効果」モデルとして知られているものだと思いますか?
「混合効果」モデルは、マルチレベルモデリング(MLM)に使用されます。「固定効果」は、データのサブセットを別のサブセットにネストするために使用できるためです。このグループ化は複数の層を持つことができ、生徒は教室内にネストされ、学校内にネストされます。学校は教室に対する固定効果であり、生徒に対する教室です。(学校は、実験デザインに応じて、生徒に対する固定効果である場合とそうでない場合があります-不明)
パネルデータモデルは「混合効果」モデルですが、グループ化には2つのディメンション、通常は時間と何らかのカテゴリを使用します。