マルチレベルモデルと各レベルの個別モデル

10

個別のモデルとマルチレベルモデリングを実行することの利点と欠点は何ですか？

より具体的には、ある国の医師の診療所にある患者を調査したとしましょう。3レベルのネストされたモデルと比較して、国ごとに別々のモデルを実行する利点と欠点は何ですか？

multilevel-analysis stratification

2

3レベルモデルで公平なパラメーター推定値を取得する場合（一般的に、マルチレベルモデルのサンプルサイズは最高レベルで特に重要です）、技術的にかなりのレベル3ユニットが必要です。国の大規模なランダムサンプル（おそらく50以上）、おそらく2レベルモデルを個別に実行することを検討する必要があります。または、国が少ない場合は、国を2レベルモデルのカテゴリレベル2予測子として扱うことを検討できます

— Patrickクーロンブ2013

こんにちは@gung離れていました。今から見ていきます。

— ピーターフロム-モニカの回復

6

質問には日付がありますが、非常に重要だと思います。私が得られる最良の答えは、Joop J Hox（2010）の本「Multilevel Analysis Techniques and Applications、Second Edition」からです。

2レベルの階層データで、レベルの $p$ 説明変数が最低レベルにあり、レベルの $q$ 説明変数が最高レベルにあるとします。次に、55ページで、彼は次のように書いています。

同じデータの通常の単一レベル回帰モデルは、切片、1つの誤差分散、およびp + q回帰勾配のみを推定します。データがグループにクラスター化されていると考えると、マルチレベル回帰モデルの優位性は明らかです。100個のグループがある場合、各グループの通常の重回帰モデルを個別に推定するには、100×（1回帰切片+ 1残差分散+ p回帰勾配）とqグループレベル変数との可能な相互作用を推定する必要があります。マルチレベル回帰は、これらの残差の正規分布を仮定して、グループ全体の平均切片とその残差分散を推定することにより、100個の切片の推定を置き換えます。したがって、マルチレベル回帰分析は、2つのパラメーター（切片の平均と分散）に加えて正規性の仮定を推定することにより、100個の切片の推定を置き換えるものです。同じ簡略化が回帰勾配に使用されます。説明変数の生徒の性別について100の勾配を推定する代わりに、グループ間の分散とともに平均勾配を推定し、勾配の分布が正規であると仮定します。それにもかかわらず、適度な数の説明変数があっても、マルチレベル回帰分析は複雑なモデルを意味します。一般に、完全なモデルを推定することは望ましくありません。最初にこれが計算上の問題に陥る可能性が高いためですが、そのような複雑なモデルを解釈することが非常に難しいためです。

それは説明のためです。これで、29〜30ページがより正確に質問に回答します。

100クラスの予測切片と勾配は、標準の通常の最小二乗（OLS）手法を使用して、100クラスのそれぞれで100の通常の回帰分析を実行した場合に得られる値と同じではありません。100の個別のOLS回帰分析の結果をマルチレベルの回帰分析から得られた値と比較すると、個別の分析の結果はより変動しやすいことがわかります。これは、100クラスの回帰係数のマルチレベル推定が重み付けされているためです。それらは、いわゆる経験的ベイズ（EB）または収縮の推定値です。各クラスの特定のOLS推定値と、類似するすべてのクラスについて推定される全体的な回帰係数の加重平均です。

その結果、回帰係数はデータセット全体の平均係数に向かって縮小されます。収縮の重みは、推定された係数の信頼性に依存します。小さな精度で推定された係数は、非常に正確に推定された係数よりも縮小します。推定の精度は、グループのサンプルサイズ、およびグループベースの推定と全体の推定の間の距離という2つの要因に依存します。小さなグループの見積もりは信頼性が低く、大きなグループの見積もりよりも縮小します。他の条件が同じ場合、全体の見積もりから非常に離れている見積もりは信頼性が低いと見なされ、全体の平均に近い見積もりよりも縮小します。使用される統計的手法は、経験的ベイズ推定と呼ばれます。この収縮効果により、経験的なベイズ推定量は偏っています。しかしながら、それらは通常より正確であり、偏見を持たないよりもしばしば有用な特性です（Kendall、1959を参照）。

私はそれが満足であることを望みます。

— 孟胡
ソース

2

変量効果を指定するには、それらのレベルの平均が正規分布からのサンプルであると想定する必要があります。これらを固定効果として指定することをお勧めします。この仮定がデータに適合しない場合は、ダミー変数とも呼ばれます。このようにして、平均で（そのレベルで）グループごとの不均一性を制御しますが、下位レベルの変数への応答で不均一性を許容しません。

下位レベルの説明変数に応じて異質性が予想される場合は、ある種のランダム係数モデル（ここでも係数が正規分布であるという仮定を含む）を実行する必要がない限り、個別のモデルが意味をなします。

（通常ではない変量効果の方法はあると思いますが、lmeほど広く使用されたり、アクセスできるものはありません）

— generic_user
ソース

1

利点：クラスターごとのパラメーターの違いを明示的にテストする機能（つまり、有意差は有意差を意味しない）。

— DLダーリー
ソース

2

この答えは短すぎます。答えよりもコメントの方が多い。

— Eric Peterson