線形混合モデルの落とし穴


18

線形混合効果モデルを使用する主な落とし穴は何ですか?モデルの適切性を評価する際にテスト/注意する最も重要なことは何ですか?同じデータセットのモデルを比較する場合、探すべき最も重要なことは何ですか?

回答:


16

これはいい質問です。

一般的な落とし穴を次に示します。

  1. 標準尤度理論を使用して、尤度比検定統計量を計算することにより、2つのネストされた仮説とを比較する検定を導出できます。この検定統計量のヌル分布は、2つのパラメーター空間の次元の差に等しい自由度を持つほぼカイ2乗です。残念ながら、このテストは概算であり、いくつかの仮定が必要です。1つの重要な仮定は、nullの下のパラメーターがパラメーター空間の境界上にないことです。私たちはしばしば、という形式をとる変量効果についての仮説をテストすることに興味があるので、 これは本当の懸念です。H0H1

    H0σ2=0
    この問題を回避する方法は、REMLを使用することです。それでも、p値は本来あるべき値よりも大きくなる傾向があります。これは、χ2近似を使用して重要な効果を観察した場合、それが実際に重要であることをかなり確信で​​きることを意味します。小さいが重要ではないp値は、より正確ではあるが時間のかかるブートストラップメソッドを使用するように促す場合があります。
  2. 固定効果の比較:尤度比検定を使用して、固定効果のみが異なる2つのネストされたモデルを比較する場合、REML推定法は使用できません。その理由は、固定効果を除去するデータの線形結合を考慮して、REMLがランダム効果を推定するためです。これらの固定効果が変更された場合、2つのモデルの尤度は直接比較できなくなります。

  3. P値:固定効果の尤度比検定によって生成されたp値は近似値であり、残念ながら小さすぎる傾向があるため、一部の効果の重要性を誇張することがあります。ノンパラメトリックブートストラップ法を使用して、尤度比検定のより正確なp値を見つけることができます。

  4. Dr. Doug Bates [ ここ ]で強調されている、固定効果テストのp値に関するその他の懸念があります。

フォーラムの他のメンバーにはより良い答えがあると確信しています。

出典:Rによる線形モデルの拡張-Dr.Julain Faraway


9

よくある落とし穴は、ランダム効果の分散を無視することです。残差分散または従属変数の分散と比較して大きい場合、通常、フィットは見栄えがよくなりますが、これはランダム効果がすべての分散を説明するためです。しかし、実際のグラフと予測のグラフは見栄えが良いので、モデルが良いと思う傾向があります。

そのようなモデルを新しいデータの予測に使用すると、すべてがバラバラになります。通常、固定効果のみを使用でき、適合度が非常に低くなります。


6

分散構造のモデル化は、おそらく混合モデルの最も強力で重要な単一機能です。これは分散構造を超えて拡張され、観測値間の相関を含みます。適切な共分散構造を構築するように注意する必要があります。そうしないと、仮説、信頼区間、および治療手段の推定値のテストが無効になる場合があります。多くの場合、正しい変量効果を指定するには実験の知識が必要です。

Rで分析を実行したい場合でも、SAS for Mixed Modelsはリソースにアクセスするためのものです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.