glmerでのランダム効果の分散の解釈


12

データが二項分布である受粉に関する論文を改訂しています(果実は成熟するかしないか)。そのためglmer、1つのランダム効果(個々の植物)と1つの固定効果(治療)を使用しました。レビューアーは、植物が結実に影響を与えたかどうかを知りたいのですが、glmer結果の解釈に問題があります。

私はウェブを読んでみましたが、直接比較glmglmerモデルに問題がある可能性があるので、私はそれをしていません。この質問に答える最も簡単な方法は、変量効果の分散(1.449、以下)を総分散、または処理によって説明される分散と比較することだと考えました。しかし、これらの他の分散をどのように計算しますか?以下の出力には含まれていないようです。二項glmer分布に含まれない残差分散について何かを読みました-ランダム効果の相対的な重要性をどのように解釈しますか?

> summary(exclusionM_stem)
Generalized linear mixed model fit by maximum likelihood (Laplace
  Approximation) [glmerMod]
 Family: binomial  ( logit )
Formula: cbind(Fruit_1, Fruit_0) ~ Treatment + (1 | PlantID)

     AIC      BIC   logLik deviance df.resid 
   125.9    131.5    -59.0    117.9       26 

Scaled residuals: 
    Min      1Q  Median      3Q     Max 
-2.0793 -0.8021 -0.0603  0.6544  1.9216 

Random effects:
 Groups  Name        Variance Std.Dev.
 PlantID (Intercept) 1.449    1.204   
Number of obs: 30, groups:  PlantID, 10

Fixed effects:
            Estimate Std. Error z value Pr(>|z|)   
(Intercept)  -0.5480     0.4623  -1.185   0.2359   
TreatmentD   -1.1838     0.3811  -3.106   0.0019 **
TreatmentN   -0.3555     0.3313  -1.073   0.2832   
---
Signif. codes:  0***0.001**0.01*0.05 ‘.’ 0.1 ‘ ’ 1

Correlation of Fixed Effects:
           (Intr) TrtmnD
TreatmentD -0.338       
TreatmentN -0.399  0.509

回答:


11

GLMMの場合、「各効果によって説明される割合の分散」の類似を取得することは原則として可能ですが、いくつかの複雑な要因があります(モデルのどのレベルを「総分散」と見なし、どのようにサンプリング変動を定量化しますか最低レベル[この場合の二項]サンプリング分布)? Nakagawa and Schielzeth(doi:10.1111 / j.2041-210x.2012.00261.x)は、エコロジーでかなり普及している(G)LMMのR ^ 2(総分散の割合を説明)を計算する一般的なアプローチを示しています。Xu et al 2003同様のアプローチを取ります。原則として、このアプローチはおそらく異なる用語で説明される分散の割合を考慮して拡張できます[ただし、この方法で考慮されるモデルのすべての用語の「分散の割合」は、おそらく100%にならないことに注意してください-多かれ少なかれ]。

4σ1.96σ+1.96σ

視覚的に:

ここに画像の説明を入力してください


R2

1
私は、それがおかしな質問や必ずしも不適切な質問だとは思わないと言っていました。しかし、階層構造とGLMのようなモデルの両方が、答えを見つけるのを難しくするワームの缶を開きます。私は通常、気にしませんが、なぜ人々が合理的な方法で適合度、またはモデルの用語の相対的な重要性を測定した数値を見つけようとするのかを見ることができます。
ベンボルカー

それは合理的です。ところで、10植物、3処理、N = 30の場合、OPは両方を固定効果として使用してモデルに適合できるという私の提案をどう思いますか?もちろん、これが正しい最終モデルになるとは限りませんが、植物にばらつきがあるかどうかをテストし、比較のために両方の変数を同様の足場に置くための潜在的に許容される方法として私を打っています。
GUNG -復活モニカ

私にとっては理にかなっているようです。
ベンボルカー

gungが示唆したように、処理と植物の両方を固定効果としてモデルに適合させ、植物の項は非常に高いp値(p = 0.3)でした。あなたが言うように、「プラント間の標準偏差の推定値は1.20で、最大の治療効果の大きさ(-1.18)に非常に近い」ということを考えると、これは奇妙に思えますか?2つの固定効果を持つANOVAで重要でないと表示されるのはなぜですか?
jwb4

3

PlantID0

あなたの場合、プラントごとに複数のメジャーがあるので、1つの迅速で汚れたアプローチはPlantID、固定効果としてモデルを実行し、その効果をテストすることです。


1

レビューアに対する簡単な答えは、「はい」です。ランダム効果の分散が0と大きく異なるかどうかをテストするように彼に求めている場合、いくつかのオプションがあります。ただし、多くの賢い人は、変量効果の分散が0と異なる場合、テストに不快であることに注意してください。

最も単純なのは尤度比検定ですが、ほとんどの人には推奨されていません。境界でテストするときは、非常に保守的です(つまり、分散0に対してテストを行っていますが、分散は可能な限り低くなっています)。p値は実際の約2倍であるという経験則があります。

ほとんどの場所で推奨される方法は、パラメトリックブートストラップです。パッケージbootMerから使用できlme4ます。必ずlmer関数のREMLパラメーターをFALSEに設定してください。そうしないと、分散は0を超える100%の時間(またはそれに近い...実際には0を超えるほぼ100%になります)とにかく時間)。

いくつかのヒントとリソース:

http://glmm.wikidot.com/faq(ランダム効果が重要かどうかをテストするにはどうすればよいですか?見出しを見つけます)

固定効果のlmer()パラメトリックブートストラップテスト

http://www.r-bloggers.com/using-bootmer-to-do-model-comparison-in-r/


モデルを比較するためのこの明快な(そして迅速な!)ガイドをありがとう。しかし、ランダム変数の効果の「大きさ」をどのように解釈するのでしょうか?つまり、ランダム変数で説明された分散と、固定変数で説明された分散(処理)をどのように比較しますか?ブートストラップされたLRTテストの結果から、これがどのように収集されているかはわかりません。
jwb4

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.