glmmのR構造G構造とは何ですか?


16

MCMCglmm最近このパッケージを使用しています。ドキュメントでR構造およびG構造と呼ばれているものに混乱しています。これらはランダム効果に関連しているようです-特にそれらの事前分布のパラメータを指定していますが、ドキュメントの議論は読者がこれらの用語が何であるかを知っていると仮定しているようです。例えば:

3つの可能な要素を持つ事前仕様のオプションのリスト:R(R構造)G(G構造)およびB(固定効果)............分散構造の事前(RおよびG )は、逆ウィシャートの期待される(共)分散(V)および信念度パラメーター(nu)を含むリストです

... ここから取ります

編集:ステファンからのコメントに続く質問の残りを書き直したことに注意してください。

線形予測子が でおよび E 0 I JN 0 σ 2 0 EU 0 JN 0 σ 2 0 U

β0+e0j+あなたは0j
e0jN0σ0e2あなたは0jN0σ0あなたは2

付属のデータを使用して次の例を作成しました MCMCglmm

> require(MCMCglmm)
> require(lme4)
> data(PlodiaRB)
> prior1 = list(R = list(V = 1, fix=1), G = list(G1 = list(V = 1, nu = 0.002)))
> m1 <- MCMCglmm(Pupated ~1, random = ~FSfamily, family = "categorical", 
+ data = PlodiaRB, prior = prior1, verbose = FALSE)
> summary(m1)


 G-structure:  ~FSfamily

         post.mean l-95% CI u-95% CI eff.samp
FSfamily    0.8529   0.2951    1.455      160

 R-structure:  ~units

      post.mean l-95% CI u-95% CI eff.samp
units         1        1        1        0

 Location effects: Pupated ~ 1 

            post.mean l-95% CI u-95% CI eff.samp  pMCMC    
(Intercept)   -1.1630  -1.4558  -0.8119    463.1 <0.001 ***
---

> prior2 = list(R = list(V = 1, nu = 0), G = list(G1 = list(V = 1, nu = 0.002)))
> m2 <- MCMCglmm(Pupated ~1, random = ~FSfamily, family = "categorical", 
+ data = PlodiaRB, prior = prior2, verbose = FALSE)
> summary(m2)


 G-structure:  ~FSfamily

         post.mean l-95% CI u-95% CI eff.samp
FSfamily    0.8325   0.3101    1.438    79.25

 R-structure:  ~units

      post.mean l-95% CI u-95% CI eff.samp
units    0.7212  0.04808    2.427    3.125

 Location effects: Pupated ~ 1 

            post.mean l-95% CI u-95% CI eff.samp  pMCMC    
(Intercept)   -1.1042  -1.5191  -0.7078    20.99 <0.001 ***
---

> m2 <- glmer(Pupated ~ 1+ (1|FSfamily), family="binomial",data=PlodiaRB)
> summary(m2)
Generalized linear mixed model fit by the Laplace approximation 
Formula: Pupated ~ 1 + (1 | FSfamily) 
   Data: PlodiaRB 
  AIC  BIC logLik deviance
 1020 1029   -508     1016
Random effects:
 Groups   Name        Variance Std.Dev.
 FSfamily (Intercept) 0.56023  0.74849 
Number of obs: 874, groups: FSfamily, 49

Fixed effects:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  -0.9861     0.1344  -7.336  2.2e-13 ***

したがって、Stephaneからのコメントに基づいて、G構造はだと思います。しかし、コメントでは、R構造体はと述べていますが、これは出力に表示されないようです。 σ 2 0 Eをσ0あなたは2σ0e2lme4

の結果lme4/glmer()は、MCMCの両方の例と一致していることに注意してくださいMCMCglmm

それで、のR構造は何ですか?なぜこれが出力に表示されないのですか?σ0e2lme4/glmer()


1
SASの用語(ただし、より一般的な用語)の場合、G行列は変量効果の分散行列であり、R行列は「誤差項」の分散行列です(おそらく、推定残差です)分散?)σ0e2
StéphaneLaurent

@StéphaneLaurentありがとうございます。と推定されるかどうか疑問に思いましたが、一般化線形モデルについて最初に学んだとき、は推定されないことを覚えています-「偏差」のみが計算されます(と同様)。たぶん私は何かを見逃していますか? σ 2 0 Eσ0e2σ0e2lme4
ジョーキング

1
配布家族がガウス分布ではないときに多分残差分散の意味は明確ではない
ステファン・ローラン

1
@StéphaneLaurentはい!マイケルの答えに対する私のコメントを少し前にご覧ください-バイナリの結果については、修正する必要があります(私のOPのモデルのように)
ジョーキング

1
ME /マルチレベルモデルがある場合、いくつかの分散があります。:最も単純なケースを想像。切片と誤差項は分散があります。、多くの場合(この場合はスカラランダム効果のVAR-コバール行列のために使用されている)&残留分散のVAR-コバール行列です固定&そのクラスタのランダムを考慮した後エフェクト。通常、の対角行列として考えられます。また、両方のdistsは、平均が0の多変量正規wと見なされます。B 、I ε I Gは、σ 2 bが R I ε I σ 2Y=β0+β1バツ+b+εbεGσb2Rεσ2
gung-モニカの復職

回答:


8

コメントとして以下にコメントを投稿したいと思いますが、これでは十分ではありません。これらは答えではなく質問です(@gungと同様に、このトピックについて十分に強く感じていません)。

MCMCglmmは「真の」ベイジアンglmmを実装していないという印象を受けています。真のベイジアンモデルについては、このペーパーのセクション2で説明します。同様frequentistモデルに、一方が有する、分散パラメータに必要な先行あるφ 1固定パラメータに加えて、βとの「G」分散はランダム効果のugEyあなたは=バツβ+Zあなたはϕ1βあなたは

それに応じて、このMCMCglmmビネット、MCMCglmmに実装モデルは次式で与えられる 、それは分散パラメータを伴わないφ 1。これは、古典的な周波数モデルとは異なります。gEyあなたはe=バツβ+Zあなたは+eϕ1

したがって、私は全くのアナログがないことに驚いていないことになる glmerと。σe

これらの大まかなコメントをおPleaseびしてください。私はそれについて簡単に見てみました。


ありがとうございました。私はかなり難しいと思っているので、このトピックは難しいと思われますか?私は今、RとG構造の意味に満足していると思います。私はまだの欠如について混乱していますを持つと私はあなたのコメントについて非常に興味があります本当にベイズではありません。私はあなたがリンクした論文のすべてを理解しているとは言えませんし、ビネットの一部にも苦労していますが、純粋に私の例の観点からは、分散パラメーターϕ 1は一定でなければなりません(なぜなら例は二項です)。私は何が欠けていますか?σeglmerMCMCglmmMCMCglmmϕ1
ジョーキング

申し訳ありませんが、私の言葉は完全に適切ではありませんでした。MCMCglmmは真にベイジアンですが、古典的なglmmを正確には実装していません(私は思う)。さらに、頻度の高い推論に近い分散成分の推論をもたらす事前確率を設定することは困難であることに注意する必要があります。
ステファンローラン

再度、感謝します。私の研究ではMCMCglmm、さまざまなパラメータを使用して、分散成分にデフォルトの逆ウィシャート分布を使用でき、95%の信頼できる間隔には常にランダム効果推定の分散値が含まれてglmerいることがわかったので、これは合理的だと感じました、しかし、MCMCglmm間隔が事前の選択にあまり敏感ではないという結果の場合、典型的ではないかもしれないこのケースをどのように解釈すべきですか?たぶん、これについて新しい質問をする必要がありますか?
ジョーキング

σe=0σe0

σeσeσあなたはglmer

11

Rσe21

GG

最後の注意点として、残差分散はゼロに固定されていないため、推定値はからの推定値と一致しませんglmer。それらを再スケーリングする必要があります。以下に小さな例を示します(ランダム効果を使用しませんが、一般化します)。R構造の分散が1に固定されていることに注意してください。

# example showing how close the match is to ML without separation
m2 <- MCMCglmm(vs ~ mpg, data = mtcars, family = "categorical",
  prior = list(
    B = list(mu = c(0, 0), V = diag(2) * 1e10),
    R = list(V = 1, fix = 1)),
  nitt = 1e6, thin = 500, burnin = 10000)
summary(m2)

二項族の再スケーリング定数は次のとおりです。

k <- ((16*sqrt(3))/(15*pi))^2

今それでソリューションを分割し、事後モードを取得します

posterior.mode(m2$Sol/(sqrt(1 + k)))

これは私たちが得るものにかなり近いはずです glm

summary(glm(vs ~mpg, data = mtcars, family = binomial))

MCMCglmmのレベル1で不均一分散性を指定する方法を知っていますか?それはR構造ですか?では、構文は何ですか?
マキシム.K 14年

@ジョシュア、「二項族の再スケーリング定数」を説明できますか?PS:seedについて123m2、値-8.1640.421(以下とからglmの値-8.8330.430
Qaswed

再スケーリング定数は、Diggle et。al。(amazon.de/Analysis-Longitudinal-Oxford-Statistical-Science/dp/...) -に従ってcran.r-project.org/web/packages/MCMCglmm/vignettes/...の EQ。47ページの2.14
Qaswed
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.