一般化線形混合モデルの変量効果の分散をどのように解釈しますか


9

ロジスティック一般化線形混合モデル(ファミリ=二項式)では、変量効果の分散を解釈する方法がわかりません。

Random effects:
 Groups   Name        Variance Std.Dev.
 HOSPITAL (Intercept) 0.4295   0.6554  
Number of obs: 2275, groups: HOSPITAL, 14

この数値結果をどのように解釈しますか?

多施設共同研究で腎移植患者のサンプルがあります。特定の降圧治療を受けている患者の確率がセンター間で同じかどうかをテストしていました。治療を受ける患者の割合はセンター間で大きく異なりますが、患者の基本的な特性の違いが原因である可能性があります。そこで、患者の主要な特徴を調整して、一般化線形混合モデル(ロジスティック)を推定しました。これは結果です:

Generalized linear mixed model fit by maximum likelihood ['glmerMod']
 Family: binomial ( logit )
Formula: HTATTO ~ AGE + SEX + BMI + INMUNOTTO + log(SCR) + log(PROTEINUR) + (1 | CENTER) 
   Data: DATOS 

     AIC      BIC   logLik deviance 
1815.888 1867.456 -898.944 1797.888 

Random effects:
 Groups   Name        Variance Std.Dev.
 CENTER (Intercept) 0.4295   0.6554  
Number of obs: 2275, groups: HOSPITAL, 14

Fixed effects:
                           Estimate Std. Error z value Pr(>|z|)    
(Intercept)               -1.804469   0.216661  -8.329  < 2e-16 ***
AGE                       -0.007282   0.004773  -1.526  0.12712    
SEXFemale                 -0.127849   0.134732  -0.949  0.34267    
BMI                        0.015358   0.014521   1.058  0.29021    
INMUNOTTOB                 0.031134   0.142988   0.218  0.82763    
INMUNOTTOC                -0.152468   0.317454  -0.480  0.63102    
log(SCR)                   0.001744   0.195482   0.009  0.99288    
log(PROTEINUR)             0.253084   0.088111   2.872  0.00407 ** 

量的変数は中心に置かれます。切片の病院間標準偏差は、対数オッズスケールで0.6554であることを知っています。切片が-1.804469であるため、対数オッズのスケールで、平均年齢の男性の降圧薬で治療される確率は、「平均」センターのすべての変数と免疫治療Aの平均値で14.1%です。 。そして今、解釈が始まります:変量効果が正規分布に従うという仮定の下で、中心の約95%がゼロの平均の2標準偏差内の値を持っていると予想されるため、平均的な人のために扱われる確率カバレッジ間隔が次のセンター間で異なります:

exp(-1.804469-2*0.6554)/(1+exp(-1.804469-2*0.6554))

exp(-1.804469+2*0.6554)/(1+exp(-1.804469+2*0.6554))

これは正しいです?

また、センター間のばらつきが統計的に有意である場合、どのようにしてより詳細にテストできますか?以前はDonald Hedekerの優れたソフトウェアであるMIXNOを使用していましたが、推定分散の標準誤差がありました。各センターの「平均的な」男性に対して、コンフィデン間隔で治療される確率をどのようにして得ることができますか?

ありがとう

回答:


10

0.65542=0.4295

(質問を明確にしたり、モデルの詳細を追加したりした場合は、もっと詳しくお話しさせていただきます。)

update:バリエーションの解釈は正しいようです。より正確に、

cc <- fixef(fitted_model)[1] ## intercept
ss <- sqrt(unlist(VarCorr(fitted_model))) ## random effects SD
plogis(qnorm(c(0.025,0.975),mean=cc,sd=ss))

病院全体で治療を受けるベースライン(男性/平均年齢など)の確率について、95%の間隔(実際にはかなり信頼できる間隔ではありませんが、非常によく似ています)が得られます。

ランダム効果の重要性をテストするには、さまざまな選択肢があります(詳細については、http://bbolker.github.io/mixedmodels-misc/glmmFAQ.htmlを参照してください)。(RE分散の標準誤差は、サンプリング分布がしばしば歪んでいる/非正規であるため、通常、有意性をテストする信頼できる方法ではないことに注意してください。)最も簡​​単なアプローチは、尤度比テストを行うことです。

pchisq(2*(logLik(fitted_model)-logLik(fitted_model_without_RE)),
       df=1,lower.tail=FALSE)/2

2による最後の除算は、ヌル値(つまり、REの分散= 0)が実行可能な空間の境界にあるとき(つまり、REの分散が<0になることはできない)の場合、尤度比検定が保守的であることを修正します。


質問を編集しました
user2310909

1
おかげで、主題についてよく知っている人に読むことができてうれしいです。
user2310909 14
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.