複雑な最大混合モデル(特定のデータとモデルのすべての可能な変量効果を推定する)を扱う場合、それほど珍しいことではありませんが、一部の変量効果の間で完全(+1または-1)またはほぼ完全な相関関係です。議論のために、次のモデルとモデルの要約を見てみましょう
Model: Y ~ X*Cond + (X*Cond|subj)
# Y = logit variable
# X = continuous variable
# Condition = values A and B, dummy coded; the design is repeated
# so all participants go through both Conditions
# subject = random effects for different subjects
Random effects:
Groups Name Variance Std.Dev. Corr
subject (Intercept) 0.85052 0.9222
X 0.08427 0.2903 -1.00
CondB 0.54367 0.7373 -0.37 0.37
X:CondB 0.14812 0.3849 0.26 -0.26 -0.56
Number of obs: 39401, groups: subject, 219
Fixed effects:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 2.49686 0.06909 36.14 < 2e-16 ***
X -1.03854 0.03812 -27.24 < 2e-16 ***
CondB -0.19707 0.06382 -3.09 0.00202 **
X:CondB 0.22809 0.05356 4.26 2.06e-05 ***
これらの完全な相関の背後にあると考えられる理由は、私たちが持っているデータに対して複雑すぎるモデルを作成したことです。これらの状況で与えられる一般的なアドバイスは(たとえば、Matuschek et al。、2017; 論文)、過パラメタライズされた係数を0に修正することです。縮小モデルで固定効果に著しい変化が見られる場合は、それを受け入れる必要があります。変更がない場合は、元の変更を受け入れることに問題はありません。
ただし、RE(ランダム効果)に対して制御される固定効果だけでなく、RE構造にも関心があると仮定します。与えられたケースでは、理論的にはIntercept
、勾配X
がゼロ以外の負の相関を持っていると仮定するのが適切です。いくつかの質問が続きます:
そのような状況で何をすべきか?完全な相関関係を報告し、データが「実際の」相関関係を推定するのに「十分」ではないと言うべきでしょうか?または、0相関モデルを報告する必要がありますか?それとも、「重要な」相関関係がもう完全ではなくなることを期待して、他の相関関係を0に設定しようとする必要があるでしょうか。100%正解はここにはないと思います。あなたの意見をお聞かせください。
他のパラメーター間の相関に影響を与えずに、2つの特定のランダム効果の相関を0に修正するコードを記述する方法は?
blme
、MCMCglmm
、rstanarm
、brms
...)