ランダム効果が重要かどうかをテストするにはどうすればよいですか?


34

ランダム効果をいつ使用するか、いつ使用する必要がないかを理解しようとしています。私が経験した4つ以上のグループ/個人がいる場合は経験則だと言われました(15の個々のムース)。これらのムースのいくつかは、合計29回の試行で2回または3回実験されました。リスクの高い地域にいるときとそうでないときで行動が異なるかどうかを知りたい。だから、私は個人をランダム効果として設定すると思いました。しかし、私は今、彼らの反応に多くの変化がないので、個人を変量効果として含める必要はないと言われています。私が理解できないのは、個人をランダム効果として設定するときに、実際に何らかの原因があるかどうかをテストする方法です。たぶん最初の質問は:Individualが適切な説明変数であり、固定効果であるべきかどうかを判断するために、どのテスト/診断を行うことができますか-qqプロット?ヒストグラム?散布図?そして、私はそれらのパターンで何を探すでしょう。

ランダムな効果として個人なしでモデルを実行しましたが、http//glmm.wikidot.com/faqで次のように述べています:

lmerモデルを対応するlm近似またはglmer / glmと比較しないでください。対数尤度は釣り合っていない(つまり、異なる加算項が含まれている)

そして、ここでは、これは、ランダム効果のあるモデルとないモデルの比較ができないことを意味します。しかし、とにかくそれらを比較する必要があるか本当に知りません。

ランダム効果のモデルでは、出力を見て、REがどのような証拠または重要性を持っているかを確認しようとしました

lmer(Velocity ~ D.CPC.min + FD.CPC + (1|ID), REML = FALSE, family = gaussian, data = tv)

Linear mixed model fit by maximum likelihood 
Formula: Velocity ~ D.CPC.min + FD.CPC + (1 | ID) 
   Data: tv 
    AIC    BIC logLik deviance REMLdev
 -13.92 -7.087  11.96   -23.92   15.39
Random effects:
 Groups   Name        Variance Std.Dev.
 ID       (Intercept) 0.00000  0.00000 
 Residual             0.02566  0.16019 
Number of obs: 29, groups: ID, 15

Fixed effects:
              Estimate Std. Error t value
(Intercept)  3.287e-01  5.070e-02   6.483
D.CPC.min   -1.539e-03  3.546e-04  -4.341
FD.CPC       1.153e-04  1.789e-05   6.446

Correlation of Fixed Effects:
          (Intr) D.CPC.
D.CPC.min -0.010       
FD.CPC    -0.724 -0.437

ランダム効果としての個々のIDからの分散とSDが0であることがわかります。それはどのように可能ですか?0はどういう意味ですか?そうですか?「ランダム効果が不要であるため、IDを使用した変動がないため」と言った私の友人は正しいですか?それで、それを固定効果として使用しますか?しかし、バリエーションが非常に少ないという事実は、とにかく多くを語らないことを意味しないでしょうか?


ランダム効果の正確な0分散の取得については、stats.stackexchange.com / questions / 115090を参照してください。
アメーバは、

回答:


21

推定値IDの分散= 0は、グループ間の変動性のレベルが、モデルにランダム効果を組み込むことを保証するのに十分ではないことを示します。すなわち。モデルは縮退しています。

自分自身を正しく特定する場合:おそらく、はい。IDランダムな効果は不要です。この仮定をテストするために頭に浮かぶものはほとんどありません。

  1. REML = Fランダム効果のあるモデルとないモデルの間でAIC(または一般的にお気に入りのIC)を(常に使用して)比較し、これがどうなるかを確認できます。
  2. anova()2つのモデルの出力を確認します。
  3. 元のモデルで定義された事後分布を使用して、パラメトリックブートストラップを実行できます。

選択肢1と2に問題があることに注意してください。パラメータ空間の境界上にあるものをチェックしているため、実際には技術的に適切ではありません。そうは言っても、それらから間違った洞察を得ることはないと思いますし、多くの人々がそれらを使用します(例えば、lme4の開発者の1人であるDouglas Batesは、書籍が、明らかにテストされているパラメータ値については、この警告を述べて可能な値のセットの境界上)。選択肢3は3の中で最も退屈ですが、実際に何が起こっているかについて最高のアイデアを提供します。一部の人々はノンパラメトリックブートストラップも使用するように誘惑されますが、最初からパラメトリックな仮定をしているという事実を考えると、それらを使用することもあると思います。


6
RLRsimパッケージは、シミュレーションベースの尤度比テストを使用してランダム効果をテストするための非常に便利な方法です。
-atrichornis

@atrichornis:+1。興味深いパッケージ; 私はそれを知りませんでした。私はそのコードを見ただけで、非常に簡単です。壊れており、人々が適切なp値などを得るために独自のアドホックなブートストラップ実装のみが残されているlme4今、特にそれらにそれを組み込むことを願っていmcmcsamp()ます。
usεr11852が復活モニック言う

確かに、Rでは混合モデルは単純ではありません。多くの近似と回避策... SASなどを収集しましたが、同じ不確実性のいくつかを単に説明していますか?ベンボルカーは両方のパッケージの共著者であり、彼がそれを組み込まない理由があります。おそらく時間!
-atrichornis

4
パラメータスペースの境界のブートストラップには、それ自身の問題と矛盾につながる問題があります。ブートストラップは万能薬ではありません。すべてを解決できると仮定して、バッグに軽く投げ込まないでください。
StasK

2
見てください、議論は非常に微妙です。私が思い出す限り、それはあなたがヌルとは異なるディストリビューションからブートストラップをしているという事実に要約されます。また、境界で取得された非標準分布が与えられると、規則性の条件に違反し、ブートストラップ分布はターゲットに収束しません。ここでは、残差のグループ平均を取り出すことで、ノンパラメトリックブートストラップを構築できると思います。ただし、グループ間の観測の独立性に違反すると、別の複雑な層が発生する可能性があります。
StasK

3

私が提案しようとしているアプローチが合理的かどうかはわかりません。そのため、このトピックについてもっと知っている人は、私が間違っていれば私を修正します。

私の提案は、データに1の定数値を持つ追加の列を作成することです。

IDconst <- factor(rep(1, each = length(tv$Velocity)))

次に、この列をランダム効果として使用するモデルを作成できます。

fm1 <- lmer(Velocity ~ D.CPC.min + FD.CPC + (1|IDconst), 
  REML = FALSE, family = gaussian, data = tv)

この時点で、あなたは(AIC)ランダム効果を使用して、元のモデルの比較可能性ID(レッツ・コール、それfm0を考慮していない新しいモデルを持つ)IDため、IDconstすべてのデータで同じですが。

anova(fm0,fm1)

更新

user11852は例を求めていました。彼/彼女の意見では、上記のアプローチは実行さえできないからです。それどころか、このアプローチが機能することを示すことができます(少なくともlme4_0.999999-0現在使用しているアプローチでは)。

set.seed(101)
dataset <- expand.grid(id = factor(seq_len(10)), fac1 = factor(c("A", "B"),
  levels = c("A", "B")), trial = seq_len(10))
dataset$value <- rnorm(nrow(dataset), sd = 0.5) +
      with(dataset, rnorm(length(levels(id)), sd = 0.5)[id] +
      ifelse(fac1 == "B", 1.0, 0)) + rnorm(1,.5)
    dataset$idconst <- factor(rep(1, each = length(dataset$value)))

library(lme4)
fm0 <- lmer(value~fac1+(1|id), data = dataset)
fm1 <- lmer(value~fac1+(1|idconst), data = dataset)

anova(fm1,fm0)

出力:

  Data: dataset
  Models:
  fm1: value ~ fac1 + (1 | idconst)
  fm0: value ~ fac1 + (1 | id)

      Df    AIC    BIC  logLik  Chisq Chi Df Pr(>Chisq)
  fm1  4 370.72 383.92 -181.36                      
  fm0  4 309.79 322.98 -150.89 60.936      0  < 2.2e-16 ***

この最後のテストによると、ランダム効果を維持する必要があります。 fm0モデルのAICとBICが最も低いがあります。

更新2

ちなみに、この同じアプローチは、NW Galweyによって「混合モデリングの紹介:回帰と分散の分析を超えて」213-214ページで提案されています。


アイデアをテストしましたか?間違っていることを証明してください。しかし、あなたのアイデアは実行されないでしょう。IDconstがすべてのデータで同じ場合、グループ化は行われません。少なくとも1つのサンプリングされたレベルを持つためのグループ化因子が必要であり、モデルを設定する方法にはグループ化因子がありません。「ランダムなグループ化」を使用する理論的根拠を信じることができるかもしれませんが、それはすべて異なるボールゲームです。ダミーデータを使用してアプローチをテストします。提案されたセットアップでlmer()は動作しないと強く信じています。(私が使用lme4_0.99999911-1
usεr11852は回復モニック言う

@ user11852どうか、私の更新を参照し、このアプローチがでも機能するかどうかをお知らせくださいlme4_0.99999911-1
VLC

Z

3
はい、あなたが提案したことをしました。動作/計算しません。Error in lFormula(formula = value ~ fac1 + (1 | idconst), data = dataset) : grouping factors must have at least 1 sampled level。そして、私が言ったように、概念的には間違っています。ソフトウェアをだましていくつかの数字を出す問題ではなく、あなたがそれを合理的に言っているかどうかは問題です。ランダム効果が構築による定数である場合、そのモデルと比較する2つ目の混合モデルはありません。除外して、代わりに線形モデルを試すこともできます。
usεr11852が復活モニック言う

1
で単一グループのランダム変数を定義する協調を更新しlme4ます。これは、オプションを設定した場合に実行できますcontrol=lmerControl(check.nlev.gtr.1="ignore")。ベンBolkerそれをここに言及:github.com/lme4/lme4/issues/411を
ロビンボーモント

1

もっと「最初の」質問に答えたいです。

いくつかの要因により、従属変数間の分散に何らかの不均一性が疑われる場合は、散布図と箱ひげ図を使用してデータをプロットする必要があります。確認するいくつかの一般的なパターンは、ウェブ上のさまざまなソースからこのリストを以下に掲載します。

異分散性パターン

さらに、因子/治療グループごとに従属変数をプロットして、一定の分散があるかどうかを確認します。そうでない場合は、ランダム効果または重み付き回帰を検討することをお勧めします。例えば 以下のこのチャートは、私の治療グループにおける漏斗状の分散の例です。そこで、ランダム効果を選択して、勾配と切片に対する効果をテストすることにしました。

異分散性をチェックするボックスプロット

ここから、上記の回答が主な質問に対応します。また、不均一分散性をチェックするテストもあります。その1つはhttps://dergipark.org.tr/download/article-file/94971です。しかし、グループレベルの不均一分散性を検出するためのテストが存在するかどうかはわかりません。


OPの質問への回答を提供する場合にのみ、「Your Answer」フィールドを使用してください。CVは厳密なQ&Aサイトであり、ディスカッションフォーラムではありません。投稿の後者の太字部分は新しい質問であり、この質問に対する回答ではありません。新しい質問がある場合ASK QUESTIONは、上部の灰色をクリックして質問してください。ここは初めてなので、新しいユーザー向けの情報が記載されたツアーを利用することをお勧めします。
gung-モニカの復職
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.