固定効果をランダムな効果にネストするのは理にかなっていますか、それともR(aovとlmer)で反復測定をコーディングするのは意味がありますか?


23

私は@conjugatepriorによるlm / lmer R公式のこの概要を見ていて、次のエントリで混乱しました:

ここで、Aはランダムですが、Bは固定され、BはA内にネストされていると仮定します。

aov(Y ~ B + Error(A/B), data=d)

lmer(Y ~ B + (1 | A:B), data=d) 同じケースについて、以下の類似した混合モデル式が提供されています。

意味がよくわかりません。被験者をいくつかのグループに分割する実験では、固定因子(グループ)内にランダム因子(被験者)をネストします。しかし、固定因子をランダム因子内にどのようにネストできますか?ランダムなサブジェクト内にネストされた固定された何か?それも可能ですか?それが不可能な場合、これらのR式は意味をなしますか?


この概要は、R での反復測定に関するこのチュートリアルに基づいて、RでANOVAを実行するパーソナリティプロジェクトのページに部分的に基づいていると述べられています。そこで、反復測定ANOVAの次の例を示します。

aov(Recall ~ Valence + Error(Subject/Valence), data.ex3)

ここでは、被験者にさまざまな価数の単語(3つのレベルを持つ因子)が提示され、その想起時間が測定されます。各主題には、3つのすべての価数レベルの単語が表示されます。私は(それがあたりとして、交差表示されます。この設計で入れ子に何も表示されません。ここでは素晴らしい答え)、と私は単純にそれを思うだろうように、Error(Subject)または(1 | Subject)このような場合には適切なランダムな用語でなければなりません。Subject/Valence「ネスティングは」(?)混乱しています。

私はそれValence被験者内要因であることを理解していることに注意してください。しかし、それは被験者内の「ネストされた」要因ではないと思います(すべての被験者がの3つのレベルすべてを経験するためValence)。


更新。Rの反復測定ANOVAのコーディングに関するCVに関する質問を調査しています。

  • ここで、以下は固定被験者内/反復測定Aおよびランダムに使用されますsubject

    summary(aov(Y ~ A + Error(subject/A), data = d))
    anova(lme(Y ~ A, random = ~1|subject, data = d))
  • ここでは、2つの固定被験者内/反復測定効果AおよびBについて:

    summary(aov(Y ~ A*B + Error(subject/(A*B)), data=d))
    lmer(Y ~ A*B + (1|subject) + (1|A:subject) + (1|B:subject), data=d) 
  • ここでは、3つの被験者内効果A、B、およびCについて:

    summary(aov(Y ~ A*B*C + Error(subject/(A*B*C)), data=d))
    lmer(Y ~ A*B*C + (1|subject) + (0+A|subject) + (0+B|subject) + (0+C|subject) + (0+A:B|subject) + (0+A:C|subject) + (0+B:C|subject), data = d)

私の質問:

  1. なぜError(subject/A)ありませんかError(subject)
  2. それがある(1|subject)か、(1|subject)+(1|A:subject)あるいは単に(1|A:subject)
  3. それがある(1|subject) + (1|A:subject)(1|subject) + (0+A|subject)、そしてなぜないだけで(A|subject)

今までに、これらの事柄のいくつかが同等であると主張するスレッドを見てきました(例えば、最初:それらは同じである、SOに対する反対の主張 ; 3番目:それらは同じであるという主張)。彼らは?


2
私の意見では、厳密に概念的に言えば、ランダムな要因の中に固定された要因をネストすることは事実上意味をなさない、と言う簡単なコメントです。少なくとも1人の教科書の著者も同じように言っています(現時点では参考文献を思い出せません)。とはいえ、上で書いたモデルの仕様の一部は、より意味のあるモデルと統計的に同等になる可能性があります...私はそれについてもっと考えて、少し試してみる必要があります。
ジェイクウェストフォール

4
実際、RがA / B構文を解釈する方法を考えれば、それは理にかなっていると思います。これは単にこれをA + A:Bに拡張するだけです。のようsubject/conditionにランダムな用語を考えると、これは概念的に疑わしいです。明らかに反対の場合、条件が主題にネストされていることを示唆しているようですがsubject + subject:condition、実際に適合するモデルはであり、これはランダムな主題効果を持つ完全に有効なモデルですランダムな被験者Xの傾き。
ジェイクウェストフォール

@JakeWestfallありがたいことに、これは私が今までに自分自身で考えていることに沿っているが、誰かにきちんと説明してほしい。実際、私はこれが重要な問題であることに驚いています。私はあなたがすぐに答える人の一人になることを期待していたでしょう。しかし、これは安らぎです。元々、私の混乱は馬鹿げているに違いないと思っていたからです。ちなみに、標準的な参照lmaov数式はありますか?正確に何をするのかaov(それに対するラッパーlmですか?)およびError()用語の動作方法に関する信頼できる情報源が必要な場合は、どこを調べるべきですか?
アメーバは、モニカーを復活させる

1
@amoebaはい、最小二乗法に使用されるという意味でのaovラッパーですlmが、いくつかの追加作業(特に、用語の翻訳)を行います。信頼できるソースは、Chambers et al(1992)に記載されているソースコードまたは参照です。しかし、私はその参照にアクセスできないため、ソースコードを調べます。lmaovErrorlmhelp("aov")
ローランド

回答:


12

混合モデルでは、特に交差、部分交差、または入れ子にされているかどうかと関連して、固定またはランダムのいずれかとしての因子の処理は、多くの混乱につながる可能性があります。また、anova / designed実験の世界とmixed / multilevel modelsの世界でネストすることによって意味されるものの間で用語の違いがあるように見えます。

私はすべての答えを知っていると公言しません、そして、私の答えは完全ではありません(そして、さらに質問をするかもしれません)、しかし、私はここでいくつかの問題に対処しようとします:

固定効果をランダムな効果にネストするのは理にかなっていますか、それともR(aovとlmer)で反復測定をコーディングするのは意味がありますか?

(質問のタイトル)

いいえ、これが理にかなっているとは思いません。繰り返されるメジャーを扱う場合、通常、メジャーが繰り返されることは何でもランダムになりますのでSubject、それを呼び出しましょう。そして、1つ以上の右側のランダムな部分lme4に含める必要があります。式。他のランダム効果がある場合、これらは交差、部分交差、またはネストされています- この質問に対する私の答えはそれを解決します。Subject|

これらのanovaタイプの設計された実験の問題は、繰り返し測定される状況で、通常は固定されていると考えられる要因をどのように扱うかであるように思われます。

なぜError(subject / A)であり、Error(subject)ではないのですか?

私は通常は使用しないaov()ので、何かが欠けている可能性がありますが、私にとってError(subject/A)は、リンクされた質問の場合には非常に誤解を招きます。Error(subject)実際、まったく同じ結果につながります。

それは(1 | subject)または(1 | subject)+(1 | A:subject)または単に(1 | A:subject)ですか?

これはこの質問に関連しています。この場合、以下のすべてのランダム効果定式化は、まったく同じ結果につながります。

(1|subject)
(1|A:subject)
(1|subject) + (1|A:subject)
(1|subject) + (1|A:subject) + (1|B:subject)

ただし、これは、問題のシミュレートされたデータセットには何も変化がないため、単にで作成されているためY = rnorm(48)です。我々のような本当のデータセットを取る場合cakeにおけるデータセットlme4、私たちは、これは一般的にそうでないことがわかります。ドキュメントから、実験的なセットアップは次のとおりです。

3つの異なるレシピで作成され、6つの異なる温度で焼かれたチョコレートケーキの破損角度に関するデータ。これは、レシピがユニット全体であり、異なる温度がサブユニット(複製内)に適用されるスプリットプロット設計です。実験ノートは、レプリケート番号が一時的な順序を表していることを示唆しています。

次の5つの変数に関する270の観測値を持つデータフレーム。

replicate レベル1〜15の係数

recipe レベルA、B、Cの因子

temperature レベルが175 <185 <195 <205 <215 <225の順序付けられた因子

temp ベーキング温度の数値(度F)。

angle ケーキが壊れた角度を与える数値ベクトル。

そのため、内replicateで繰り返し測定を行い、固定因子にも関心がrecipeありtemperaturetempこれはの異なるコーディングであるため無視できますtemperature)、次を使用して状況を視覚化できますxtabs

> xtabs(~recipe+replicate,data=cake)

     replicate
recipe 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
     A 6 6 6 6 6 6 6 6 6  6  6  6  6  6  6
     B 6 6 6 6 6 6 6 6 6  6  6  6  6  6  6
     C 6 6 6 6 6 6 6 6 6  6  6  6  6  6  6

recipeランダム効果の場合、これらは交差ランダム効果であると言えます。決して、他の複製物にrecipe A属していませんreplicate 1

> xtabs(~temp+replicate,data=cake)

     replicate
temp  1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
  175 3 3 3 3 3 3 3 3 3  3  3  3  3  3  3
  185 3 3 3 3 3 3 3 3 3  3  3  3  3  3  3
  195 3 3 3 3 3 3 3 3 3  3  3  3  3  3  3
  205 3 3 3 3 3 3 3 3 3  3  3  3  3  3  3
  215 3 3 3 3 3 3 3 3 3  3  3  3  3  3  3
  225 3 3 3 3 3 3 3 3 3  3  3  3  3  3  3

同様にtemp

したがって、最初に適合するモデルは次のとおりです。

> lmm1 <-  lmer(angle ~ recipe * temperature + (1|replicate), cake, REML= FALSE)

これによりreplicate、それぞれが(もちろん残差以外の)ランダムな変動の唯一のソースとして扱われます。しかし、レシピにはランダムな違いがあります。したがってrecipe、別の(交差した)ランダム効果として含めるように誘惑されるかもしれませんが、3つのレベルしかrecipeないため、モデルが分散成分を適切に推定することを期待できないため、これはお勧めできません。そのため、代わりにreplicate:recipeグループ化変数として使用して、レプリケートとレシピの各組み合わせを個別のグループ化要因として扱うことができます。したがって、上記のモデルでは、レベルreplicateごとに15のランダムな切片がありますが、個々の組み合わせごとに45のランダムな切片があります。

lmm3 <-  lmer(angle ~ recipe * temperature + (1|replicate:recipe) , cake, REML= FALSE)

レシピによるランダムな変動があることを示す(非常にわずかな)異なる結果になりましたが、大したことではないことに注意してください。

同様に、で同じことができtemperatureます。

さて、あなたの質問に戻って、あなたはまた尋ねます

なぜそう(1|subject) + (1|A:subject)でないの(1|subject) + (0+A|subject)か、それとも単に(A|subject)

この(ランダムな斜面を利用して)がどこから来るか、私は確信して全体ではないよ-それは2つのリンクの質問に発生していないようだ-しかし、と私の問題は(1|subject) + (1|A:subject)、これは正確に同じであるということである(1|subject/A)その手段A内にネストされsubject、その中にターンとは、(私にとって)各レベルがA1つだけで発生することを意味しsubjectます。

おそらくそれについてさらに考えた後、この回答を追加および/または編集しますが、最初の考えを落としたいと思いました。


ありがとう(+1)。cakeデータセットを理解しているかわかりません。レプリケーションはレシピにネストされているようです。その理由xtabsは、ネスト対クロスの答えで説明する正確な理由を示すものではありません。レプリケーションは、1-45ではなく1-15として混乱してコーディングされています。各レシピについて、6つのケーキで15の「複製」が作成されました。次に、各ケーキを異なる温度で焼きました。したがって、レシピは被験者間要因であり、温度は被験者内要因です。あなたの答えによると、そうなるはずです(1|recipe/replicate)。いや?(1|replicate:recipe)おそらく同等です。
アメーバは、モニカーを復活させる

質問は被験者内の要因にのみ焦点を当てたのでcake、1つのレシピのみに制限するようなものです。あなたがそれがどこから来たのかわからないと言う3番目の点に関して、3つの被験者内要因の例とともに、私のQの最後のリンクをご覧ください。このQの下のジェイクの賛成のコメントも参照してください。彼はランダムな傾斜について言及しています。
アメーバは、モニカを復活させる

そして、aovあなたに関しては、他の要因がなければ同じ結果Error(subject/A)Error(subject)もたらすように見えますが、2つの要因を持つリンクされたスレッドから例を取り、そこにありError(subject/(A*B))Error(subject)同等ではありません。私の現在の理解では、前者にはランダムな勾配が含まれているためです。
アメーバは、モニカーを復活させる

@amoeba cakeデータセットは良い例ではありませんでした。謝罪いたします。私はそれをもう少し深く見て、おそらくより良いイラストを見つけようとするでしょう。
ロバートロング

ありがとう。更新、およびPlacidiaが準備中の更新を楽しみにしています。それまでの間、私はここで賞金を得ると思います。
アメーバは、モニカを復活させる

3

おっと。アラートコメンターは、私の投稿がナンセンスだらけだと気づきました。ネストされたデザインと反復測定デザインを混同していました。

このサイトでは、ネストされた測定と反復測定の設計の違いを詳しく説明しています。興味深いことに、著者は、固定内の固定、固定内のランダム、およびランダム内のランダムについて予想される平均二乗を示していますが、ランダム内では固定されていません。レベルAの因子がランダムに選択されると、レベルBの因子の選択がランダム性によって決定されるようになります。教育委員会から5つの学校がランダムに選択され、3人の教師が選択される場合各学校(学校に入れ子になった教師)から選択された「教師」要素のレベルは、学校のランダムな選択により、教育委員会からの教師のランダムな選択になりました。実験で使用する教師を「修正」できません。


2
+1、ありがとう。あなたの答えのすべてが私にとって理にかなっています。ただし、「ネスト」という言葉は2つの異なる意味で使用されており、これが混乱を引き起こすことに同意する必要があると思います。@RobertLongは、Bの各レベルが異なるレベルのAEgとともに発生する場合、AはBにネストされ、クラスは町などにネストされた学校にネストされると述べています。あなたは時間は被験者内にネストされていると言いますが、時間のすべてのレベルはすべての被験者で発生するので、ロバートは彼らが交差すると言います!これは、異なる「ネスト」です。右?
アメーバは、モニカを復活させる

1
あなたの例では、時間と治療が固定効果であることは明らかですが、時間が患者内にネストされていることは明らかではありません。「ネスト」の定義を教えてください。
ジョーキング

私の間違い。ネストと繰り返しの測定を混乱させていました。私は答えを変えました-再び!。
プラキディア

実際、私は今日の初めからの修正/追加であなたの元の答えが好きでした。あなたが見るように、ここで実際に「繰り返し測定」に興味があるので、私の質問には多くの有用な情報がありました(そして、「ネスト」に関する質問は単なる用語です)。前のリビジョンを保持することをお勧めします!
アメーバは、モニカーを復活させる

2
執筆中に、繰り返し測定のランダム効果が入れ子になっていることに気付き、数学がどのように機能するかと自由度をテストしたいと思います。これが釘付けになったと確信できたら、答えを拡大します!
プラキディア
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.