モデルをlmerで正しく指定しましたか?


26

私は多くのヘルプサイトを精査しましたが、混合モデルでより複雑なネストされた用語を指定する方法についても混乱しています。私もの使用など混乱しています:/|使用してランダムな因子と相互作用し、ネストを指定する際lmer()lme4パッケージR

この質問の目的のために、この標準統計モデルでデータを正確に描写したと仮定しましょう: は固定されており、

Yijk=u+stationi+towj(i)+dayk+(station×day)ik+(tow×day)j(i)k
stationtowdayランダムです。 Towは(暗黙的に)内にネストされていますstation

つまり、モデルにStation(i、fixed)、Tow(j、random、暗黙的にネストされたStation)、Day(k、random)、TowとDayの相互作用、およびDay間の相互作用が含まれることを望んでいますと駅。私は統計学者と相談してモデルを作成しましたが、現時点ではそれが私のデータの代表であると信じていますが、混乱しないように私の投稿の下部に興味がある人のために私のデータの説明も追加します。

これまでのところ、私がつなぎ合わせたのは次のとおりですlmer

lmer(y ~ station + (1|station:tow) + (1|Day) + (1|station:day) + (1|tow:day), 
     data=my.data)

これは統計モデルを正確に表していますか?コードが正しく読み取れない場合のコードの改善方法に関する提案はありますか?

lmer式で指定するのが難しい特定の用語を太字で示しています

#1。towがランダムでステーションが固定されているときにステーション内にネストされたtowは
混乱しますが、とを使用してランダムなネスト用語と相互作用用語を区別することについては混乱し:てい/ます。上記の例では(1|station:tow)、ステーション内にネストされた読み取りトウを望んでいます。私が使用しているかどうか、私は様々なサイトにコメントを相反する読んだ:か、/ランダム以内にこちら(1|...)のフォーマットlmer

#2。駅が固定され、日が変わるときの駅と日の相互作用はランダム
ですが(1|station:day)、今回は駅と日の相互作用を読み取ることを望んでいます。station * dayを使用して、駅と曜日の個々の効果とその相互作用を説明できるようです(上記の3つの用語を個別に含めるのではなく)が、これを指定する方法がわかりません一方が固定され、もう一方がランダムな場合。でしょうかstation*(1|day)しますか?

#3。牽引は(固定)駅にネストされている牽引日(両方ともランダム)の間の相互作用 次に、最後に、私が持っている(1|tow:day)、私は願っていたが、の相互作用を読み込み、towそしてday、私は牽引がネストされていることを再び指定する必要がある場合、私は思ったんだけど(暗黙的に)駅で?

私は両方に新しいですRし、lmer及び統計モデリングし、可能な場合は大幅に私の質問への応答での徹底した説明の手間を感謝しています。

データの詳細:プランクトンの濃度が近海の物理的な前線で変化するかどうかを尋ねています。この前線の内陸部、内陸部、沖合に3つのステーションがあります。したがって、ステーションは固定されています。各ステーションで、3つの複製プランクトントウを取り出します(そこから、水1立方メートルあたりのバグの数で分類、カウント、および集中度を取得します)。けん引はランダムです。3つのけん引で、その特定のステーションでのプランクトンの一般的な変動を説明したいと考えています。トウには固有のIDがないため、トウは本質的にステーションにネストされています(123,123,123は各ステーションのトウのIDです)。その後、独立した複数の日に、形成された新しい戦線でこれを行いました。私は日をブロッキング要因と考えることができると思いますか?独立した複数のフロント日でこれを繰り返すことは、日々の変動を捉え、このフロントが存在するすべての日を代表することを試みるため、日はランダムです。相互作用の用語について知り、Towsが日々変動するかどうか、またステーションが常に同様のデータを生成するのか、それとも日に依存するのかを確認したいのですが。

繰り返しますが、あなたの時間と助けに感謝します、私はそれを感謝します!


あなたの標準的な統計モデルでは、いくつかの添え字が欠落していると思います(間違えた場合、それらを追加したくありませんでした)。

1
FWIW、このスレッドに出くわして、R構文に焦点が当てられているため、トピックがオントピックであるかどうか疑問に思う人のために、指定されたモデルがネストと相互作用に関連する方法を十分に理解していますCV用。
GUNG -復活モニカ

1
私の意見では、これは100%です。

8
これらのスレッドは役に立つかもしれません:1 R's lmer cheat sheet ; 2 「混合モデル」の3つの形式の解釈merでのランダム効果の指定方法に関する3つの 質問4 追加のネスト構造を持つ反復測定データのRの線形混合モデルの指定に関する質問。(それでも、これは重複していないほど十分にはっきりしていると思います。)
グング-モニカを回復

2
lmer()構文に従って、固定の効果stationと4つのランダムインターセプトがあるモデルを指定しました。これらは、同じ(1)の組み合わせ、stationおよびtow(2)の値Day、(3)の組み合わせstationdayおよび( 4)との組み合わせtowday、それぞれ。これはあなたが意図したものですか?@BabekPで示されているように、モデルの定式化をどのように記述したかが明確ではないため、わかりません。パラメーターではなく変数名を記述しました。通常、このようなモデルでは、変数の組み合わせは下付き文字によってキャプチャされます。
マクロ

回答:


23

けん引がランダムでステーションが固定されている場合、ステーション内にけん引

station+(1|station:tow)正しい。@ジョンは彼の答えで述べたように、(1|station/tow)に拡大します(1|station)+(1|station:tow)あなたは既に固定効果として駅を指定しているので、あなたがしたくない(牽引とステーションとの間の駅プラスの相互作用の主な効果)、。

駅が固定され、日がランダムな場合の駅と日の相互作用。

固定効果とランダム効果の相互作用は常にランダムです。再び@Johnが言ったように、にstation*day展開します。モデルでstation+day+station:day既に指定dayしているため、これは(もう一度)望まないものです 。私はあなたが望むことをして、day(ランダム)とstation(固定)の交差効果を折りたたむ方法はないと思いますがstation+(1|day/station)、前の答えで指定されたように書くことができれば可能ですstation + (1|day) + (1|day:station)

けん引とステーションにけん引が入れ子になっている日の相互作用

あなたはユニークな値がないためtow、変数を、あなたのようにトウが指定されている下の言うように(すなわちので123すべての駅で、あなたがやるとして、ネスティングを指定する必要が(1|station:tow:day)。あなたはトウが一意に指定されていなかった場合は、どちらか使用することができます(1|tow:day)または(1|station:tow:day)(同等の答えを与える必要があります)この場合にネストを指定しない場合、lme4すべてのステーションでトウ#1によって共有されるランダム効果を推定しようとします...

ランダム効果を正しく指定したかどうかを診断する1つの方法は、各グループ化変数について報告された観測値の数を調べ、それが期待するものと一致するかどうかを確認することです(たとえば、station:tow:dayグループは、ステーション tow日の組み合わせの合計数:ステーションとのネスティングを忘れた場合、必要な数よりも少ない観測値が得られることがわかります。×××

あるhttp://bbolker.github.io/mixedmodels-misc/glmmFAQ.html#model-specificationhttp://bbolker.github.io/mixedmodels-misc/glmmFAQ.html#nested-or-crossedはあなたに有益な?


有益な返信と参考文献に感謝します、彼らは大歓迎です。上で説明した表記(1 | a:b)について混乱しています。「:」は「入れ子になった」だけでなく、相互作用も意味するようです。どうすれば両方を指定できますか?言い換えれば、lmerはどの関係を示しているのかをどのようにして知るのでしょうか?私はここで基本的な何かを見逃しているに違いありません、私は謝罪します。
wtree

4
このコンテキストでは、相互作用とネストの間にはそれほど違いはありません。かどうかはBにネストされA、それはの主な効果かどうかに依存してか、単に相互作用Aモデルかに含まれています。主な効果は場合B、モデルでそれが交差しています...
ベンBolker

こんにちは、stats.stackexchange.com / questions / 272377 /に関連する質問をしました。誰か(特に@BenBolker)が答えを探して提供する機会がある場合。
ジョシュアローゼンバーグ

11

フォーミュラ内のいくつかの事柄は少しわかりにくいです。:しながら、二つの用語の間の相互作用のためである*主効果および相互作用のためです。/相互作用のための別の一つですが、何それがないと、分母(たとえばにおける用語の分子と全ての間の相互作用を発生さですA/(B+C) = A:B + A:C)。これ|は、「グループ化」などのようなものです。だから、1|station駅ごとにグループ化されたインターセプトであり、括弧内はランダムです(1|station)です。これが、ネストの方法です。

うまくいけばそれが助けになります。固定効果内にランダム効果をネストするのは少し奇妙で、それをどのように表現するかわかりません。私も状況を想像することはできません。変数が何であり、何を達成したいのかを説明すると、より良い応答が得られる場合があります。多くの場合、人々は質問をし、用語を間違って使用しており、コミュニケーションが困難です。変数が何を表し、それらについて知りたいことを説明します。

最後の段落の説明に焦点を当てると、けん引は収集したサンプルの単なる指標であり、けん引1が何らかの形でけん引2と一貫して異なると予想されるという意味での推定が必要なものではないようです。トウは単にサンプルを示しています。牽引の順序が重要であると本当に信じていない限り、その変数に煩わされることさえありません。そして、それらが重要であれば、それは固定された効果です(そして、たぶんランダムではありますが、ランダムな効果だけではありません)。あなたは、トウの変動性が日々変化するかどうかを知りたいと言います。答えはイエスですか?それらが日々変化しないという現実的な確率の領域ではありません。それは単にあなたの測定値の分散です。君は' エラーのために分散が残っていないため、分散のすべての仕様を説明しようとすることはできません。過剰に指定されたモデルがあるでしょう。各メジャーをレポートするだけの時点になります。

あなたは駅が日ごとに変わるかどうか疑問に思うことについて同様の声明を出します。もちろんそうです。しかし、特定の日を意味するのでしょうか?日は、季節、月の周期などによって何らかの形でグループ化されましたか?これが1日目以外の何かを持っている場合を除き、これは2日目などです。そのため、その質問への答えは、もちろん駅は日々異なるということです。そしてもちろん、けん引は日々、駅ごとに異なります。最後に、単純なモデルを作成します。

aov(y ~ station, data = dat)

ここにある固定された効果の1つであるステーションは、複数のトウと複数の日にわたってサンプリングされています。ここでマルチレベルモデリングが本当に必要かどうかはわかりません。モデルを過剰に指定しているようです。

ランダムな日中および牽引効果が本当に必要で、ここで指定していない情報がある場合は、それをマルチレベルモデルに拡張することができます。それは:

lmer(y ~ station + (two*day|station), data = dat)

ただし、そのモデルを使用するには、各駅と日に複数の牽引車が必要です。


私はあなたが言ったことすべてに同意しますが、これはおそらく答えよりもコメントのほうが多いと思います。
マクロ

@John私は「それがあなたがネストする方法」になるまであなたと一緒にいました。私はあなたがどのようにネストするかという実際のポイントを見逃したと思います。もっと詳しく説明してもらえますか?私はまだ混乱していると思う| さらに詳しく調べます。しかし、あなたの応答から、たとえば、けん引(ランダム)がステーション内にネストされている(固定されている)ことを示す方法がわかりませんか?
wtree

@John Ohおよびステーションは、海洋の関心のあるサイト/場所として固定されています。これらのサイトでプランクトントウを取っているのはランダムであるためです。駅でのプランクトンの数を表します。
wtree

1
サンプルのすべてのラベルがランダム変数ではありません。編集を参照してください。
ジョン

1
その説明が与えられれば、私はまだモデルにトウを含めるべきではないと思います。でも、一日はいいですね。
ジョン
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.