私がこの質問を明確に回答できるように表現したことを心から望んでいます。もしそうでなければ、私に知らせて、もう一度やり直します!また、これらの分析にはRを使用することにも注意してください。
私がplant performance (Ys)
課した4つの治療法の影響を受けたと思われるいくつかの測定値flower thinning (X1), fertilization (X2), leaf clipping (X3)
がありbiased flower thinning (X4)
ます- 、および。考えられるすべてのYについて、Nは少なくとも242なので、サンプルサイズが大きくなりました。すべてのプロットは間引きを行ったか、行わなかったかのいずれかですが、各プロットは他の3つの処理のうちの1つ(および1つのみ)も処理しました(または処理しませんでした-コントロールプロットもありました)。このデザインのアイデアは、他の3つの処理が、間引きの効果を「マスキング」または「強化」できるかどうかをテストすることでした。したがって、設計上、後者の3つの処理(X2〜X4)は交差しなかったため、互いに相互作用することはできませんでしたが、それぞれ花の間引きと相互作用することができます。
私の明確な仮説は、1)花が薄くなることは重要であり、2)X1*X2, X1*X3, and X1*X4,
花が薄くなることと他の3つの処理の間の相互作用項も重要であることです。つまり、花の間引きは重要なはずですが、それが重要である方法は、他の3つの処理が何をしたかによって大幅に変更されるべきです。
このすべての情報を混合モデルに含めたいのですが。
Y ~ X0 + X1 + X2 + X3 + X4 + X1*X2 + X1*X3 + X1*X4 + (Up to three random effects)
しかし、ハングアップが1つあります。私は、Yの間引きの効果が非線形であることを信じる十分な理由があります。それらはおそらく2次式ですが、場合によっては3次式であることもあります。これは、間引きのパフォーマンスへの影響が、間引きのレベルが高いほど速く増加する可能性が高いためです。X1の2次および3次の項を追加することにより、上記の方程式を介してこの非線形関係をモデル化しようとすると、相互作用項をモデル化する方法がわかりません-X1の可能なすべての組み合わせ(X1)^ 2、(X1)^ 3 * X2、X3、X4?私が持っているデータポイントの数があったとしても、それは推定しようとする多くのパラメーターのようであり、得られる結果を解釈する方法がわかりません。とはいえ、これが状況をモデル化するための無作法な方法であると考える生物学的な理由はありません。
したがって、私はこの問題に対処する方法について3つの考えがあります。
- たとえば
Y ~ X1 + X1^2 + X^3 + Random effects
、間引きとYの関係が線形、2次、または3次のいずれであるかを把握することを唯一の目的として、最初に小さいモデルを適合させ、次に、平方根または立方根を介して間引きを変換して、関係を適切に線形化します。そこから、相互作用項は、変換された変数を使用して上記のようにモデル化できます。- 重要な相互作用が発生した場合、X1項の1つだけ(つまり、線形、2次、3次の項のみ)に影響を与え、それに応じて相互作用をモデル化すると仮定します。このアプローチが理にかなっているかどうかさえわかりません。
- 上記のように、「完全なモデル」を、間引き条件と他の処理の間のすべての可能な相互作用条件に適合させます。次に、重要ではない相互作用の項を削除し、グラフやその他の手法を使用して結果を解釈します。
モデルの選択ではなく仮説検定に興味があるとすれば、これらのアプローチのどれが最も適切であり、その理由は何ですか?具体的には、上記第1位あればしない感覚を行うために作る、それはなぜですか?私はこの記事とこの記事を読んで、それらが私にとって何を意味するのかを要約しようとしましたが、さらに読むための情報源も高く評価されます!