説明変数の1つが2次および3次の項を持つ可能性がある場合、説明変数間の相互作用をどのようにモデル化すればよいですか?


10

私がこの質問を明確に回答できるように表現したことを心から望んでいます。もしそうでなければ、私に知らせて、もう一度やり直します!また、これらの分析にはRを使用することにも注意してください。

私がplant performance (Ys)課した4つの治療法の影響を受けたと思われるいくつかの測定値flower thinning (X1), fertilization (X2), leaf clipping (X3)がありbiased flower thinning (X4)ます- 、および。考えられるすべてのYについて、Nは少なくとも242なので、サンプルサイズが大きくなりました。すべてのプロットは間引きを行ったか、行わなかったかのいずれかですが、各プロットは他の3つの処理のうちの1つ(および1つのみ)も処理しました(または処理しませんでした-コントロールプロットもありました)。このデザインのアイデアは、他の3つの処理が、間引きの効果を「マスキング」または「強化」できるかどうかをテストすることでした。したがって、設計上、後者の3つの処理(X2〜X4)は交差しなかったため、互いに相互作用することはできませんでしたが、それぞれ花の間引きと相互作用することができます。

私の明確な仮説は、1)花が薄くなることは重要であり、2)X1*X2, X1*X3, and X1*X4,花が薄くなることと他の3つの処理の間の相互作用項も重要であることです。つまり、花の間引きは重要なはずですが、それが重要である方法は、他の3つの処理が何をしたかによって大幅に変更されるべきです。

このすべての情報を混合モデルに含めたいのですが。

Y ~ X0 + X1 + X2 + X3 + X4 + X1*X2 + X1*X3 + X1*X4 + (Up to three random effects)

しかし、ハングアップが1つあります。私は、Yの間引きの効果が非線形であることを信じる十分な理由があります。それらはおそらく2次式ですが、場合によっては3次式であることもあります。これは、間引きのパフォーマンスへの影響が、間引きのレベルが高いほど速く増加する可能性が高いためです。X1の2次および3次の項を追加することにより、上記の方程式を介してこの非線形関係をモデル化しようとすると、相互作用項をモデル化する方法がわかりません-X1の可能なすべての組み合わせ(X1)^ 2、(X1)^ 3 * X2、X3、X4?私が持っているデータポイントの数があったとしても、それは推定しようとする多くのパラメーターのようであり、得られる結果を解釈する方法がわかりません。とはいえ、これが状況をモデル化するための無作法な方法であると考える生物学的な理由はありません。

したがって、私はこの問題に対処する方法について3つの考えがあります。

  1. たとえばY ~ X1 + X1^2 + X^3 + Random effects、間引きとYの関係が線形、2次、または3次のいずれであるかを把握することを唯一の目的として、最初に小さいモデルを適合させ、次に、平方根または立方根を介して間引きを変換して、関係を適切に線形化します。そこから、相互作用項は、変換された変数を使用して上記のようにモデル化できます。
  2. 重要な相互作用が発生した場合、X1項の1つだけ(つまり、線形、2次、3次の項のみ)に影響を与え、それに応じて相互作用をモデル化すると仮定します。このアプローチが理にかなっているかどうかさえわかりません。
  3. 上記のように、「完全なモデル」を、間引き条件と他の処理の間のすべての可能な相互作用条件に適合させます。次に、重要ではない相互作用の項を削除し、グラフやその他の手法を使用して結果を解釈します。

モデルの選択ではなく仮説検定に興味があるとすれば、これらのアプローチのどれが最も適切であり、その理由は何ですか?具体的には、上記第1位あればしない感覚を行うために作る、それはなぜですか?私はこの記事この記事を読んでそれらが私にとって何を意味するのかを要約しようとしましたが、さらに読むための情報源も高く評価されます!

回答:


7

これらのアプローチはどれも適切に機能しません。アプローチ3.が近づきましたが、その後、重要ではない用語をプルーニングすると述べました。共線形性により、削除する項を見つけることが不可能になり、また、タイプIのエラーを維持したい場合、仮説検定で誤った自由度が与えられるため、これは問題があります。

問題の有効なサンプルサイズと信号:ノイズ比に応じて、モデルをすべての積項と主効果項に適合させ、プロットと「チャンクテスト」(関連する項の複数のdfテスト、つまり、全体的な相互作用のテスト、非線形相互作用のテスト、主効果+相互作用を含む全体的な効果のテストなど)。R rmsパッケージを使用すると、標準の単変量モデルと、が多変量正規である場合の縦断モデルでこれを簡単に行うことができます。例:Y

# Fit a model with splines in x1 and x2 and tensor spline interaction surface
# for the two.  Model is additive and linear in x3.
# Note that splines typically fit better than ordinary polynomials
f <- ols(y ~ rcs(x1, 4) * rcs(x2, 4) + x3)
anova(f)   # get all meaningful hypothesis tests that can be inferred
           # from the model formula
bplot(Predict(f, x1, x2))    # show joint effects
plot(Predict(f, x1, x2=3))   # vary x1 and hold x2 constant

anovaテーブルを見ると、All Interactionsモデル全体ですべての交互作用項の結合された影響をテストするラベルが付いた線が表示されます。個々の予測変数の場合、これは予測変数が複数の変数と相互作用する場合にのみ役立ちます。printメソッドには、anova.rmsゼロに対してテストされているパラメーターを正確に表の各行で表示するためのオプションがあります。これはすべて、カテゴリー予測子と連続予測子の混合で機能します。

通常の多項式を使用する場合は、のpol代わりにを使用してくださいrcs

残念ながら、私は混合効果モデルを実装していません。


1
この回答をありがとう。これまでスプラインを使用したことはありませんが、あなたの例は理解できたと思います。よろしければ、いくつか質問があります。1.あなたの例のように、ANOの結果をOLから見ると、因子の下の「すべての相互作用」は何を意味しますか?つまり、何とのすべての相互作用?2.混合モデリングアプローチでも同様のアプローチが許容されますか?ランダムな要素が必要だと思います。あなたの例は、例えばlme4と互換性がありますか?3.相互作用する治療の一部が断定的である場合、これは機能しますか?たとえば、X2が2レベルの因子である場合はどうなりますか?
Bajcz 2014年

2

私はノンパラメトリック平滑化回帰を使用して、従属変数と予測子の間の関係の関数形式を評価するのが好きです。その後、パラメトリック回帰モデルを推定するときでもです。私は非線形関係を非常に頻繁に見つけましたが、主効果が非常に非線形である場合でも、非線形相互作用の相互作用の項を見つけたことはありません。私の持ち帰り:相互作用効果は、それらが含まれる予測子と同じ関数型で構成される必要はありません。


つまり、明確にするために、オプション#2を選択した場合、相互作用の項を線形X1項に安全に含めることができ、「高次の相互作用項」(X1 ^ 2 * X3など)を気にしないで済みますか?
Bajcz 14年

1
@Bajczええと...私は2つのことを言っていると思います:(1)線形のみの相互作用で遭遇したデータセットでうまくいくことができましたが、(2)見てみたい(ノンパラメトリック回帰を使用)非線形の代替案を検討する必要があるかどうかをデータに教えてください。[非線形項へのモデルフィットまたは仮説検定のアプローチを取ることは、IMOがそれを処理する間違った方法です。これは、たとえば、データ自体ではなく、たとえば、多項式の任意のセットに基づく推論を伴うためです。]
Alexis 14年

3
相互作用が線形である可能性が高いと信じる大きな理由はありません。非線形相互作用の素晴らしい例に出くわしました。「見ている」と「データから教えてもらう」という考えには、信頼区間のカバレッジの問題など、推論の問題があふれています。
フランクハレル2014年

1
@FrankHarrellありがとうございます!あなたの最初の文は、上のコメントの私の(2)で伝えようとしていた点です(私の過去の経験は将来劇的に変わる可能性があります)。OTOH:データに語らせないことは、モデリングの仮定のアーティファクトに関する推論を実際のデータに関する推論に代入するための優れた戦略です。
Alexis 14年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.