モデルに線形項ではなく二次項を追加するのは理にかなっていますか?


57

私は(混合)モデルを持っています。このモデルでは、予測子の1つが(実験的な操作のために)予測子に2次関数的にのみ関連付けられる必要があります。したがって、二次項のみをモデルに追加したいと思います。次の2つの理由により、そうすることができません。

  1. 高次の多項式をあてはめるときは、常に低次の多項式を含めるべきだと読んだと思います。見つけた場所を忘れてしまい、調べた文献(たとえば、Faraway、2002; Fox、2002)では、良い説明が見つかりません。
  2. 線形項と二次項の両方を追加すると、両方が重要になります。それらの1つだけを追加する場合、それらは重要ではありません。ただし、予測変数とデータの線形関係は解釈できません。

私の質問のコンテキストは、具体的にはを使用した混合モデルlme4ですが、なぜ高次の多項式ではなく高次の多項式を含めるのが良いのか、なぜいけないのかを説明できる答えを得たいと思います。

必要に応じて、データを提供できます。


5
この質問への答えが役立つと思います。

6
はい、私は先延ばしに同意し、相互作用の質問は本質的に同じ考慮事項です。このトピックに関するいくつかの非常に投票された質問があります。Proの提案に加えて、すべての相互作用の用語は回帰モデルで個々の用語を必要としますか?も参照してください。そして、相互作用が回帰の直接的な影響を一掃した場合はどうなりますか?
アンディW

これらの質問を思い出させてくれてありがとう。そこに与えられた答えから、二次項のみを含めてそれ自体が間違っていないという先験的な理由があれば、それは大丈夫な戦略であると思われます。残っている問題は、スケーラビリティに関するものです(stats.stackexchange.com/a/27726/442を参照)。二次項のみを使用する場合、近似する前に変数を中央に配置する必要がありますか?
ヘンリック

1
@Henrik-あなたが投稿したリンクの私の答えは、モデルの推論が予測値の任意のシフトに依存する方法に関するものでした(平均センタリングなど)-実質的な結論を持つことが望ましくないものに依存するのは望ましくないので、同じ理由で、質問は「いいえ」です。
マクロ

2
二次対線形の問題は、相互作用とは概念的に十分に異なるため、これを重複と見なすべきではないと思います。
GUNG -モニカ元に戻し

回答:


66

1.なぜ線形項を含めるのですか?

二次関係が次の2つの方法で記述できることに気付くのは明らかです。

y=a0+a1x+a2x2=a2(xb)2+c

(ここで、係数をすると、および)。値は、関係のグローバルな極値に対応します(幾何学的には、放物線の頂点を特定します)。a 2 b 2 + c = a 0 x = b2a2b=a1a2b2+c=a0x=b

線形項含めない場合、可能性はa1x

y=a0+a2x2=a2(x0)2+c

(ここで、明らかに、あり、モデルに定数項が含まれると仮定されます)。つまり、を強制します。c=a0a0b=0

これに照らして、質問#1は、グローバルな極値が発生しなければならないことを確信できるかどうかにかかっています。もしそうなら、線形項安全に省略できます。それ以外の場合は、含める必要あります。x=0a1x

2.用語の包含または除外に伴う重要性の変化を理解する方法は?

これについては、https://stats.stackexchange.com/a/28493の関連スレッドで詳細に説明されています

この場合、の有意性は関係に曲率があることを示し、の有意性はが非ゼロであることを示します。両方の項(もちろん定数も)を含める必要があるようです。a2a1b


1
ありがとうwhuber。素晴らしい答え。したがって、理論上の極値を0(実際には最小値)に集中させると、線形項を省略しても問題ありません。これにより、非常に重要な2次予測子(線形予測子なし)が実現します。
ヘンリック

変数の線形項と2次項の両方が相関している場合、それらの両方をモデルに含めることができますか、それとも1つを除外する必要がありますか(2次項であると仮定します)。
mtao

@Teresa回帰で相関する用語を削除する一般的な理由はありません。(そうだとすると、これまでに作成された回帰モデルの大部分が問題になります!) どちらかの用語だけと比較して、モデルの適合に意味のあるものは何も貢献しない非常に強く相関する用語は、それらの用語のサブセットに減らすことができます。
whuber

@whuber、どうもありがとう!また、ロジスティック回帰モデルでは、オッズ比を使用して効果サイズを推定しましたが、線形項のみを使用しました。線形と二次がある場合、同じアプローチを使用して、同じ方法で結果を解釈できますか?
mtao

そうでもない。その理由は、線形項と2次項を別々に変更できないためです。元の変数を少し変更すると、応答がどのように変化するかを考慮する必要があります。
whuberの

22

@whuberはここで本当に優れた答えを出しました。ちょっとした無料ポイントを追加したいだけです。質問は、「予測子とデータの線形関係は解釈できない」と述べています。これはよくある誤解を示唆していますが、私は通常、反対側でそれを聞きます(「2乗(立方体など)の用語の解釈は何ですか?」)。

複数の異なる共変量を持つモデルがある場合、通常、各ベータ[用語]に独自の解釈を与えることができます。たとえば、次の場合:

GPA^college=β0+β1GPAhighschool+β2class rank+β3SAT,

(GPAは成績平均点を意味します;
ランクは同じ高校の他の生徒と比較した生徒のGPAの順序です;&
SATは「学力適性試験」を意味し ます。

その後、各ベータ/用語に個別の解釈を割り当てることができます。たとえば、生徒の高校のGPAが1ポイント高い場合(他のすべてが等しい場合)、大学のGPAはポイント高くなると予想されます。 β1

ただし、この方法でモデルを解釈することが常に許可されるとは限らないことに注意することが重要です。明らかなケースの1つは、個々の用語が異なっていても他のすべてを一定に保つことができないため、いくつかの変数間で相互作用がある場合です。必要に応じて、相互作用用語も変わります。したがって、相互作用がある場合、よく理解されているように、主な効果ではなく単純な効果のみを解釈します。

べき乗項のある状況は直接類似していますが、残念ながら、広く理解されていないようです。以下のモデルを考える: (この状況では、原型連続共変量を表すことを意図している。)ことは不可能であるなく変更するも変化し、およびその逆。簡単に言えば、モデルに多項式の項がある場合、同じ基礎となる共変量に基づいたさまざまな項には個別の解釈は与えられません。 など)という用語は、任意の独立した意味を有していません。 その事実

y^=β0+β1x+β2x2
xxx2x2xx17p-power多項式の項は、モデルで「有意」であり、および関連する関数に「曲がり」があることを示します。曲率が存在する場合、解釈はより複雑になり、場合によっては直感的ではなくなることは残念ですが、避けられません。変化を評価するにはなどの変化を、私たちは、微積分を使用する必要があります。上記のモデルの誘導体である: の期待値の変化の瞬間速度であるとして変化、他のすべてが等しいです。これは、最上位モデルの解釈ほどきれいではありません。重要なのは、瞬間的な変化率p1xyy^x
dydx=β1+2β2x
yxy は、変更が評価されるのレベルに依存しますx。さらに、の変化率は瞬間的な率です。つまり、からの間隔全体でそれ自体が連続的に変化しています。これは単に曲線関係の性質です。 yxoldxnew

1
優れた応答!これは、ユーザーchlがインタラクション効果の解釈に関して提供したいくつかの優れた応答を思い出させます。彼はこの応答で記事の参照を提供します。相互作用の影響を特定する際のベストプラクティスは何ですか?。そして、この応答でコプロットを使用して相互作用をグラフィカルに表示する素晴らしい例を示します。2つの連続変数間で相互作用は可能ですか?
アンディW

1
Gungの答えに対して、統計的モデリングには、多項式回帰モデルの詳細を隠すことができるノイズが含まれていると言いたいだけです。ビル・フーバーが提起したセンタリングの問題は、ある形式では線形項が欠落し、別の形式では二次項で発生するため、グレタの問題であったと思います。信号の曲率の強さは、1次よりも高い項の必要性を示しますが、実際には線形項の必要性についても何もわかりません。
マイケルチャーニック

7

上記の @whuberの答えは、線形項を省略することは「通常の」二次モデルであるということは、「極値があることを絶対に確信している」と同等であることを指摘する上で目標にぴったりです。x=0

ただし、使用しているソフトウェアに「落とし穴」があるかどうかも確認する必要があります。一部のソフトウェアは、多項式のセンタリングをオフにしない限り、多項式を近似して係数をテストするときにデータを自動的にセンタリングする場合があります。つまり、ような式に適合しここで、はの平均です。これは、極値を強制します。 ˉ X X X = ˉ XY=b0+b2(xx¯)2x¯xx=x¯

線形項と二次項の両方を入力すると重要になるというステートメントには、明確化が必要です。たとえば、SASはその例のタイプIおよび/またはタイプIIIテストを報告する場合があります。タイプIは、2次を入れる前に線形をテストします。タイプIIIは、モデルの2次で線形をテストします。


2
これは妥当なポイントですが、を作成する前にデータを中央に配置しただけでは、「極値があることを完全に確信できる」ということにはなりません。言うと、前に「極値は」と言ったことと同じです。どちらの場合でも、無限精度の極値のx値を指定する能力にモデルの不偏性を賭けています。b / t Type IとType IIIテストの違いも興味深い可能性がありますが、nb、とが相関している場合、つまりセンタリングが発生していない場合にのみ異なります。、X = 0 、X = ˉ X X X 2x2x=0x=x¯xx2
gung-モニカの回復

別の注意として、ユーザー名を「アット」記号で示すことで、ユーザーの貢献を参照できます。たとえば、この場合、「@ whuberの答えは目標にぴったりです...」(同意する感情)
グング-モニカの復職

1
Emil、これらのリマインダーを提供してくれてありがとう:両方とも心に留めておく価値があります。
whuber

3

Brambor、Clark and Golder(2006)インターネットの付録に付属)は、相互作用モデルを理解する方法と、(ほとんど)常に低次の用語を含める必要がある理由を含め、一般的な落とし穴を回避する方法について非常に明確な見解を持っています(相互作用モデルの「構成用語」)。

アナリストは、非常にまれな状況を除いて、乗法的相互作用モデルを指定するときにすべての構成用語を含める必要があります。構成用語とは、相互作用用語を構成する各要素を意味します。[..]

ただし、乗法的相互作用モデルはさまざまな形式をとることができ、などの2次項またはなどの高次の相互作用項を含む場合があることに。相互作用用語がどのような形式をとっても、すべての構成用語を含める必要があります。したがって、相互作用項がある場合に含まれるべきである及び、、、、、及び相互作用項がある場合に含まれるべきである。 X Z J X X 2 X Z J X Z X J Z J X Z JX2XZJXX2XZJXZXJZJXZJ

そうしないと、モデルの指定が不十分になり、推定値に偏りが生じる可能性があります。これにより推論エラーが発生する場合があります。

これはケースであり、場合どちらかと相関する(または)における実質的に任意の社会科学の状況を発生するように、その後、構成用語を省略すると、のバイアスされた(および一貫性のない)の推定をもたらすであろう、、および。常にそのように認識されているわけではありませんが、これは変数バイアスが省略された単純なケースです(Greene 2003、pp。148–149)。X Z X Z β 0 β 1 β 3ZXZXZβ0β1β3

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.