回帰に平方変数を含めるとどうなりますか?


20

OLS回帰から始めます ここで、Dはダミー変数で、推定値は低いp値でゼロとは異なります。次に、Ramsey RESETテストを実行し、方程式の誤認があることを発見しました。したがって、xの2乗を含みます Y = β 0 + β 1 X 1 + β 2 X 2 1 + β 3 D + ε

y=β0+β1x1+β2D+ε
y=β0+β1x1+β2x12+β3D+ε
  1. 二乗項は何を説明しますか?(Yの非線形増加?)
  2. これを行うことにより、私のp推定値はゼロから変化せず、p値が高くなります。(一般的に)方程式の2乗項をどのように解釈しますか?

編集:質問を改善します。



1
推定理由:とが変動性を説明しているように見える D yx12Dy
安定した魚

3
役立つかもしれないことの1つは、2乗項を作成する前にを中央に配置することですこちらを参照)。二乗項の解釈については、を全体として解釈するのが最善であると主張します(こちらを参照)。もう1つは、相互作用が必要な場合があることです。つまり、追加することです。x β1x1+β2x12 β4x1D+β5x12D
GUNG -復活モニカ

私はそれが本当にその質問の複製だとは思わない。解決策は異なります(変数のセンタリングはここで機能しますが、間違えない限り、ここでは機能しません)
ピーターフロム-モニカの復職

@Peter、この質問を「なぜモデルに変数を追加すると、他の変数の効果推定/値が変化するのか?」のサブセットとして解釈します。これは他の質問で対処します。その質問への回答の中には、共線性(その質問への彼の回答で言及されいる)/予測子間のコンテンツの重複(つまり、と間)があります。ここでも同じロジックが適用されます。論争が何であるかはわかりませんが、あなたと他の人が同意しないならそれは問題ありません。乾杯。D x 1x 2 1pD(x1,x12)
マクロ

回答:


21

さて、最初に、ダミー変数は切片の変化として解釈されます。つまり、係数は、場合、つまり場合、切片が場合に切片の差を示します。二乗追加しても、その解釈は変わりません。 D = 1つのD = 1 β 0 + β 3 X 1β3D=1D=1β0+β3x1

ここで、シリーズに2乗を追加するポイントは、特定のポイントで関係が消滅すると想定することです。2番目の方程式を見る

y=β0+β1x1+β2x12+β3D+ε

派生WRTの撮影収量をx1

δyδx1=β1+2β2x1

この方程式を解くことで、関係の転換点がわかります。user1493368が説明したように、これは実際に場合は逆U字型を反映しており、逆も同様です。次の例をご覧ください。β1<0

y^=1.3+0.42x10.32x12+0.14D

導関数wrtはx1

δyδx1=0.4220.32x1

を解くとx1

δyδx1=0x10.66

それが、関係に転換点があるポイントです。問題を視覚化するために、上記の関数に対するWolfram-Alphaの出力を見ることができます。

変化のceteris paribus効果解釈する際に、覚えておいてください上、あなたが式を見ています: yx1y

Δy=(β1+2β2x1)Δx

つまり、二乗回帰変数を追加すると、を単独で解釈することはできません!X 2 1β1x12

平方を含めた後の重要でないについては、仕様の誤りのバイアスを示しています。x 1Dx1


こんにちは。予測変数が複数ある場合、偏微分または全微分(微分)を使用する必要がありますか?
スカン

1
偏微分はまだここに行く正しい方法です。すべての係数の解釈はceteris paribusです。つまり、他のすべてを一定に保ちます。それはまさに偏微分をとるときあなたがしていることです。
-altabq

@altabqのすばらしい回答を補足するために、このUCLA IDREページを参照してください。
シリル

19

変数の平方を含める良い例は、労働経済学です。y賃金(または賃金のログ)およびx年齢として想定する場合、含めるx^2ことは、年齢と賃金収入の間の2次関係をテストしていることを意味します。人が経験を積むにつれて、賃金は年齢とともに増加しますが、年齢が高くなると、賃金は減少率で増加し始め(人々は年を取り、以前ほど働けなくなります)、ある時点で賃金が伸びません(最適な賃金水準に達した後)低下し始めます(退職し、収入が減少し始めます)。したがって、賃金と年齢の関係は逆U字型です(ライフサイクル効果)。一般に、ここで言及されている例では、係数on ageは正であり、onage^2ここでのポイントは、変数の二乗を含めるための理論的根拠/経験的正当化が必要であることです。ここでのダミー変数は、労働者の性別を表すと考えることができます。性別と年齢の相互作用用語を含めて、性差が年齢によって異なるかどうかを調べることもできます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.