余分な変数を調整すると、OLSの推定にバイアスがかかりますか?


8

OLSの余分な変数を調整するための通常の教科書の扱いでは、推定量はまだ偏っていませんが、分散が大きい可能性があります(たとえば、Greene、Econometric Analysis、第7版、58ページを参照)。

先日、Judea Pearlによるシンプソンのパラドックスの扱いと、「制御変数を回帰モデルに段階的に含めることで、すべてのステップで推定因果関係の兆候が切り替わる」ことをシミュレートする素晴らしいWebページを偶然見つけました。私にとって、これは上記のステートメントとはどういうわけか矛盾しています。これは非常に微妙な(非常に重要ですが)問題になる可能性があるので、他の文献へのポインタがあれば非常に役立ちます。特に私を驚かせるものは、グリーンが彼の評価の証拠を持っていると主張していることです。

回答:


10

矛盾はありません。

そこでの最初の段落は、余分な変数について話します。

シンプソンのパラドックスが当てはまる場合、変数は不要ではありません。


1
ウェブサイトで提起されている問題では、Z1とZ2を調整すると、推定値に偏りが生じます。Z1は実際には不要ではないようですが、Z2はどうですか?構造上、XとYのどちらにも影響しませんが、それを含めると推定にバイアスがかかります。
Julian Schuessler、2014年

2
これらの変数間の正確な関係に応じて、他の独立変数の1つと非常に高い相関を持つ余分な変数は、符号の反転につながる可能性があります。これは、多重共線性に関する部分のGreeneブックでも説明されています。高レベルの多重共線性は、特異点に近いため、不安定で信頼性の低い係数につながる可能性があると彼は述べています。
アンディ

以前のコメントは@JulianSchuesslerの方が多かったことを述べておきます。Glen_bの答え+1
Andy

3
Z2はXまたはYを引き起こしませんが、監視されていない変数Uを介してXに、およびZ3を介してYに接続されます。したがって、XとYの両方と相関しています。「過剰」を「独立」として定義した場合、グリーンは正しいです。XとYに依存しない変数Zの条件付けは、推定にバイアスをかけません(独立が「不誠実」な場合を除いて)因果関係に)。多重共線性は別の問題だと思います。「コライダー」変数の条件付けによるバイアスは、変数間の非常に高い依存性を必要とせず、推定の分散を拡大しません。d
リジーシルバー

@LizzieSilver:おかげで、これは私の現在の理解でもあり、Pearlの作業をさらに詳しく見てきました。適切なリグレッサを含めることですべてのバックドアパスをブロックすると、公平な見積もりが得られます。ただし、XとYの両方と相関している可能性のある誤った変数を調整すると、対象の変数の因果効果の推定値が偏ることがパールの研究から明らかです。だから私はいつもの公平さの証明をどうするのだろう。間違った回帰は偏りがないかもしれませんが、その中の係数は因果効果ではなく、他の何かと等しいですか?
Julian Schuessler、2015年

5

想定される線形回帰モデルを検討する

y=b0+b1バツ1+b2バツ2+あなた=1

代数の問題として(確率論的な仮定ではありません)、行列表記のOLS推定量は

b^=b+バツバツ1バツあなた

したがって、リグレッサマトリックスを条件とする期待値は、

Eb^|バツ=b+バツバツ1バツEあなた|バツ

Eあなた|バツ=0

Eb^|バツ=b+0Eb^=b

繰り返し期待の法則も使用します。

バツ2

バツ2yバツ1バツ2

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.