「制御変数」も内生的な場合はどうなりますか?


13

私は政治経済学で働いており、多くのモデルには人口、不平等、植民地時代の遺産などの「無実の」制御変数が含まれているため、著者は関心のある独立変数に偏りがないと主張できます。

しかし、これらの制御変数のいずれかがいくつかの省略された変数に内在している場合、これはすべての独立変数の不偏性を汚染しませんか?

それが本当なら、私たちは何ができますか?これらの制御変数を除外すると、変数バイアス自体が省略されます。それらを含めると、モデル内のすべてを汚染します。

例:研究者は暴力に不等式リードを知りたい、と彼はいくつかのコントロール: いることを見て不平等はおそらく内因性であることを(あります省略された変数の利他主義のレベルのため)、彼はInequalityの道具変数を見つけようとします。しかし、成長発達も内生的(つまり、利他主義のレベルと相関している)ではないでしょうか?

Violence=Inequality+Growth+Development+ϵ

この例は馬鹿げているように見えるかもしれませんが、私の論点は政治経済/開発作業にあり、LHSに含まれる多くの変数が内生的であると思うので、非常に多くの要因があります(まだ省略されています)。しかし、多くの場合、研究者は自分のペットの独立変数のみの楽器を探します。


さらに考慮すべきもう1つのことは、いわゆる「不良コントロール」問題です。これは、コントロールが結果変数そのものである状況です。AngristとPischkeの有名な「Mostly Harmless Econometrics」のセクション3.2.3を読んで、このトピックを理解し、質問をよりよく理解したい場合に重要な理由を理解することをお勧めします。
-MauOlivares

回答:


10

「しかし、これらの制御変数のいずれかがいくつかの省略された変数に内因性である場合、これはすべての独立変数の不偏性を汚染しませんか?」

私はこれをあまり強調したくありませんが、これは一般的に真実ではないことを言及する価値があります。次の導出は、あなたが言及する「汚染」についてある程度理解することを願っています。簡単な反例として、データ生成プロセスが与えられ 、が観測されないものと仮定し ます。レッツ、、および 。そして、が「内生的」であることは明らかです。ただし、であるため、推定値は依然として問題ないことに注意してください。 Z C O V X 1Z = 0 C O V X 2Z 0 C O V X 1

Y=X1β1+X2β2+Zγ+ε,
ZCov(X1,Z)=0Cov(X2,Z)0X 2 C o v X 1Cov(X1,X2)=0X2β 1 PLIMCov(X1,Z)=0β1X * 1 =M2X1M2=[I-X2X ' 2 X2-1X ' 2 ]COVX1X2=0X1 =X1Co
plimβ^1=β1+γCov(X1,Z)Var(X1)=β1,
ここでおよび。そのため、。したがって、です。X1=M2X1M2=[IX2(X2X2)1X2]Cov(X1,X2)=0X1=X1Cov(X1,Z)=0

"私たちは何ができる?"

優れた計量経済学の主な課題の1つは、潜在的な識別戦略を考えることです。あなたが説明するタイプの状況では、おそらくあなたが別の方法で問題にアプローチしようとする以外にできることは何もありません。


技術的には正しいですが、この点を強調しません。私はむしろ、一般的に、我々はのbiasedness排除できないことを言うと思います任意の変数のを、代わりに言っていくつかのシナリオでは、その[OK]を、我々は通常、DGPを知らないので、よく、。
FooBar

1)この方法でが派生するリファレンスを教えてください。私は計量経済学でこれを教えられませんでした。2)証明でをどこで使用しますか?それはのように思える十分です。3)は例外であり、標準ではないという@FooBarに同意します。実際、場合、最初にを制御する必要はありません(精度を上げる場合を除く)。 COVX1Z=0COVX1X-2=0COVX1X2=0COVX1X2=0X2β^Cov(X1,Z)=0Cov(X1,X2)=0Cov(X1,X2)=0Cov(X1,X2)=0X2
ハイゼンベルク

@FooBar、同意します。これが特別なケースであることを強調するために、投稿を更新しました。DGPを知らないという点に関しては、それは事実です。しかし、それはポイントではありません。分析はすべてDGPについての仮定を行う必要があり、分析の品質は仮定の品質に依存します。私が与えた導出は、あなたがどこに行きたいかを知ることができる仮定の例(しかし、非常に強い仮定)を説明するのに役立ちます。
-jmbejara

@ハイゼンベルク:1)これについて主に新しい質問を開くことができますか?派生物をコピーして貼り付けて質問を提示するだけであれば、それが最善です。2)と言うときが必要です。3)そのとおりです。予測に興味がある場合、それは重要です。しかし、ええ、それは良い点です。一方、バイアスの大きさは、と相関関係に依存することに注意してください。C o v X 1Z = 0 Y X 1 X 2Cov(X1,Z)=0Cov(X1,Z)=0YX1X2
-jmbejara

1
@jmbejara私は1)を別の質問として投稿しました。この場合、Google社員にとってタイトルをインテリジェントに使用する方法がわからないため、質問/タイトルを自由に編集してください。
ハイゼンベルク


5

最小二乗推定のコンテキストでは、回帰変数の内因性の可能性に対処する(試行する)方法は、インストルメンタル変数の推定です。このアプローチは、内因性リグレッサーが1つだけであることに依存していません。もちろんそのような場合、物事をより難しくするより多くの機器を見つける必要があります-しかし、原則として、この方法は同じように機能します。

IV推定はバイアスの問題を解決せず、推定器に一貫性を提供するだけです。しかし、バイアスバーの厳密な外生自体の問題を解決するものはありません(そして、バイアスを減らすいくつかの方法があります)。しかし、統計に関する別のSEサイトCross Validatedを見てみると、ベテランの統計学者は不偏性の特性にあまり重点を置いていないことがわかります。大規模なサンプルプロパティの一貫性について。


1
正しいアプローチは、実際にすべての内生変数の楽器を見つけることですよね?
ハイゼンベルク

1
はい、これが方法です。
アレコスパパドプロス

5

これは、統計学者のアンドリュー・ゲルマンが「中間結果を制御することの誤り」と呼ぶ例です。研究者がさらに娘を持つことであなたの政治が変わるかどうか尋ねられたとき、彼はこの誤acyについて説明します。2番目の子供を持つという決定は、最初の子供を持つという以前の決定を必然的に条件とするため、内生的な決定変数を制御する明確な例のように思われます。

過去数年間に、娘の両親と比較して、息子の両親の経済的決定を検討するいくつかの研究が行われました...これらのすべての研究の共通の特徴は、子供の総数を制御することです...一見、子供の総数を制御することは理にかなっています。ただし、子供の総数は中間結果であり、それを制御する(#kidsに基づいてデータをサブセット化するか、回帰モデルの制御変数として#kidsを使用することで)推定値にバイアスをかけることができるため、困難があります息子(または娘)がいることの因果効果の。

これを見るために、政治的に保守的な両親は息子を望んでいる可能性が高く、2人の娘がいる場合、3人目の子供を(仮定的に)試みる可能性が高いと仮定します。それに比べて、リベラル派は2人の娘で止まる可能性が高い。この場合、2人の娘を持つ家族に関するデータを見ると、保守派は過小評価され、娘と政治的自由主義との相関関係が示される可能性があります。

解決策は、因果推論に標準的な保守的な(統計的な意味で!)アプローチを適用することです。これは、治療変数(子供の性別)を回帰しますが、子供が生まれる前に起こることだけを制御します。たとえば、最初の子が女の子である親を、最初の子が男の子である親と比較できます。また、2番目の出生を見て、2番目の子供が女の子である親と2番目の子供が男の子である親を比較して、最初の子供の性別をコントロールできます。3番目の子なども同様です。

息子を持つことであなたはより保守的になりますか?多分そうでないかもしれません。中間結果の制御に関する問題

「これらの制御変数を除外すると、変数バイアス自体が省略されることになります」というコメントについては、これはどの種類の機器を取得するかに依存するようです。本当に要件を満たしている優れた機器は、第2段階のエラー項から独立し、直接制御する他のすべてのものから独立している必要があります。つまり、楽器はYからXのみを変更します。したがって、不等式に適した機器は、暴力方程式が暴力の構造方程式であると信じる場合、成長と発展(幸運を見つけること!)に依存しない必要があります。


1

他の投稿が指摘しているように、内因性のリグレッサーは、リグレッサーが相関している場合、回帰のすべてのパラメーター推定値を汚染する可能性があります。

さらに、たとえばとが相関しており、は内生的であるが、はそうではない状況を想像するのは難しいように思われるかもしれません。X 2 X 2 X 1X1X2X2X1

ただし、が内生的でとが相関している場合でも、一貫性を保証するために必要なものはそれよりも少なくなります。X2X1X2β^1X2X1X2

次のモデルを検討してください(@jmbejaraの表記法に類似)

y=X1β1+X2β2+Zγ+ε,

Z観察されず、通常の外生的仮定wrt、つまりおよび1ε1nx1(k)εp01nx2(k)εp0kX21nx1(k)z(l)p0(k,l)

今ならば内因性であるが、間のすべての関係という意味ではありませんおよびのために制御した後消えてしまいますX 1X2X1X1ZX2すなわち、

1nx1(k)QX2z(l)p0
すべてについて、ここでは(「残余メーカー」)のヌル空間への投影、すなわちその後、大丈夫です。その理由は、以下の 2段階の推定量から(例:、1985、):(k,l)QX2X2QX2[InX2(X2X2)1X2]β1

β^1=(X1QX2X1)1X1QX2y=β1+(X1QX2X1)1X1QX2X2p0β2+(X1QX2X1)1X1QX2Zp0γ+(X1QX2X1)1X1QX2εp0
QED。ここの3行目は重要です。また、とが無相関/直交の場合に安全である理由も示しています。幸せな内因性回帰。X 2X1X2
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.