「内因性」と「外因性」は実質的に何を意味するのでしょうか?


43

私は、内因性の基本的な定義は が満たされないということを理解して いますが、これは現実世界の意味で何を意味するのでしょうか?Wikipediaの記事を読んで、需要と供給の例を理解しようと試みましたが、実際には役に立ちませんでした。内因性と外因性がシステム内にあり、システム外にあるという別の説明を聞いたことがありますが、それはまだ意味がありません。

Xϵ=0

1
以下の3つの答えはすべて非常に優れています(各+1)。別の情報源が必要な場合は、このトピックについて説明します:代わりに推定しb 1 x 1 + b 2 x 2 + b 3 x 3b1x1+b2x2b1x1+b2x2+b3x3、シミュレーションで説明しRます。
GUNG -復活モニカ

1
内生性がある場合、回帰には使用可能な推定量またはテスト統計がありません。
イヴァン

1
私は@gungに同意し、完全な答えが「どんな目的のために使用可能」に対処することを強調したいと思いますか?上記の回答の多くは、この質問に非常によく対応しています。
マシュードゥルーリー

@Matthewこの投稿は、「これは現実世界の意味で何を意味するのか?」という質問に答えようとしているようです。人々がそれをより良く理解できるように、説明が具体化されているのを見るのは良いでしょう。
whuber

@whuber私は知らない、それは私が本当に言うことができないほど短い。しかし、たとえば、内生性がある場合でも、推定されたモデルは予測(または単なる関連付け)に役立つ可能性があると考えていたので、「使用可能な推定器はもうありません」は明確になっていないようです。
マシュードゥルーリー

回答:


69

JohnRosの答えはとても良いです。簡単な英語では、内生とは、因果関係が間違っていることを意味します。書き留めて推定したモデルが、現実世界での因果関係の仕組みを適切に把握していないこと。あなたが書くとき:

Yi=β0+β1Xi+ϵi

この方程式はさまざまな方法で考えることができます。の値に基づいてを予測する便利な方法と考えることができます。をモデル化する便利な方法と考えることができます。これらの場合のいずれにおいても、内因性のようなものは存在せず、あなたはそれについて心配する必要はありません。X E { Y | X }YXE{Y|X}

ただし、方程式を因果関係の具体化と考えることもできます。は、「このシステムに到達し、実験的にを1 増やした場合、どうなりますか?」という質問に対する答えと考えることができます。そのように考えたい場合、OLSを使用して推定することは、次のことを想定することになります。 Y Xβ1YX

  1. YXは引き起こすY
  2. Yϵは引き起こすY
  3. Xϵは引き起こしませんX
  4. XYは引き起こしませんX
  5. を引き起こすものはも引き起こしませんXϵX

3〜5のいずれかが失敗すると、一般的に、まったく同じではありませんが、ます。インストルメンタル変数は、因果関係が間違っているという事実を修正する方法です(別の異なる因果的な仮定を行うことによって)。完全に実施されたランダム化比較試験は、3〜5を強制する方法です。ランダムに選択した場合、それは、、または他の何かによって引き起こされたものではないことを確認してください。いわゆる「自然実験」法は、3-5が通常真実であるとは思わない場合でも、3-5が真実である世界で特別な状況を見つける試みです。C o vX ϵ 0 X Y ϵE{ϵ|X}0Cov(X,ϵ)0XYϵ

JohnRosの例では、教育の賃金価値を計算するには、因果解釈が必要ですが、3または5が偽であると考える正当な理由があります。β1

ただし、混乱は理解できます。インストラクターが上記の因果解釈を使用し、因果関係を導入しないふりをして、「すべてが単なる統計」であるふりをすることは、インストラクターの線形モデルのコースで非常に一般的です。それはco病な嘘ですが、それも非常に一般的です。 β1

実際、それは生物医学および社会科学におけるより大きな現象の一部です。ほとんど常に、私たちはの因果効果を判断しようとしている場合であるにどのような科学者は、すべての後に約あることを---。一方、3-5のいずれかが偽であるという結論に導くことができる何らかのストーリーがある場合も、ほとんど常にそうです。したがって、実践的で流動的で曖昧な不誠実のようなものがあります。これは、単に関連作業を行っていると言って異議を否定し、その後、他の場所に因果解釈を忍び込ませます(通常、論文の紹介と結論のセクションで)。YXY

本当に興味があるなら、読むべき人はJudea Perlです。 ジェームズ・ヘックマンもいいです。


5
+1すばらしい説明と解説。当サイトへようこそ!
whuber

2
この問題に関する基本的かつ確実な理解を得るために、Heckmanが推奨する作業を述べてください。
ケニーLJ

私には質問があります:またはが真であるかどうかを確認する方法、観測データセット」?私がテストする方法がないことを感じてまたは以降だけで使用データ、観測可能ではない、そしてそれは内生性がデータを使用してテストすることができないというのは本当ですか?E [ ϵ X ] = 0 E [ ϵ | X ] = 0 E [ ϵ X ] = 0 ϵE[ϵ|バツ]=0E[ϵバツ]=0E[ϵ|バツ]=0E[ϵバツ]=0ϵ
ケビンキム

1
@KevinKimはい。 は、統計を使用してテストできません。 は、推定を行ってから残差を作成しない限り、回復/推定することはできません。回復は、推定後にのみ実行できます。推定が正しく行われた場合にのみ、回復は正しいです。場合にのみ、推定が正しく行われ 。だから、円形。という情報は、実質的で非統計的な知識に基づいている 必要があります。この例は、で、はOLS残差です。これは、であるかどうかに関係なく当てはまります 。ϵ E { ϵ | X } = 0 E { ϵ | X } = 0 C o v { X e } = 0 e E { ϵ | X } = 0E{ϵ|バツ}=0ϵE{ϵ|バツ}=0E{ϵ|バツ}=0Cov{バツe}=0eE{ϵ|バツ}=0
ビル

2
@KevinKimそうです。そして、それは単なる線形モデルではありません。それはすべての統計です。誰かが言うときの注意は、彼らは、これまでに何を伝えるために行くことはありません「の相関関係は因果関係はない」である因果関係。因果関係は理論であり、理論にすぎない。(完全に(したがって、決して)実施された)RCTでさえ、理論がなければ因果関係を伝えません。
ビル

18

例を使用してみましょう。

収入に対する教育の(因果的)効果を定量化したいとします。教育年数と収入データを取得し、一方を他方に対して後退させます。必要なものを回復しましたか?おそらくない!これは、収入も教育以外のものによって引き起こされますが、それは教育と相関しているためです。それらを「スキル」と呼びましょう。教育年は「スキル」の影響を受けると安全に想定できます。スキルが高いほど、教育を受けやすくなります。したがって、教育年数を収入で後退させると、教育効果の推定量は「スキル」の効果を吸収し、教育への復帰について過度に楽観的な推定値を取得します。これは、教育は収入に対して外生的ではないため、収入に対する教育の効果は(上方に)偏っているということです。

内因性は、(単なる相関関係とは異なり)因果効果を回復したい場合にのみ問題になります。また、実験を計画できる場合は、ランダム割り当てによりを保証できます。悲しいことに、これは一般的に社会科学では不可能です。Covバツϵ=0


1
例と説明をありがとう。私は、内因性と外因性が平易な英語で何を意味するのか、まだ少しわかりません。変数が内生的であると言うと、正確にはどういう意味ですか?
user25901

@ JohnRos「内因性は、因果関係を回復したい場合にのみ問題です」と書いた場合、「外因性は因果関係を意味する」と言うこともできるようです... それが正しければ、多くの教科書は、時には暗示的に、因果推論を通常の目標として想定しているように思えます。
マルコウィッツ

@markowitz:回帰係数を推測するときはいつでも、因果関係が必要であることを意味します。予測のみが必要な場合、予測が良好であれば、係数の値は実際には重要ではありません。予測のタスクが「基礎科学」ではなく、むしろ「工学」であるため(そしてこの粗雑な一般化を許してください)
ジョンロス

JohnRosに感謝します。関連する点について別の質問をさせてください。係数の偏った推定の問題は、因果回帰モデルでのみ意味がありますが、予測目標の場合は間違いです。それはそうです?この点はどこでもはっきりしていないので、私はこれを尋ねます。
マルコウィッツ

8

User25901は、外因性および内因性という用語が何を意味するのかという、単純明快で現実的な説明を探しています。難解な例や数学的な定義で応答しても、実際に尋ねられた質問には答えません。

これら2つの用語を直感的に理解するにはどうすればよいですか?

ここに私が思いついたものがあります:

Exo-外部、外部Endo-内部、内部-固有-起源

外因性:変数は、モデル内の他のパラメーターや変数によって決定されない場合、モデルに対して外因性ですが、外部から設定され、その変更は外力から生じます。

内因性:モデル内の他のパラメーターと変数の少なくとも一部が機能する場合、変数はモデル内で内生的です。


7
これらは合理的な直感的な定義ですが、他の回答をそれほど軽視する必要はありません。
GUNG -復活モニカ

3
語源に訴えること、専門用語の意味を思い出すための便利なハンドルを与えることができます(私にとってはうまくいきます)が、語源を使用してそれらを正当化することは避けるべきです。非常に少数の用語(統計など)は、数学的な定義を慎重に研究することによってのみ適切に理解されます。この答えを理解するには、「決定」、「外部で設定」、「変更」、「外部の力」、「部分的に機能」などの単語やフレーズの意図された使用法の明確な概念が必要です。明白または明確です。
whuber

6

バツϵ=0バツϵ^=0

Y=α+βバツ+γZ+noseZバツバツnose0Zバツログeバツ=バツ。それは単なる数学的な事実です。これは、省略された変数バイアスです。

YバツバツバツY

これは2段階の最小二乗であり、IVとほぼ同じです。


私が理解しているように、2SLSはIVを行う1つの方法ではありません。私が間違えたらおpびします。
user25901

2SLS標準エラーは間違っています。理由や方法は忘れてしまいますが、「IV 2SLS標準エラー」をグーグルで検索すると、おそらく何かが見つかるでしょう。ほとんどのソフトウェアパッケージは、solve(t(z)%*%(x)%*%t(z)%*%yメソッドで2slsを実装します
generic_user

1
バツ^バツ

ありがとう。これを書いたとき、私は応用計量経済学から新鮮でした。
generic_user

-1

回帰では、特定された従属変数に対する独立変数(外因性であり、それ自体が他の何かに依存していないと仮定する)の定量的影響をキャプチャします。私たちは、外生変数が従属変数に与える正味の影響を知りたいです。つまり、独立変数には他の変数からの影響がないはずです。回帰が内因性の問題を抱えているかどうかを確認する簡単な方法は、独立変数と残差の間の相関をチェックすることです。しかし、これは単なる大まかなチェックです。


3
これは真実ではありません。残差と回帰の説明変数との相関は、構築によりゼロになります。これは内生性のテストではありません。
アンディ

E[ϵバツ]=0ϵy=b0+b1バツ+ϵϵE[e^|バツ]=0e^E[e^|バツ]=0b^0+b^1バツ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.