計量経済学における回帰と因果関係


8

一般に、回帰では、線形回帰では、特にパラメータに関する因果解釈が許可される場合があります。少なくとも計量経済学の文献では、因果解釈が許可されている場合だけではなく、それほど明確ではありません。あなたが見ることができる議論のために:回帰と因果関係:6つの計量経済学の教科書の重要な調査 -陳と真珠(2013)。

統計モデルで因果関係を適切に処理するための最良の方法は、たとえば(間もなく)説明するように、構造的因果モデルを使用することです:Trygve Haavelmo and Emergence of Causal Calculus – Pearl 2012 feb。

ただし、現在、これらは基礎計量経済学モデル(クラシック多重線形回帰)の標準的な方法ではありません。実際、「真のモデル」または「データ生成プロセス」の概念が頻繁に使用され、明示的な因果関係の意味を持つ場合があります。とにかく因果関係だけを考えたい。したがって、「真のモデル」の対応するサンプルを推定すると、パラメーターに関する因果解釈を実現できます。

上記の考慮事項を念頭に置いて、私の試みは把握することです

  • (現在の計量経済学の教科書の)「真のモデル」の概念と(パールの)構造因果モデル間のリンク…もしあれば。

  • 以前のポイントと、実験室で使用されているランダム化制御実験の概念との間のリンクは、 計量経済観測研究の参照ポイントになる場合があります(それと同じくらい優れています)。たとえば、ストックとワトソン(2013)はそれについて多くの議論をしています(特にキャップ13)。さらに、Pearl 2012の2月14日には、この点に強く関連する「構造主義者」と「実験主義者」の間の議論のレビューがあります。

この2つのポイントについて、できるだけ簡単なシナリオで説明していただけますか?


2
計量経済学の因果関係については、複数の考え方があります。たとえば、Heckman and Pinto(2015)がパールについてコメントしたり、Rubinの潜在的な結果モデル(たとえば、AngristとPischkeによる無害計量経済学)のアプリケーションを参照してください。
フランク

経済学には「真の」モデルがない
Aksakal

1
@フランク:提案された論文をありがとう、彼らは確かに役立つでしょう。Angrist and Pischkeの本について、私はそれを読みました。私は約10の計量経済学の教科書を調査しましたが、ほとんど無害な計量経済学は因果関係について最高です(私の意見ですが、おそらくそれだけではありません)。そのことから多くを学びました。しかし、少なくとも私の意見では、この本でさえ網羅的です。たとえば、構造的因果モデルについては何も述べておらず、それと潜在的な結果言語との間のリンクも示しています。最後に、上記の2つの質問に対する回答は提供していません。または、少なくとも、私はそれを「見ない」。
マルコヴィッツ2018年

1
@Aksakal:あなたが言っているように答えてください。私の意見では、何も言わないので何も言わない。最初に、多くの計量経済学の本でなぜ「真のモデル」が使用されるのか(そして必須ではないにしても非常に有用であるように見える)。あなたの答えと私の質問の間のリンクは何ですか?リンクが存在しない場合、「真のモデル」の存在を説明することは非常に困難になりました。いずれにせよ、「真のモデル」は時々批判される概念であり、「実世界」は何か異なるものであり、それらの間のリンクは人為的である可能性があることを私は知っていましたが、これは理論です。私の質問は計量経済学理論についてです。
マルコヴィッツ2018年

@markowitz:AngristとPischkeはこれについて議論していますが、彼らの言語はあなたを混乱させるかもしれません。セクション3.2.1を参照してください:「関数何を教えてくれるのために稼ぐだろう任意の、学校教育の価値。言い換えれば、回答因果質問『もしも』の。」(セクションの最後にある)線形定数効果因果モデルの説明も参照してください。fi(s)isfi(s)
フランク

回答:


5

あなたが与えた真珠紙の文脈において、ほとんどの計量経済学者が真のモデルと呼ぶものは、構造因果モデルへの入力I-1です:一連の仮定A とモデル MA(モデル1と2のように)構造方程式のシステムとして記述されたこれらの仮定と、変数に関連する統計的仮定のリストをエンコードします。一般に、真のモデルは再帰的である必要はないので、対応するグラフはサイクルを持つことができます。

真のモデルの例は何ですか?Angrist and Pischke(2009)のセクション3.2で説明されている教育と収入の関係を検討してください。個人向けi、計量経済学者が真のモデルと呼ぶものは、あらゆるレベルの教育をマッピングする仮定の関数ですs 結果に ysi: これはまさに潜在的な結果です。さらに進んで、パラメトリック関数形式を想定できます。たとえば、線形定数効果因果モデル: ここで、とは監視されていないパラメーターです。このように書くことにより、が依存しないと仮定します。パールの言葉では、これは、個人の学校教育をに修正した場合に予想される収益がどうなるかを示していますが、観察していません:

ysi=fi(s).
fi(s)
fi(s)=α+ρs+ηi.
αρηissi=s0ηi
E[ysido(si=s0)]=E[fi(s0)]=α+ρs0+E[ηi].
どのクエリに興味があるのか​​、どのデータがあるのか​​はまだ明らかにしていません。したがって、「真のモデル」は完全なSCMではありません。(これは、この例だけでなく、一般的に当てはまります。)

真のモデルとランダム化された実験の関係は何ですか?計量経済学者がを推定したいとします。を観察するだけでは十分ではありません。これは、統計的条件付けに関するパールのポイントと同じです。ここで AngristとPischkeが指摘しているように、選択バイアスのため、は観測データのと相関している可能性があります。学校教育に関する個人の決定は、値に依存する可能性があります。ρ(si,yi)

E[ysisi=s0]=E[fi(s0)si=s0]=α+ρs0+E[ηisi=s0].
ηisiηi

ランダム化実験は、この相関を修正する1つの方法です。ここでパールの表記法を大まかに使用して、被験者をおよびにランダムに割り当てると、およびを推定できます。。次に、は do(si=s0)do(si=s1)E[ysido(si=s1)]E[ysido(si=s0)]ρ

E[ys|dos=s1]E[ys|dos=s0]=ρs1s0

追加の仮定とデータを使用して、相関関係を修正する他の方法があります。ランダム化された実験は、他の仮定を信じられない可能性があるため、「最良」と見なされます。たとえば、条件付き独立性の仮定と追加のデータがあれば、OLSによって推定できます。または、楽器変数を取り込むこともできます。ρ

編集2(CIA):これは主に哲学的な点であり、AngristとPischkeはここでの私のプレゼンテーションに反対するかもしれません。条件付き独立仮定(オブザーバブルの選択)により、選択バイアスを修正できます。それは、共同分布に関する仮定を追加します:その for all。条件付き期待代数(AngristとPischkeの導出を参照)だけを使用すると、 with。この方程式により、OLSを使用してデータのを推定できます。

fss|バツ
s
y=fs=α+ρs+バツγ+v
E[v|バツs]=0ρ

ランダム化もCIAも、真のモデルを定義する方程式系には入りません。これらは、データを使用して、すでに定義したモデルのパラメーターを推定する方法を提供する統計的仮定です。計量経済学者は通常、真のモデルのCIAの部分を考慮しませんが、パールはそれを含めます。


私はすでにアングリストとピシュケの例を見て、それについて考えました。それは私が見つけたことのない最高の例/説明でした。あなたの追加は私が探していたものを表しています。ありがとうございました。
マルコヴィッツ2018年

ただし、いくつかのポイントと具体的な質問を追加させてください。AngristとPischkeはモデルを「線形constat効果の因果モデル」と呼んでいますが、そのモデルが「真のモデル」として解釈できるかどうかは疑問でした。通常の「真のモデル」では、このケースでは実際に正確に違反する外因性の何らかの形が明示的に有効であるため、私のお気に入りの答えは「いいえ」でした。これはまさに私のフレーズについての最後の検討事項ですが、私はこの問題を認識していました。
マルコヴィッツ2018年

現在、AngristとPischkeは「真のモデル」について語ることはありませんが、この解釈を提案する必要があります。おそらくあなたは正しいです。いずれの場合も、「「真のモデル」はSCMの一部にすぎません。」と書きます。OK!あなたは私がすでに頭に描いた推測の見事な形です。この結論は、私が以前覚えていた「真のモデル」の場合にも当てはまりますか?
マルコヴィッツ2018年

AngristとPischkeの解説では、CIAが重要な役割を果たし、因果関係で実際に重要な役割を果たします。これは、選択バイアスを排除するために不可欠です。ただし、この例では、因果関係の仮定がCIAの介入に明示的に先行しています。私たちは、一般的なモデル取ればと思い、コントロールのセットであるが、(上のCIA条件)決して十分ではありません。因果関係の仮定は、方程式に示されている、関係の前になければなりません。あたりです?そうでなければ、「因果関係の仮定は因果関係の結論がない」という言い回しに違反していると思います。y=a+bバツ+cZ+eZZyバツ
マルコヴィッツ2018年

1
@フランクでは、構造因果モデルの任意の部分仕様、一連の仮定を与えることができます パールとは 伝統的に、これは科学的根拠に基づいて防御できる機能的関係の定性的な記述になります。CIAはSCMの部分的な仕様でもあり、潜在的な応答はYs に依存しない S共変量のセットが与えられると、これは可能な方程式系に制約を課します。
Carlos Cinelli、2018年

5

ランダム化対照研究と観察研究の違いに関する質問の2番目の部分から始めて、「真のモデル」と「構造因果モデル」に関する質問の部分で締めくくります。

わかりやすいパールの例を使用します。アイスクリームの売り上げが最も高い(夏)場合は犯罪率が最も高く(夏)、アイスクリームの売り上げが最も低い(冬)場合は犯罪率が最も低いことに気づきます。これは、アイスクリームの販売のレベルが犯罪のレベルを引き起こしているかどうか疑問に思います。

ランダム化された制御実験を実行できる場合、何日もかかり、100日と想定し、これらの各日にランダムにアイスクリームの販売レベルを割り当てます。以下のグラフに示されている因果構造を考えると、このランダム化の鍵は、アイスクリームの販売レベルの割り当てが温度のレベルに依存しないことです。そのような仮説の実験を実行できた場合、売上高がランダムに割り当てられた日に高い平均売上高が割り当てられた曜日と統計的に変わらないことがわかります。このようなデータを手に入れたら、準備は完了です。ただし、ほとんどの場合、観測データを使用する必要があります。この場合、ランダム化では上記の例のような効果は得られませんでした。重要なことに、観測データでは、アイスクリームの販売レベルが気温とは無関係に決定されたのか、それとも気温に依存していたのかはわかりません。結果として、因果関係を単に相関関係から何らかの形で解明する必要があります。

パールの主張は、E [Y | XとYの結合分布によって与えられるXの値に関する条件付けとは対照的に、統計にはE [Y | Xを特定の値に等しく設定する]を表す方法がないということです。 ]。これが、E [Y | X = x]とは対照的に、Xに介入してその値をxに設定したときに、表記E [Y | do(X = x)]を使用してYの期待値を参照する理由です。 、これはXの値に条件を付け、それを与えられたとおりに扱うことを指します。

変数Xに介入すること、またはXを特定の値に等しく設定することは、正確にはどういう意味ですか?そして、それはXの値の条件付けとどう違うのですか?

介入は以下のグラフで最もよく説明されています。温度はアイスクリームの売上と犯罪率の両方に因果的影響を与え、アイスクリームの売上は犯罪率に因果的影響を与えます。これらの要因をモデル化する必要はありません。私たちの関心は、犯罪率に対するアイスクリーム販売の因果関係にあり、因果関係の描写が正確で完全であると仮定します。下のグラフをご覧ください。

ここに画像の説明を入力してください

ここで、アイスクリームの販売レベルを非常に高く設定し、それが犯罪率の増加につながるかどうかを観察するとします。これを行うには、アイスクリームの販売に介入します。つまり、アイスクリームの販売が自然に温度に応答することを許可しません。実際、これは、パールがグラフ上で「手術」と呼んでいるものを、それに向けられたすべてのエッジを削除して実行することになります。変数。今回のケースでは、アイスクリームの販売に介入しているため、以下に示すように、温度からアイスクリームの販売へのエッジを削除します。アイスクリームの販売レベルは、気温によって決定されるのではなく、必要に応じて設定されます。次に、そのような2つの実験を行ったとします。1つは介入してアイスクリームの販売レベルを非常に高く設定し、もう1つは介入してアイスクリーム販売のレベルを非常に低く設定してから、それぞれのケースで犯罪率がどのように反応するかを観察します。次に、アイスクリームの売上と犯罪率の間に因果関係があるかどうかを理解し始めます。

ここに画像の説明を入力してください

パールは介入と条件付けを区別しました。ここでの条件付けは、データセットのフィルタリングのみを指します。温度の条件付けは、温度が同じである場合にのみ観測データセットを調べると考えてください。コンディショニングは、常に私たちが探している因果関係を与えるとは限りません(ほとんどの場合、因果関係を与えるわけではありません)。上記の単純化した図では、条件付けによって因果関係の効果が得られることがありますが、グラフを簡単に変更して、温度での条件付けでは因果関係の効果が得られず、アイスクリームの販売に介入した場合の例を示すことができます。アイスクリームの販売を引き起こす別の変数があると想像してください。これを変数Xと呼びます。グラフでは、アイスクリームの販売への矢印で表されます。その場合、温度で調整しても、変数X->アイスクリーム販売->犯罪率というパスがそのまま残るため、犯罪率に対するアイスクリーム販売の因果関係は得られません。対照的に、アイスクリームの販売に介入すると、定義により、アイスクリームへのすべての矢印が削除され、犯罪率に対するアイスクリームの販売の因果関係が得られます。

パールの最大の貢献の1つは、私の意見では、コライダーの概念と、コライダーの条件付けによって独立変数が依存する可能性が高くなることです。

パールは、E [Y | do(X = x)]で与えられる因果係数(直接効果)を持つモデルを構造因果モデルと呼びます。そして、係数がE [Y | X]によって与えられる回帰は、著者が誤って「真のモデル」と呼んでいると彼が言ったものであり、誤って、つまり、Yに対するXの因果効果を推定し、Yを予測するだけではない。

それでは、構造モデルと経験的に何ができるかの間のリンクは何ですか?変数Bに対する変数Aの因果関係を理解し​​たいとします。パールは、そうするための2つの方法を提案します。バックドア基準とフロントドア基準です。前者について詳しく説明します。

バックドア基準:最初に、各変数のすべての原因を正確にマッピングする必要があります。バックドア基準を使用して、条件付けする必要がある変数のセットを特定します(重要なのは、 Bに対するAの因果関係を分離するために、条件付けしないでください(つまり、コライダー)。パールが指摘するように、これはテスト可能です。因果モデルを正しくマッピングしたかどうかをテストできます。実際には、これは言うより簡単であり、私の意見では、パールのバックドア基準の最大の課題です。次に、通常どおり回帰を実行します。これで、何を条件付けるかがわかります。得られる係数は、因果関係のマップでマップされているように、直接的な影響です。


私はあなたの説明を理解しましたが、それが私の質問についての答えを与えないことを恐れています。最後の句を除いて、私は部分的にはそれに同意しません。まず、実験の有用性を説明します。それについてはあなたに同意します。あなたが(間もなく)観察の文脈では、実験的操作なしに「どういうわけか因果関係を単に相関関係から解き明かす」必要があると述べた後。知ってるよ。
マルコヴィッツ2018年

その後、条件付けと介入の概念的な違いから、パールの介入表記法を紹介します。介入表記法の有用性を理解しています。因果関係グラフには自信がありませんが、きっと役に立ちます。パールの貢献は重要です。最後に、次のように述べました。「パールは因果係数(直接効果)を使用してモデルを呼び出します。E[Y|do(X=x)]構造因果モデル。」わかりました。
マルコヴィッツ2018年

1
「係数が次のように与えられる回帰 E[Y|バツ] 作者が誤って「真のモデル」と呼んでいるのは、誤って、つまり、 バツ オン Y 単に予測するだけでなく Y。」これは私には厳密には当てはまらないようですE[Y|バツ]常に真のモデルであるとは限りません。OLS回帰は条件付きの期待ですが、これらすべてが計量経済学の教科書で頻繁に使用される真のモデルに対応するわけではありません。
マルコヴィッツ2018年

あなた/パールの例を使ってみましょう: バツ1=温度、 バツ2=アイスクリームの量、 Y=犯罪率。真の(因果的)モデルを次のように定義することができます。Y=beta0+beta1バツ1+beta2バツ2+あなた しかし、仕様が不十分なモデルを推定します Y=alfa0+alfa1バツ1+e。alfasパラメータが真の因果パラメータ(ベータ)の偏った推定であることを示すことが可能です。ただし、後者は条件付きの期待のままです。これは省略された変数の問題です。実際、指定された正しい形式または「より長い」形式を推定する場合、推定パラメーターは。公平であり、その因果関係の解釈は許可されます。
マルコヴィッツ2018年

説明は、少なくとも上記のような単純なケースでは、Pearlの(および関連する)貢献なしでも完了できます。まさに上記のような理由で、私は次の関係を探しています。構造的因果モデル(Pearlから)、実験的言語(Rubinから)。(多くの計量経済学の教科書から)その因果関係の意味で使用される通常の真のモデル。リンクが存在していると確信していますが、リンクの形式については疑問です。
マルコヴィッツ2018年

0

そのような回帰/相関ベースのアプローチでの「因果的」の使用は、私の意見では誤解を招くものです。パス分析、構造方程式モデリング、グレンジャー因果関係などは、かなり微妙な仮定を課すことにより因果推論をライセンスしようとします。たとえば、構造方程式モデリングの場合、パスは方向性があり、AはBを「引き起こしている」ように見えますが、これは単に、構造化されたモデルが観察された共分散行列(実際には、方向パスの数はそれほど重要ではありません-制約だけです)。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.