機器がない場合の観測データのモデルについて、私たちは何と言えますか?


10

過去に、観測データ(つまり、制御された実験によって生成されなかったデータ)に回帰(およびパネルモデルやGLMなどの関連モデル)が使用されている多くの分野で、公開された論文に関して質問されてきました。 、多くの場合-常にではありませんが-データは時間の経過とともに観測されますが、計測変数を導入する試みは行われません。

私はいくつかの批判をしました(たとえば、重要な変数が欠落している可能性のあるバイアスの問題について説明するなど)が、ここにいる他の人はこのトピックについて私よりもはるかに知識があるので、私は尋ねると思いました:

  1. そのような状況で、関係について結論を出そうとすることの主な問題/結果(特に、因果的な結論に限定されない)は何ですか?

  2. 機器がない場合にこのようなモデルに適合する研究で、何か役立つことはありますか?

  3. そのようなモデリングに関する問題についての良い参考文献(本または論文)は何ですか(多くの場合、質問する人はさまざまな背景を持っているため、多くの統計がないものもあるため、批評で参照する可能性があります)紙?器具に関する注意/問題についての議論も有用でしょう。

(インストゥルメンタル変数に関する基本的なリファレンスはここにありますが、そこに追加するものがあれば、それも役立ちます。)

楽器を見つけて使用するための良い実用的な例へのポインタはおまけですが、この質問の中心ではありません。

[このような質問が出てきたら、ここで他の人に良い答えを指摘するでしょう。入手したら1つまたは2つの例を追加できます。]

回答:


8

したがって、私の分野の大部分(私がほとんどの部分で作業しているわけではありませんが)は、GLMタイプのモデルを観測データに適合させることだけに関係しています。ほとんどの場合、楽器の変数は、技術に精通していないか、または重要なこととして、良い楽器が不足しているため、希少です。質問に順番に対処するには:

  1. もちろん、主要な問題は、曝露と関心のある結果の両方に関連する、観察されていない変数によるある種の残留交絡です。平易な言語バージョンはあなたの答えが間違っているかもしれないということですが、あなたは必ずしもどのように、またはなぜ知っているわけではありません。その情報に対して行われた決定(特定の治療法を使用するかどうか、環境内のXの物体が危険かどうかなど)は、間違った情報を使用して行われた決定です。

  2. これらの研究は、ほとんどの場合、必ずしも良い楽器とは限らない、またはランダム化が不可能な場所に到達しようとしているため、これに対する答えは「はい」であると私は断言します。したがって、それが問題になる場合、代替案は「推測するだけ」です。これらのモデルは、他に何もないにせよ、私たちの思考を形式化したものであり、答えに近づくための確かな試みであり、取り組みが容易です。

たとえば、答えを定性的に変更するためにバイアスがどれほど深刻である必要があるかを尋ねることができます(つまり、「はい、Xはあなたにとって悪いです...」)。データの外に潜んでいるその強さの。

たとえば、HPV感染が子宮頸がんと非常に強く関連しているという発見は重要な発見であり、ヌルまでずっとバイアスする測定されていない要因の強さは驚くほど強力でなければならないでしょう。

さらに、器具はこれを修正しないことに注意する必要があります-それらはいくつかの未測定の関連なしでも機能するだけであり、無作為化試験でさえ問題に悩まされますターゲット人口)も少し光沢が出ます。

  1. ロスマン、グリーンランド、ラッシュは、現代の疫学の最新版を書いています。これは基本的に、可能な限り最良の方法でこれらを実行しようとすることに専念した本です。

8

Fomiteが示した疫学者の側からの見方とは対照的に、楽器変数はかなり早い段階で教えられている経済学の重要なツールキットです。その理由は、最近の経済研究では因果関係のある質問に答えようとすることに非常に重点が置かれており、単なる相関関係は興味がないとさえ見なされている場合にまで及んでいるからです。主な制限は、ランダム化実験を行うことが本質的に困難である場合、経済学が分野であることです。子供の早期の親の死が子供の長期的な教育成果にどのような影響を与えるのか知りたい場合、ほとんどの人は無作為化されたコントロールトレイルを介してこれを行うことに反対します。MITコースからのこの配布資料では、3〜5ページに、実験に関するその他の問題の概要を示しています。

各ポイントに順番に対処するには:

  1. 答えられる質問に応じて、非実験的方法を使用せずに観測データの分析を無効にする可能性があるのは、単に省略された変数ではありません。選択の問題、測定誤差、逆因果律、同時性も同様に重要です。主な問題は、データアナリストがこの設定の制限を認識している必要があることです。アカデミックなシナリオではこれがすぐに明らかになるため、これは主にビジネスケースを指します。時々、クライアントに通知するために価格弾力性を推定したい市場アナリストを見かけます(たとえば、価格を増加させると、需要はどれだけ減少しますか?x%)、したがって、彼らは需要方程式を推定し、需要と供給が同時に決定され、一方が他方に影響するという事実を完全に忘れるか無視します。したがって、結果は、データ自体ではなく、データの制限に関する研究者/データアナリストの認識に大きく依存しますが、結果は、些細なものから、人々の生活に悪影響を与える範囲までさまざまです。
  2. 相関関係の表示は役立つ場合がありますが、それは質問によって異なります。因果関係を探すときは、自然な実験で十分です。チリの国勢調査データは観測値である可能性がありますが、最後の地震が教育の達成にどのように影響したかを知りたい場合(地震が間違いなく外因性である場合)、観測データも因果関係の質問に答えるのに適しています。
    器具なしで内生性を評価することもある程度可能です(上記の配布資料、「省略された変数の偏りの程度の推定」の9ページを参照)。バイナリの非実験的治療の場合Diこの処理の効果を計算し、観察不能なものについても同じことを行い、観察された処理効果を説明するために、観察不能な物質のシフトがどれだけ大きい必要があるかを尋ねます。観察されていない変化が非常に大きい必要がある場合は、調査結果に対してもう少し信頼できます。この参照は、Altonji、Elder、Taber(2000)です。
  3. おそらく、どんな応用経済学者もAngrist and Pischke(2009)の「ほとんど無害な計量経済学」を推奨するでしょう。この本は主に大学院生と研究者を対象としていますが、数学の部分を省略して直感を得ることもできます。彼らは最初に実験的な設定のアイデアを紹介し、次に、省略された変数、同時性、選択などからの内生性に関するOLSとその制限に傾向があり、次に、応用文献からの例のかなりのシェアで機器変数を広範囲に議論します。彼らはまた、弱い楽器のような楽器変数の問題やそれらの多すぎる使用についても議論します。Angrist and Krueger(2001) また、機器の変数と潜在的な落とし穴の非技術的な概要を提供し、いくつかの研究とその機器をまとめた表も用意しています。

おそらく、これらすべては、ここでの典型的な回答よりもかなり長いものでしたが、質問は非常に広範囲です。楽器変数(多くの場合、見つけるのが難しい)がポケットの中の唯一の弾丸ではないという点を強調したいだけです。差異の差異、回帰不連続性の設計、マッチング、または固定効果回帰(交絡因子が時間不変の場合)など、観測データから因果効果を明らかにするための非実験的方法は他にもあります。これらすべては、Angrist and Pischke(2009)と最初にリンクされた配布資料で説明されています。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.