バイナリー楽器とバイナリー内因性変数を使用して、楽器変数回帰の第2段階係数を解釈する方法


11

(かなり長い投稿、申し訳ありません。多くの背景情報が含まれているので、下部の質問に進んでください。)

イントロ:私たちは、バイナリ内生変数の影響を識別しようとしているプロジェクトに取り組んでいます、連続結果に、。私たちは、無作為に割り当てられると強く信じている楽器を考え出しました。x1yz1

データ:データ自体はパネル構造になっており、約34,000の観測が1000ユニットと約56の期間に分散しています。は約700(2%)の観測値に対して1の値をとり、は約3000(9%)に対して値を受け取ります。111(0.33%)観察は、両方で1スコア上、それは上で1得点を観察するための二倍の可能性があるに、それはまた、スコア1が場合。x1z1z1x1x1z1

推定: Stataのivreg2プロシージャを使用して、次の2SLSモデルを推定します。

x1=π0+π1z1+Zπ+v
y=β0+β1x1+Zβ+u

ここで、他の外因性変数のベクトルであり、 の予測値である第一段階から、そして及び誤差項です。Zx1x1uv

結果:すべてがうまく機能しているようです。推定第一段階において非常に重要であるとの推定第二段階において非常に重要です。他の外生変数の兆候を含め、すべての兆候は予想どおりです。ただし、問題は(関心のある係数)の推定値が信じられないほど大きい(または、少なくとも、これまでの解釈に従って)ことです。π1β1β1

y範囲は約2から約26で、平均値と中央値は17ですが、の推定値は30から40の範囲です(仕様によって異なります)。β1

弱いIV:最初の考えは、これは楽器が弱すぎるためであると考えていました。つまり、内生変数とはあまり相関していませんが、実際にはそうではありません。それは違反に堅牢なテスト提供として、機器の弱点を調べるために、我々は、フィンレイ、Magnusson氏、およびシェーファーのweakivパッケージを使用私たちはパネルデータを持っていると私たちのSEの時をクラスタ化することを考えると、ここで関連する仮定を(、単位レベル)。i.i.d.

彼らのARテストによると、第2段階係数の95%信頼区間の下限は16〜29です(これも仕様によって異なります)。棄却確率は、ゼロに近いすべての値に対して実質的に1です。

影響力のある観察: 各ユニットを個別に削除し、各観察を個別に削除し、ユニットのクラスターを削除して、モデルの推定を試みました。実際の変化はありません。

提案された解決策:誰かが、インストルメントされた推定効果を元のメトリック(0-1)で要約するのではなく、その予測バージョンのメトリックで要約するべきだと提案しました。範囲は-0.01〜0.1で、平均および中央値は約0.02、SDは約0.018です。我々は、推定効果を要約していた場合は 1枚のSDの増加、言って、によって、それは次のようになり (その他の仕様はほぼ同じ結果が得られ)。これはかなり合理的な方法です(それでもまだ十分です)。完璧なソリューションのようです。私が誰かがそうするのを見たことがないことを除いて。誰もが、元の内生変数のメトリックを使用して第2段階の係数を解釈しているように見えます。x1x1x1x10.01830=0.54

質問: IVモデルで、内生変数の増加の推定効果(実際にはLATE)を、予測されたバージョンのメトリックを使用して要約することは正しいですか?私たちの場合、そのメトリックは予測確率です。

注:バイナリの内生変数がある場合でも、2SLSを使用します(最初のステージをLPMにします)。これは、Angrist&Krueger(2001)に続きます:「機器変数と識別の検索:需要と供給から自然実験まで」)Adams、Almeida、およびFerreira(2009)で使用されている3段階の手順も試しました:「創設者のCEOと会社の業績の関係を理解する」。後者のアプローチは、プロビットモデルとそれに続く2SLSで構成されており、より小さく、より適切な係数を生成しますが、0-1メトリック(約9-10)で解釈すると、それらは非常に大きくなります。Cerulliのivtreatregのprobit-2sls-optionで行うのと同じ結果を手動計算でも得ます。


試しましたetregress/treatregか?
Dimitriy V. Masterov、2015年

こんにちはディミトリ、応答ありがとうございます!今私はetregressを試してみましたが、多少似た結果が得られます。しかし、StataのマニュアルとWooldridge(2002)を読むと、「断面とパネルデータの計量経済分析」この種の処理回帰モデルは、処理の無視可能性を想定しているという印象を受けます。つまり、観測された変数を条件として、ユニットが処理されるかどうかは、処理と制御の両方でのその(潜在的な)結果とは無関係です。
Bertel 2015年

(続き)私たちのデータでは、この仮定を実際に維持することはできません。にランダムな変動の原因があるだけです。したがって、IVは適切なオプションのようです。とにかく、仮定が正しければ。x
Bertel 2015年

生の変数や残差の散布図やカーネル密度プロットなど、いくつかのグラフを用意しておくと、非常に役立ちます。plim、計測器と誤差項の間の小さな相関でさえ、強い一貫性のない推定を引き起こす可能性があります!β^1=β1+Cov(z1,u)Cov(z1,x1)β1
Arne Jonas Warnke 16

回答:


2

これは、古い質問ですが、将来的に渡ってつまずく人のために、直感的に2SLS推定である「還元型」回帰からβ1α1

y=α0+α1z1+Zα+u

「第1段階」回帰の除算π1

x1=π0+π1z1+Zπ+v

したがって、 2SLS推定値が「信じられないほど大きい」場合は、および OLS推定値を確認してください。β1α1π1

場合見積もりは「合理的な」問題がある可能性があり見積もりは「非常に小さいです。」を「非常に小さい」割ると、「信じられないほど大きい」ます。α1π1α^1π^1β^1

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.