(かなり長い投稿、申し訳ありません。多くの背景情報が含まれているので、下部の質問に進んでください。)
イントロ:私たちは、バイナリ内生変数の影響を識別しようとしているプロジェクトに取り組んでいます、連続結果に、。私たちは、無作為に割り当てられると強く信じている楽器を考え出しました。
データ:データ自体はパネル構造になっており、約34,000の観測が1000ユニットと約56の期間に分散しています。は約700(2%)の観測値に対して1の値をとり、は約3000(9%)に対して値を受け取ります。111(0.33%)観察は、両方で1スコア上、それは上で1得点を観察するための二倍の可能性があるに、それはまた、スコア1が場合。
推定: Stataのivreg2プロシージャを使用して、次の2SLSモデルを推定します。
ここで、他の外因性変数のベクトルであり、 の予測値である第一段階から、そして及び誤差項です。
結果:すべてがうまく機能しているようです。推定第一段階において非常に重要であるとの推定第二段階において非常に重要です。他の外生変数の兆候を含め、すべての兆候は予想どおりです。ただし、問題は(関心のある係数)の推定値が信じられないほど大きい(または、少なくとも、これまでの解釈に従って)ことです。
範囲は約2から約26で、平均値と中央値は17ですが、の推定値は30から40の範囲です(仕様によって異なります)。
弱いIV:最初の考えは、これは楽器が弱すぎるためであると考えていました。つまり、内生変数とはあまり相関していませんが、実際にはそうではありません。それは違反に堅牢なテスト提供として、機器の弱点を調べるために、我々は、フィンレイ、Magnusson氏、およびシェーファーのweakivパッケージを使用私たちはパネルデータを持っていると私たちのSEの時をクラスタ化することを考えると、ここで関連する仮定を(、単位レベル)。
彼らのARテストによると、第2段階係数の95%信頼区間の下限は16〜29です(これも仕様によって異なります)。棄却確率は、ゼロに近いすべての値に対して実質的に1です。
影響力のある観察: 各ユニットを個別に削除し、各観察を個別に削除し、ユニットのクラスターを削除して、モデルの推定を試みました。実際の変化はありません。
提案された解決策:誰かが、インストルメントされた推定効果を元のメトリック(0-1)で要約するのではなく、その予測バージョンのメトリックで要約するべきだと提案しました。範囲は-0.01〜0.1で、平均および中央値は約0.02、SDは約0.018です。我々は、推定効果を要約していた場合は 1枚のSDの増加、言って、によって、それは次のようになり (その他の仕様はほぼ同じ結果が得られ)。これはかなり合理的な方法です(それでもまだ十分です)。完璧なソリューションのようです。私が誰かがそうするのを見たことがないことを除いて。誰もが、元の内生変数のメトリックを使用して第2段階の係数を解釈しているように見えます。
質問: IVモデルで、内生変数の増加の推定効果(実際にはLATE)を、予測されたバージョンのメトリックを使用して要約することは正しいですか?私たちの場合、そのメトリックは予測確率です。
注:バイナリの内生変数がある場合でも、2SLSを使用します(最初のステージをLPMにします)。これは、Angrist&Krueger(2001)に続きます:「機器変数と識別の検索:需要と供給から自然実験まで」)Adams、Almeida、およびFerreira(2009)で使用されている3段階の手順も試しました:「創設者のCEOと会社の業績の関係を理解する」。後者のアプローチは、プロビットモデルとそれに続く2SLSで構成されており、より小さく、より適切な係数を生成しますが、0-1メトリック(約9-10)で解釈すると、それらは非常に大きくなります。Cerulliのivtreatregのprobit-2sls-optionで行うのと同じ結果を手動計算でも得ます。
etregress/treatreg
か?