識別されたばかりの2SLSは中央値不偏ですか?


12

アン経験主義者の仲間:ほとんど無害計量経済学(AngristとPischke、2009:209ページ)私は、次をお読みください。

(...)実際、特定されたばかりの2SLS(たとえば、単純なWald推定量)はほぼ不偏です。識別されたばかりの2SLSにはモーメントがないため、これを正式に表示するのは困難です(つまり、サンプリング分布には太い尾があります)。それにもかかわらず、弱い機器であっても、特定されたばかりの2SLSは、本来あるべき場所のほぼ中央にあります。したがって、特定されたばかりの2SLSは中央値不偏であると言います。(...)

著者、特定されたばかりの2SLSは中央値で偏りがないと言っていますが、彼らはそれを証明せず、証拠への言及も提供しません。213ページで、彼らは再び命題について言及しているが、証拠への言及はない。また、MITの 22ページの機器変数に関する講義ノートでは、提案の動機を見つけることができません。

彼らのブログのメモでそれを拒否するので、理由は命題が間違っているかもしれません。ただし、特定されたばかりの2SLSはほぼ中央値で偏りがないと彼らは書いています。彼らは小さなモンテカルロ実験を使用してこれを動機付けていますが、近似に関連する誤差項の分析的証明または閉形式表現は提供していません。とにかく、これは、ミシガン州立大学のゲイリー・ソロン教授に対する著者の回答であり、2SLSが特定されたのは中央値で不偏ではないとコメントしました。

質問1:Gary Solonが主張するように、特定されたばかりの2SLSが中央値不偏でないことをどのように証明しますか?

質問2:ちょうど特定された2SLSがAngristとPischkeが主張するようにほぼ中央値で偏っていないことをどのように証明しますか?

質問1では、反例を探しています。質問2では、(主に)証拠または証拠への参照を探しています。

また、この文脈での中央値-偏りのない形式的な定義も探してます。次のように私は、概念を理解する:アン推定のいくつかのセットに基づいてののランダム変数は、中央値、公平のためのものである場合のみとの分布に中央値ある場合θX1N、Nθ θX1Nθθ^バツ1nθバツ1nnθθ^バツ1nθ


ノート

  1. 特定されたばかりのモデルでは、内因性のリグレッサーの数は機器の数に等しくなります。

  2. 特定されたばかりのインストルメンタル変数モデルを記述するフレームワークは、次のように表現できます。対象の因果モデルと第1段階の方程式は、 ここで、は内因性リグレッサーを記述する行列であり、インストルメント変数は行列によって記述されます。ここで、は、いくつかの制御変数を説明しています(たとえば、精度を向上させるために追加されます)。そして、とエラー項です。 XK×N+1のkK×N+1ZWU、V

    (1){Y=バツβ+Wγ+あなたはバツ=Zδ+Wζ+v
    バツk×n+1kk×n+1ZWあなたはv
  3. 2SLSを使用してを推定します。まず、を制御するを回帰し、予測値を取得します。これは最初の段階と呼ばれます。次に、制御するを回帰し。これは第2段階と呼ばれます。第2段階のの推定係数は、 2SLS推定です。1 X Z W X Y X W X ββ1バツZWバツ^Yバツ^Wバツ^β

  4. 最も簡単なケースでは、モデルあり、内因性リグレッサーを計測します。この場合、 2SLS推定値はあり、は、と間の標本共分散を示します。簡単にすることができます:ここで、、およびX 、I 、Z I β β 2SLS = S Z Y

    y=α+βバツ+あなたは
    バツzβsはABABを2 β 2SLS=ΣIYI- ˉ YのZI
    (2)β^2SLS=sZYsZバツ
    sABAB2
    (3)β^2SLS=yy¯zバツバツ¯z=β+あなたはあなたは¯zバツバツ¯z
    y¯=y/nバツ¯=バツ/nあなたは¯=あなたは/n、ここでは観測値の数です。n
  5. 質問1と2(上記を参照)に答える参考文献を見つけるために、単語「just-identified」と「median-unbiased」を使用して文献検索を行いました。見つかりませんでした。私が見つけたすべての記事(以下を参照)は、ちょうど特定された2SLSが中央値不偏であると述べるときに、Angrist and Pischke(2009:209、213ページ)を参照しています。

    • Jakiela、P.、Miguel、E.、&Te Velde、VL(2015)。あなたはそれを獲得しました:社会的選好に対する人的資本の影響を推定します。実験経済学、18(3)、385-407。
    • An、W.(2015)。ソーシャルネットワークでのピア効果の機器変数推定。社会科学研究、50、382-394。
    • Vermeulen、W。、およびVan Ommeren、J。(2009)。土地利用計画は地域経済を形成しますか?オランダの住宅供給、国内移住、現地雇用の伸びの同時分析。Journal of Housing Economics、18(4)、294-310。
    • Aidt、TS、&Leon、G.(2016)。民主的な機会の窓:サハラ以南のアフリカの暴動からの証拠。Journal of Conflict Resolution、60(4)、694-717。

2
私はこれを正式な証明で答えることはできませんでしたが、LIMLは中央値不偏(プラス定義)であり、1つの内生変数と1つの楽器を含むLIMLと2SLSは同じ小さなサンプル分布を持っていることを示すいくつかのシミュレーション研究(したがってLIMLがこの場合ケースは中央値不偏であり、2SLSも同様です。これはあなたの質問に答えるのに十分でしょうか?
アンディ

@アンディそれは本当に良い答えでしょう!他のユーザーの意見に応じて、おそらく十分です。たぶんそれは、ちょうど特定された2SLSがほぼ中央値不偏であるという命題の証拠はないと思うので十分です。ただし、識別されたばかりの2SLSが中央値不偏ではないことを示す反例があれば良いでしょう。しかし、私は反論例を自分で思いつくことは可能だと思います(しかし、難しいかもしれません)。
エリアス

ほぼ公平とは、バイアスが1 / nや1 / n ^ 2などの観測数の関数としてゼロになることを意味しますか?
イゴール

@Igor「おおよそ中央値-偏りのない」というフレーズは私には使用されていません。「中央値不偏」が正式に何を意味するのかわからないので、あなたの質問に答えることはできません。しかし、あなたが考えているのは、漸近的に偏りのない推定量です。
エリアス

回答:


5

シミュレーションスタディでは、中央値バイアスという用語は、推定値の真の値からの偏差の絶対値を指します(この場合、これはシミュレーションであるため、真の値を選択します)。表15にこのような中央値バイアスを定義するYoung(2017)のワーキングペーパー、または図2に異なる推定量の中央値バイアスグラフをプロットするAndrews and Armstrong(2016)のワーキングペーパーを見ることができます。

(文献でも)混乱の一部は、2つの別個の根本的な問題があるという事実に由来するようです。

  1. 弱い楽器
  2. 多くの(潜在的に)弱い楽器

識別されたばかりの設定で弱い楽器を使用するという問題は、いくつかの楽器が弱い場合とは非常に異なりますが、2つの問題は時々一緒に投げられます。

まず、ここで話している推定量の関係について考えてみましょう。「完全な方程式システムの推定と同時相関」のTheil(1953)は、いわゆる -klass推定器を導入しました: β = [ X 'I - κ M ZX ] - 1 [ X 'I - κ M Z Y]κ

β^=[バツκMZバツ]1[バツκMZy]

、方程式のシステムのために yMZ=ZZZ1Z

y=バツβ+あなたはバツ=Zπ+e

スカラー使用する推定量を決定します。あなたがのために、OLSに戻るあなたは2SLS推定器を持っている、とするとき最小のルートに設定されているおLIML推定器を持っている(Stock and Yogo、2005、p。111を参照)κκ=0κ=1κデットバツバツκバツMZバツ=0

漸近的に、LIMLと2SLSは同じ分布を持ちますが、小さなサンプルではこれは大きく異なる場合があります。これは、多くの楽器があり、そのうちのいくつかが弱い場合に特に当てはまります。この場合、LIMLは2SLSよりも優れたパフォーマンスを発揮します。ここでのLIMLは、中央値の偏りがないことが示されています。この結果は、一連のシミュレーション研究から得られます。通常、この結果を述べる論文は、ロスバーグ(1983)「構造モデルにおける推定量の漸近的性質」、澤(1972)、またはアンダーソンらを参照しています。(1982)

Steve Pischkeは、スライド17の2016年のノートでこの結果のシミュレーションを提供しており、OLS、LIML、および2SLSの分布を示しています。真の係数値は1です。2SLSがOLSにバイアスをかけている間、LIMLは真の値を中心としています。 ここに画像の説明を入力してください

現在、議論は次のように思われます:LIMLが不偏中央値であることが示され、ちょうど特定された場合(内生変数1つ、楽器1つ)LIMLと2SLSは同等であるため、2SLSも不偏中央値でなければなりません。

しかし、人々は再び「弱い楽器」と「多くの弱い楽器」のケースを混同しているように見えます。なぜなら、たった今特定された設定では、LIMLと2SLSの両方が弱いときにバイアスをかけられるからです。楽器が弱いときに識​​別されたばかりのケースでLIMLに偏りがないことが実証された結果は見たことがありませんが、これが真実だとは思いません。同様の結論は、2ページ目のGary Solo に対する AngristとPischke(2009)の回答から出ており、楽器の強度を変更する際のOLS、2SLS、およびLIMLのバイアスをシミュレートしています。 ここに画像の説明を入力してください

<0.1(標準誤差を固定)の非常に小さい第1段階係数、すなわち低い機器強度の場合、識別されたばかりの2SLS(したがって識別されたLIML)は、OLS推定器の確率限界にはるかに近い真の係数値1。

最初の段階の係数が0.1から0.2の間になると、彼らは最初の段階のF統計値が10を超えているため、Stock and Yogo(2005)によるF> 10の経験則に従って、弱い楽器の問題はもうないことに注意します。この意味で、私は、LIMLが、特定されたばかりのケースでの楽器の弱点の問題をどのように修正すべきかを理解できません。また、i)LIMLはより分散される傾向があり、標準エラーの修正が必要であることに注意してください(Bekker、1994を参照)およびii)楽器が実際に弱い場合は、2SLSもLIMLでも第2段階では何​​も見つかりません標準エラーが大きすぎるためです。


答えてくれてありがとう!これにより、すべてが明確になりました。
エリアス
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.