条件付きおよび無条件の変位値回帰の違いは何ですか?


38

τth
ρτ=UIτ-1UI<0、Uiが

β^QR=minbi=1nρτ(yiXibτ)
ρτ=ui(τ1(ui<0))ui

Firpo等による論文で(2009)、著者は、条件付き分位回帰は興味深い効果をもたらさないと述べています。彼らは、条件付きの結果を母集団に一般化することはできないと言います(OLSでは、反復期待の法則によって条件付きから無条件にいつでも移行できますが、これは変位値には使用できません)。これは、τth無条件変位値yiτth条件変位値y_i | X_iと同じではない可能性があるためyi|Xiです。

正しく理解できれば、問題の一部は、共変量を含めるとエラーが観測成分と非観測成分に分割されるため、X_iに含まれる共変量がXiランキング変数u_iに影響するuiことです。これが問題を引き起こす理由を私はまったく理解できません。

私の質問は次のとおりです。

  1. 条件付きおよび無条件の分位効果が互いに異なるのはなぜですか?
  2. 条件付き分位点回帰の係数をどのように解釈できますか?
  3. 条件付き分位点回帰は偏っていますか?

参照:

  • Koenker、R.、&Bassett、G.(1978) "Regression Quantiles"、Econometrica、Vol。46(1)、33-50ページ。
  • Firpo、S. et al。(2009)「無条件分位点回帰」、エコノメトリック、Vol。77(3)、953〜973ページ。

1
AngristとPischkeによる「ほとんど無害な計量経済学」の第7章を確認することをお勧めします。分位点回帰係数の解釈の例と、Xを条件とする分位点の含意の例があります。1つの共変量の影響を隔離する場合を除き、これらの含意はモデルの使用に対して無効化しないことに同意します。分位点回帰にも偏りがあると思います。AngristとPischkeは、たとえば、省略された変数を制御するためのいくつかの提案された方法を探ります。
フアンC

1
答えではなく、おそらく手がかり-分位点回帰は「欠損データ」問題として投げかけることができます。欠損データは加重OLS回帰で使用される重みです。たとえば、逆の重みに指数分布を使用すると、回帰の中央値()が得られます。τ=50
確率論的

回答:


29

セットアップ
という形式の単純な回帰があるとします。 ここで、結果は個人対数収入であり、は学校教育の年数であり、はエラー用語。OLSを介して得られる教育の収益への平均効果だけを見るのではなく、結果分布のさまざまな部分での効果を確認する必要があります。 I S I ε I

lnyi=α+βSi+ϵi
iSiϵi

1)条件付き設定と無条件設定の違いは何ですか
最初にログ収益をプロットし、と 2人の個人を選択します。ここで、は無条件収益分布の下部にあり、は上部にあります。 B A BABABここに画像の説明を入力してください

極端に普通に見えるわけではありませんが、それはシミュレーションで200の観測値しか使用していないためです。ここで、長年の教育で収益を調整するとどうなりますか?教育のレベルごとに、「条件付き」収益分布が得られます。つまり、上記のように密度のプロットが表示されますが、教育のレベルごとに別々になります。

ここに画像の説明を入力してください

2本の濃い青色の線は、中央値(下の線)と90パーセンタイル(上の線)での線形分位点回帰から予測される収益です。5年と15年の教育での赤の密度は、条件付きの収益分布の推定値を提供します。ご覧のように、個人は5年間の教育を受けており、個人は15年間の教育を受けています。どうやら、個人は、5年間の教育ブラケットで彼の梨の中で非常によくやっているので、彼女は90パーセンタイルにいます。B AABA

そのため、別の変数を条件にすると、ある人が条件付き分布の上部になり、その人が無条件分布の下部になります-これが分位点回帰係数の解釈を変更するものです。どうして?

OLSを使用して、反復された期待値の法則を適用することでからことができると既に述べましたが、これは期待値演算子のプロパティであり、(残念ながら!)したがって、一般的に、任意の分位数。これは、最初に条件付き分位点回帰を実行し、次に条件付き変数を統合して、OLSのように解釈できる限界効果(無条件効果)を取得することで解決できます。このアプローチの例は、Powell(2014)によって提供されています。Q τY I | S IQ τY IτE[yi|Si]=E[yi]Qτ(yi|Si)Qτ(yi)τ

2)分位点回帰係数の解釈方法
これはトリッキーな部分であり、私はこれに関する世界のすべての知識を所有していると主張していないので、おそらく誰かがこれについてより良い説明を思い付くでしょう。これまで見てきたように、収益分配における個人のランクは、条件付き分配と無条件分配のどちらを考慮するかによって大きく異なります。

条件付き分位回帰の
場合治療の前後に結果分布のどこに個人がいるのかわからないため、分布全体についてのステートメントのみを作成できます。たとえば、上記の例では、は、教育の追加年が条件付き収益分布の90パーセンタイルの収益を増やすことを意味します(ただし、その分位点にまだ誰がいるかはわかりません)人々に教育の追加年を割り当てました)。そのため、条件付き分位推定値または条件付き分位処理効果は、多くの場合「興味深い」とは見なされません。通常、治療は分布だけでなく、手元の個人にどのように影響するかを知りたいと思います。β90=0.13

無条件の分位回帰の場合
これらは、解釈に使用されるOLS係数のようなものです。ここでの難しさは、解釈ではなく、常に簡単ではない係数の取得方法です(非常にまばらなデータの場合、統合が機能しない場合があります)。再配置された影響関数を使用するFirpo(2009)の方法など、分位点回帰係数を周辺化する他の方法が利用可能です。コメントで言及されたAngrist and Pischke(2009)の本は、分位点回帰係数の周辺化はまだ計量経済学の活発な研究分野であると述べています-しかし、私が知っている限り、今日ではほとんどの人が統合方法に落ち着いています(例はMelly and Santangelo(2015)は、Changes-in-Changesモデルに適用します)。

3)条件付き分位点回帰係数は偏っていますか? いいえ(正しく指定されたモデルを持っていると仮定)、彼らはあなたが興味を持っているかもしれないし、そうでないかもしれない異なる何かを測定するだけです。反例として、義務教育の追加年を導入し、これが人口の所得の不平等を減らすかどうかを知りたい政策立案者を考えてみましょう。

上の2つのパネルは、がすべての変位値で定数である純粋な位置シフト、つまり定数変位値処理効果を示しています。つまり、場合、追加年教育を行うことで、収益分配全体で収益が8%増加します。 β 10 = β 90 = 0.8βτβ10=β90=0.8

変位値処理効果が一定でない場合(下の2つのパネルのように)、位置効果に加えてスケール効果もあります。この例では、所得分布の下部が上部よりも大きくシフトしているため、90-10の差(所得の不平等の標準的な尺度)は人口が減少しています。 ここに画像の説明を入力してください

どの個人がそれから利益を得るか、または分布のどの部分で一番下から始めたのかわかりません(その質問に答えるには、無条件の変位値回帰係数が必要です)。たぶん、この政策は彼らを傷つけ、他のものに比べてさらに低い部分に置くかもしれませんが、義務教育の追加の年が収入の広がりを減らすかどうかを知ることが目的であれば、これは有益です。そのようなアプローチの例は、ブルネロ他です。(2009)

内因性の原因による変位値回帰のバイアスにまだ関心がある場合は、変位値コンテキストの省略された変数バイアス式を導き出すAngrist et al(2006)を参照してください。


1
現在、この手法のR実装はありますか?
チャンドラー

1

@Andyが提供する優れた答えに加えて。あなたはチェックアウトしたいかもしれません:

Borah、BJ、およびBasu、A。(2013)。「投薬順守を評価するためのアプリケーションを通じて、条件付きおよび無条件の変位値回帰アプローチの違いを強調しています。」Health Economics、22(9)、1052〜1070。http://doi.org/10.1002/hec.2927

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.