相違点とは何ですか？

43

違いの違いは、特に経済学において、非実験的なツールとして長い間人気がありました。誰かが違いの違いに関する以下の質問に明確で非技術的な答えを提供してください。

差分の推定量とは何ですか？
差異の差の推定量が使用されるのはなぜですか？
実際に差の推定値を信頼できますか？

regression econometrics difference-in-difference

— グラハム・クックソン
ソース

gretlの差回帰の差を推定する方法を知っている人はいますか？OLSまたはパネルデータを使用する必要がありますか？

3

@Pycaコメントの不適切な使用のように聞こえます。これを参照して、新しい質問を投稿してください。

— -chl

66

相違点推定量の
違いは何ですか相違点の相違（DiD）は、治療群と対照群の結果における治療前後の違いを比較する治療効果を推定するツールです。一般に、に、結果（賃金、健康など）に対する治療（労働組合の状態、投薬など）の効果を推定することに関心があります。ここで、は個々の固定効果（経時的に変化しない個人の特性）、は時間固定効果、は、個人の年齢のような時変共変量であり、 $D_i$ $Y_i$

Y_{i t} = α_{i} + λ_{t} + ρ D_{i t} + X_{i t}^{'} β + ϵ_{i t}

$Y_{it} = \alpha_i + \lambda_t + \rho D_{it} + X'_{it}\beta + \epsilon_{it}$

α_{i}

$\alpha_i$

λ_{t}

$\lambda_t$

X_{i t}

$X_{it}$

ϵ_{i t}

$\epsilon_{it}$ はエラー用語です。個人と時間は、それぞれとでインデックス付けされます。固定効果と間に相関がある場合、固定効果が制御されていないことを考えると、OLSを介したこの回帰の推定は偏ります。これは典型的な省略された変数バイアスです。

i

$i$

t

$t$

D_{i t}

$D_{it}$

治療の効果を見るために、治療を受けた世界と受けていない世界の人の違いを知りたいと思います。もちろん、実際に観測できるのはこれらのうちの1つだけです。したがって、結果に同じ治療前の傾向がある人を探します。2つの期間と2つのグループます。次に、治療グループと対照グループの傾向が治療なしで以前と同じように続くという仮定の下で、治療効果を $t = 1, 2$ $s = A,B$

ρ = (E [Y_{i s t} | s = A, t = 2] - E [Y_{i s t} | s = A, t = 1]) - (E [Y_{i s t} | s = B, t = 2] - E [Y_{i s t} | s = B, t = 1])

$\rho = (E[Y_{ist}|s=A,t=2] - E[Y_{ist}|s=A,t=1]) - (E[Y_{ist}|s=B,t=2] - E[Y_{ist}|s=B,t=1])$

グラフィカルには、これは次のようになります。ここに画像の説明を入力してください

これらの平均を手で簡単に計算できます。つまり、両方の期間でグループ平均結果を取得し、それらの差を取ることができます。次に、両方の期間でグループ平均結果を取得し、それらの差を取ります。次に、違いの違いを取り、それが治療効果です。ただし、回帰フレームワークでこれを行う方が便利です。これにより、 $A$ $B$

共変量を制御する
治療効果の標準誤差を取得して、有意であるかどうかを確認する

これを行うには、2つの同等の戦略のいずれかを実行できます。対照群のダミー生成者がグループである場合に1に等しく、そうでなければ0を、時間ダミー生成場合は1に等しく、、およびそうでなければ0をそして、回帰 $\text{treat}_i$ $A$ $\text{time}_t$ $t=2$

Y_{i t} = β_{1} + β_{2} ({treat}_{i}) + β_{3} ({time}_{t}) + ρ ({treat}_{i} \cdot {time}_{t}) + ϵ_{i t}

$Y_{it} = \beta_1 + \beta_2 (\text{treat}_i) + \beta_3 (\text{time}_t) + \rho (\text{treat}_i \cdot \text{time}_t) + \epsilon_{it}$

または、人が治療グループに属し、期間が治療後の期間であり、それ以外の場合はゼロである場合、1に等しいダミーを生成します。次に、を回帰します $T_{it}$

Y_{i t} = β_{1} γ_{s} + β_{2} λ_{t} + ρ T_{i t} + ϵ_{i t}

$Y_{it} = \beta_1 \gamma_s + \beta_2 \lambda_t + \rho T_{it} + \epsilon_{it}$

ここで、はコントロールグループのダミーで、は時間ダミーです。2つの回帰により、2つの期間と2つのグループに対して同じ結果が得られます。2番目の式はより一般的ですが、複数のグループと期間に簡単に拡張できます。どちらの場合でも、これは、制御変数を含めることができるように差パラメーターの差を推定する方法です（混乱を避けるために上記の式からそれらを省きましたが、単にそれらを含めることができます）。推論のため。 $\gamma_s$ $\lambda_t$

差分推定器の違いが役立つのはなぜですか？
前述のように、DiDは非実験データで治療効果を推定する方法です。これが最も便利な機能です。DiDは、固定効果推定のバージョンでもあります。固定効果モデルは想定していますが、は同様の想定を行いますが、グループレベルでは。したがって、ここでの結果の期待値は、グループと時間効果の合計です。それで、違いは何ですか？DiDの場合、繰り返される断面が同じ集合単位から描画される限り、必ずしもパネルデータは必要ありません。これにより、パネルデータを必要とする標準の固定効果モデルよりも幅広いデータにDiDを適用できます。 $E(Y_{0it}|i,t) = \alpha_i + \lambda_t$ $E(Y_{0it}|s,t) = \gamma_s + \lambda_t$ $s$

違いの違いを信頼できますか？
DiDで最も重要な仮定は、並行トレンドの仮定です（上の図を参照）。これらの傾向をグラフィカルに示していない研究を決して信用しないでください！1990年代の論文はこれを取り除いたかもしれませんが、今日ではDiDの理解ははるかに優れています。治療グループと対照グループの治療前の結果に並行する傾向を示す説得力のあるグラフがない場合は、注意してください。並行トレンドの仮定が成り立ち、治療を混乱させる可能性のある他の時変変化を確実に除外できる場合、DiDは信頼できる方法です。

標準エラーの処理に関しては、別の注意事項を適用する必要があります。長年のデータを使用して、自己相関の標準誤差を調整する必要があります。過去にはこれは無視されてきましたが、Bertrand et al。（2004）「差異の差の推定値をどれだけ信頼すべきか？」これが問題であることはわかっています。論文では、自己相関に対処するためのいくつかの救済策を提供しています。最も簡単な方法は、個々の時系列間の残差の任意の相関を可能にする個々のパネル識別子でクラスタリングすることです。これにより、自己相関と不均一分散の両方が修正されます。

詳細については、WaldingerとPischkeによるこれらの講義ノートを参照してください。

— アンディ
ソース

6

ウィキペディアにはこの主題に関する適切なエントリがありますが、関心のある独立変数間の相互作用を可能にする線形回帰を使用しないのはなぜですか？これは私にとってより解釈しやすいようです。次に、関心のある変数が定量的である場合は、単純な勾配の分析について読むことができます（Googleブックスの無料のCohenらの本）。

— スティーブンターナー
ソース

0

これは、時系列の外因性イベントの影響を調べるために計量経済学で広く使用されている手法です。調査したイベントの前後に関連する2つの別個のデータグループを選択します。詳細については、Wooldridge 著『Introduction to Econometrics』を参照してください。

— カルロス・デュトラ
ソース

2

簡潔で非技術的な答えとして、これはアンディの答えを補足するものですが、「差の差の推定値を実際に信頼できるのか」をカバーしているとは思いません。

— シルバーフィッシュ

0

慎重に：

さらに2つの点に注意してください。最初に、元の92のDD論文のうち80には、観測単位が変動レベルよりも詳細であるため、グループ化された誤差項に関する潜在的な問題があります（Donald and Lang [2001]で議論された点）。標準エラーをクラスタリングするか、データを集約することで、この問題に対処しているのはこれらの論文のうち36件のみです。第二に、介入変数の内因性の可能性に対処するために、いくつかの手法が（多少非公式に）使用されます。たとえば、3つの論文には式（1）の遅延従属変数が含まれ、7つの論文には治療状態に固有の時間傾向が含まれ、15のグラフは治療効果のダイナミクスを調べるためにいくつかのグラフをプロットし、3つは前に「効果」があるかどうかを調べます法律、効果が持続するかどうかの2つのテスト、そして、11は、別のコントロールグループを見つけることにより、トリプル差分（DDD）を正式に試みます。Bertrand、Duflo、およびMullainathan [2002]では、これらの手法のほとんどがシリアル相関の問題を軽減しないことを示しています。

（Bertrand、Duflo、Mullainathan 2004、253）

— ここに新しい
ソース