これは計量経済学における選択モデルのバリエーションです。ここで選択したサンプルのみを使用した推定の妥当性は、
。ここではの病状です。Pr(Yi=1∣Xi,Di=1)=Pr(Yi=1∣Xi,Di=0)Dii
詳細を示すには、次の表記を定義します:
および ; た場合を指す試料中にあります。さらに、簡単にするために、はから独立していると仮定します。π1=Pr(Di=1)π0=Pr(Di=0)Si=1iDiXi
サンプルのユニットのの確率は、
は繰り返し予測の法則によるものです。病状および他の共変量条件とすると、結果
はとは無関係です。結果として、
Yi=1i
Pr(Yi=1∣Xi,Si=1)===E(Yi∣Xi,Si=1)E{E(Yi∣Xi,Di,Si=1)∣Xi,Si=1}Pr(Di=1∣Si=1)Pr(Yi=1∣Xi,Di=1,Si=1)+Pr(Di=0∣Si=1)Pr(Yi=1∣Xi,Di=0,Si=1),
DiXiYiSiPr(Yi=1∣Xi,Si=1)=Pr(Di=1∣Si=1)Pr(Yi=1∣Xi,Di=1)+Pr(Di=0∣Si=1)Pr(Yi=1∣Xi,Di=0).
これは参照することは容易である
ここで、とは、定義したサンプリングスキームです。したがって、
Pr(Di=1∣Si=1)=π1pi1π1pi1+π0pi0 and Pr(Di=0∣Si=1)=π0pi0π1pi1+π0pi0.
pi1pi0Pr(Yi=1∣Xi,Si=1)=π1pi1π1pi1+π0pi0Pr(Yi=1∣Xi,Di=1)+π0pi0π1pi1+π0pi0Pr(Yi=1∣Xi,Di=0).
もし、
そしてサンプルの選択問題を省略できます。一方、、
一般に。特定のケースとして、ロジットモデルを考えます。
Pr(Yi=1∣Xi,Di=1)=Pr(Yi=1∣Xi,Di=0)Pr(Yi=1∣Xi,Si=1)=Pr(Yi=1∣Xi),
Pr(Yi=1∣Xi,Di=1)≠Pr(Yi=1∣Xi,Di=0)Pr(Yi=1∣Xi,Si=1)≠Pr(Yi=1∣Xi)
Pr(Yi=1∣Xi,Di=1)=eX′iα1+eX′iα and Pr(Yi=1∣Xi,Di=0)=eX′iβ1+eX′iβ.
とが全体で一定
である場合でも、結果の分布はロジット形成を維持しません。さらに重要なのは、パラメーターの解釈がまったく異なることです。うまくいけば、上記の引数はあなたの問題を少し明確にするのに役立ちます。
pi1pi0i
を追加の説明変数として含め、基づいてモデルを推定するのです。の使用の正当性を正当化するには、あることを証明する必要があり、これはは十分な統計です。サンプリングプロセスに関する詳細情報がなければ、それが本当かどうかはわかりません。抽象表記を使ってみましょう。可観測性変数は、および他の確率変数のランダム関数と見なすことができます。DiPr(Yi∣Xi,Di)Pr(Yi∣Xi,Di)Pr(Yi∣Xi,Di,Si=1)=Pr(Yi∣Xi,Di)DiSiSiDiZi。示す。場合は
とは独立したを条件と、我々が持っている
独立の定義による。ただし、の独立していないでコンディショニング後と、
直感的に約いくつかの関連情報が含まれ
、そして一般的にはSi=S(Di,Zi)ZiYiXiDiPr(Yi∣Xi,Di,S(Di,Zi))=Pr(Yi∣Xi,Di)ZiYiXiDiZiYiPr(Yi∣Xi,Di,S(Di,Zi))=Pr(Yi∣Xi,Di)。したがって、「しかし」の場合、サンプルの選択を知らないことが推論を誤解させる可能性があります。私は計量経済学におけるサンプル選択の文献にあまり詳しくありません。Microeconometrics: methods and applications' by Cameron
and Trivedi (especially the Roy model in that chapter). Also G. S.
Maddala's classic book
計量経済学における限定従属変数と定性変数の第16章は、サンプルの選択と個別の結果に関する問題を体系的に処理することをお勧めします。