傾向スコアは、回帰に共変量を追加することとどのように異なりますか?


41

傾向スコアと因果分析に比較的慣れていないことは認めます。

新人として私には明らかではないことの1つは、傾向スコアを使用した「バランス」が、回帰に共変量を追加したときに起こることと数学的に異なることです。操作の違いは何ですか?また、回帰に部分母集団の共変量を追加するよりも優れているのはなぜですか?

メソッドの経験的比較を行ういくつかの研究を見てきましたが、2つのメソッドの数学的特性と、PSMが回帰共変量を含むのに因果解釈に役立つ理由に関する良い議論は見ていません。また、この分野では多くの混乱と論争があり、事態をさらに難しくしています。

これについての考えや、区別をよりよく理解するための優れたリソース/論文へのポインタはありますか?(Judea Pearlの因果関係の本をゆっくりと進めているので、それを指す必要はありません)


3
Morgan and Winship、2007を読むことをお勧めします。第4章と第5章では、因果効果の特定のために回帰とマッチングの明示的な比較と対比を行います。
共役前

1
バランス統計をチェックするとき、多次元共変量空間に関して比較している治療グループ間に外挿がないことを確認しています。回帰はこれをチェックせずに単純に外挿するため、外挿は予測の質を低下させる可能性があります。
StatsStudent

回答:


17

大きな違いの1つは、回帰がこれらの特性を線形に「制御」することです。傾向スコアによる一致は、線形性の仮定を排除しますが、一部の観測が一致しない場合があるため、特定のグループについて何も言えない場合があります。

たとえば、労働者のトレーニングプログラムを勉強している場合、すべての登録者を男性にすることもできますが、コントロールの非参加者は男性と女性で構成されます。回帰を使用すると、たとえば、参加インジケーター変数と男性インジケーターで回帰、収入することができます。すべてのデータを使用し、プログラムに参加した女性の収入を推定できます。

マッチングを行っている場合、男性のみを男性に一致させることができます。その結果、分析に女性を使用せず、結果は女性に関係しません。

回帰は線形性の仮定を使用して外挿できますが、マッチングはできません。他のすべての仮定は、回帰とマッチングの間で本質的に同じです。回帰に対するマッチングの利点は、ノンパラメトリックであることです(ただし、マッチングの方法が正しい場合は、適切な傾向スコアがあると仮定する必要があります)。

詳細については、マッチング方法に重点を置いたコースの私のページをご覧ください。特に因果効果推定戦略の仮定を参照してください。

また、傾向スコアマッチングの概要を説明するRosenbaum and Rubin(1983)の記事も確認してください。

最後に、マッチングは1983年以来長い道のりを歩んできました。JasSekhonのWebページをチェックして、彼の遺伝的マッチングアルゴリズムについて学んでください


3
これは、私が統計学者ではないからかもしれませんが、OPが一般的な回帰について尋ねたときに線形回帰を仮定しているように思われる場合です。しかし、要点は、共変量をあらゆる種類のリグレッサに追加すると、入力スペースについていくつかの仮定が行われるため、新しい例に外挿できることであり、マッチングでは、どんな種類の外挿できるかについてより慎重になると思います。
-rrenaud

2
傾向関数を推定するとき、交絡変数の関数形式についていくつかの仮定を行います。また、傾向の「近い」値を持つ個人についても一致します。そのため、傾向の一致が非線形交絡因子効果の問題を解決するとすぐには思いません。
AdamO

2
リンクが壊れています。
カルロスチネリ

11

簡単な答えは、特に因果解釈に関して、傾向スコアは同等のANCOVAモデルより優れているということではありません。

傾向スコアは、データ削減方法として最もよく理解されています。これらは、多くの共変量を単一のスコアに削減し、一連の変数の対象効果を調整するために使用できる効果的な手段です。その際、複数の共変量ではなく、単一の傾向スコアを調整することにより、自由度を節約します。これは確かに統計上の利点を示しますが、それ以上のものはありません。

傾向スコアで回帰調整を使用する場合に発生する可能性のある問題の1つは、モデルに含まれる傾向スコアの推定に使用されるすべての共変量で回帰調整を実行するのではなく、傾向スコアを使用することで利益があるかどうかです。RosenbaumとRubinは、「多変量Xの共分散調整の分析からの治療効果の点推定値は、同じサンプル共分散行列が使用されるときはいつでも、Xに基づくサンプル線形判別の単変量共分散調整から得られる推定値に等しいことを示しました共分散調整と判別分析の両方」。したがって、両方の方法の結果は同じ結論につながるはずです。しかしながら、2段階の手順を実行する利点の1つは、相互作用と高次の項を含む非常に複雑な傾向スコアモデルを最初に適合できることです。この傾向スコアモデルの目標は、治療の割り当ての最適な推定確率を取得することであるため、このモデルの過剰なパラメーター化は関係ありません。

から:

無作為化されていないコントロールグループに対する治療の比較におけるバイアス削減のための傾向スコア法

ダゴスティーノ(ローゼンバウムとルービンを引用)

D'agostino、RB1998。治療と非ランダム化対照群との比較におけるバイアス削減のための傾向スコアのマッチング。統計医学17:2265–2281。


5
(+1)この関連する質問には、因果関係の問題に関する興味深いスレッドもありました。統計的な観点から、観察研究で傾向スコアを使用して因果関係を推測できますか?
CHL

3
私はこの答えの一般的な前提に同意しますが、傾向スコアに基づいて一致する場合、すべての共変量をモデルに取り込むことと同じではありません(したがって、次元削減手法ではありません)。傾向スコアで重み付けする場合も同じではありません。
アンディW

1
この答えには同意しません。推定傾向スコアは、治療群と対照群の共変量のバランスが取れている場合は良好であり、そうでない場合は不良です。回帰条件付けアプローチの場合とまったく同じです。それらが「より良い」かどうかは、そのプロパティのみに依存し、それは問題ごとに異なります。
共役前

1
基準であるバランスは同じですが、2つの戦略は異なり、その長所と短所は異なるため、私は同意しません。問題に応じて、より良いアプローチである場合とそうでない場合があります。実際、「同等の ANCOVAモデル」は明確に定義されていないようです。(同等の方法?)
共役前

1
右。「同等」の意味がわかりましたが、引用文の「ただし」で始まる文は、関連する違いを紹介しています:実際には小道具です。彼らはできるようにスコアが個別に正確に推定されている方法より危ない解析モデルよりも。(そして、引用されていない記事の次のパラグラフにも別の違いがあります。)
共役

7

わかりにくい参照の​​可能性がありますが、偶然アクセスできる場合は、この本の章を読むことをお勧めします(Apel and Sweeten、2010)。それは社会科学者を対象としており、おそらくあなたが望むように数学的に厳密ではないかもしれませんが、あなたの質問に対する満足のいく答え以上の十分な深さに入るべきです。

傾向モデルに単純に共変量を含めることで異なる結論に至る可能性のある傾向スコアを扱う方法はいくつかあります。スコアが一致する場合、必ずしもすべての観測に対して共通のサポートがあるわけではありません(つまり、治療グループに参加する機会がまったくないように見える観測と、常に治療グループに存在する観測があります)。また、異なる結論をもたらす可能性のあるさまざまな方法で観測に重みを付けることができます。

ここでの回答に加えて、引用された質問への回答をチェックアウトすることもお勧めします。傾向スコアの背後には、共変量のバランスを達成するための単なる統計的なトリックよりも多くの実体があります。RosenbaumとRubinの非常に引用された記事を読んで理解すると、回帰モデルに共変量を単純に追加するよりもアプローチが異なる理由がより明確になります。あなたの質問に対するより満足のいく答えは、必ずしも傾向スコアの背後にある数学ではなく、その論理にあると思います。


@Andy W更新された投稿で、共変量と傾向スコア調整との回帰の等価性について、RosenbaumとRubinからの引用を参照してください。
ブレット

0

PSは、分析から完全に分離された研究の設計部分として考えるのが好きです。つまり、設計(PS)と分析(回帰など)の観点から考えることができます。また、PSはバイナリ処理の交換可能性をサポートする手段を提供します。結果モデルに共変量を含めることが実際に交換可能性をサポートできるかどうか、または結果モデルに共変量を含める前に交換可能性を仮定するかどうかについてコメントすることができます。


-3

Stat Methods Med Res。2016年4月19日

傾向スコア調整された非線形回帰モデルのバイアスの評価。

一般に、傾向スコア法は、観察研究で条件付き治療効果を推定するときに観察される交絡を調整するために使用されます。一般的な方法の1つである回帰モデルの傾向スコアの共変量調整は、非線形モデルでバイアスされることが経験的に示されています。しかし、説得力のある根本的な理論的理由は提示されていません。傾向スコア推定量の整合性と非線形モデルの崩壊性の間のリンクを偽造するために単純な幾何学的アプローチを使用する、非線形モデルの傾向スコア調整治療効果のバイアスと一貫性を調査するための新しいフレームワークを提案します。このフレームワークの下で、結果モデルで傾向スコアを調整すると、観測された共変量が傾向スコアと剰余項に分解されることを示します。折りたたみ不可能な回帰モデルからこの剰余項を省略すると、条件付きオッズ比と条件付きハザード比のバイアス推定値になりますが、条件付きレート比ではありません。さらに、シミュレーション研究により、これらの傾向スコア調整推定量のバイアスは、治療効果のサイズが大きく、共変量効果が大きく、治療モデルと結果モデルの共変量の係数の非類似性が増加すると増加することを示します。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.