傾向スコアのすべてを調整しますか?


9

方法論に関する質問があるため、サンプルデータセットが添付されていません。

特定の薬物が結果のリスクを低減するかどうかを調べることを目的とした、傾向スコア調整済みCox回帰を行う予定です。研究は観察的であり、10,000人の個人を含みます。

データセットには60個の変数が含まれています。これらのうち25が治療の割り当てに影響を与える可能性があると私は判断します。私はCox回帰でこれらすべての25を調整することはありませんが、傾向スコアに予測子としてその多くの変数を含めることができ、Cox回帰には傾向スコアサブクラスと処理変数のみを含めることができると聞きました。

(もちろん、プロップスコア調整後に等しくない共変量は、Cox回帰に含める必要があります)。

結論として、その多くの予測子を小道具スコアに含めるのは本当に賢明ですか?


@Dimitriy V. Masterovこれらの重要な事実を共有していただきありがとうございます。他の回帰フレームワークを検討している本や記事とは異なり、傾向スコア分析でのモデル選択に関する(Rosenbaumsの本を読んで)ガイドラインはありません。標準的な教科書やレビュー記事では、常に厳しい変数選択を推奨し、予測子の数を低く抑えているようですが、プロップスコア分析では、このような議論はあまり見ていません。あなたは書く:(1)「理論的洞察、制度的知識、そして良い研究はXの選択を導くべきである」。私は同意しますが、変数が手元にあり、変数が治療の割り当てまたは結果に影響を与えるかどうかが実際にはわからない(しかし可能性がある)状況があります。例:濾過率で測定した腎機能を、スタチン治療の調整を目的とした支柱スコアに含めますか?スタチン治療は腎機能とは何の関係もありません。私はすでにスタチン治療に影響を与える一連の変数を含めました。しかし、それでも腎機能を含めるのは魅力的です。さらに調整される可能性があります。これは結果に影響を与えるので含める必要があると言う人もいますが、私たちが知る限り、治療にも結果にも影響を与えない変数の別の例(バイナリ変数アーバン/ルーラルリビングなど)を挙げます。それが含まれている限り、私はそれを含めたいと思います tプロップスコアの精度に影響します。(2)「治療の影響を受けるXを、治療後または治療を見越して事前に含めると、仮定が無効になります。」ここで何を言っているのかわかりません。しかし、スタチンが心血管転帰に及ぼす影響を研究する場合、傾向脂質に血中脂質のさまざまな測定値を含めます。血中脂質は治療によって影響を受けます。私はこの発言を誤解したと思います。

@statsRusは、事実、特に「入力の選択に関するメモ」と呼んでいるものを共有してくれてありがとう。私もあなたと同じように推論します。

残念ながら、プロップスコアメソッドでは、モデル選択戦略ではなく、さまざまな調整戦略について説明しています。おそらくモデルフィットは重要ではありません。その場合は、結果と治療の割り当てにわずかに影響する可能性のあるすべての変数を調整します。私は統計学者ではありませんが、モデルの適合が重要でない場合は、治療の割り当てと結果に影響を与える可能性のあるすべての変数を調整したいと思います。これは、多くの場合、治療によって影響を受ける変数を含めることを意味します。

さらに、一部の人々は、その後のCox回帰には治療変数とプロップスコアサブクラスのみを含める必要があると示唆しています。他の人は、coxの調整には、調整する他のすべての変数に加えてプロップスコアを含めることを推奨しています。

回答:


8

私が個人的にこの質問をしているのは少なくとも5年間です。なぜなら、それは私にとって、因果効果を推定するために観測データで傾向スコアマッチングを使用するための「大きな」実用的な質問だからです。これは素晴らしい質問であり、統計とコンピュータサイエンスコミュニティの深い部分で微妙な意見の相違があります。

私の経験から、統計学者は傾向スコアの推定に観察可能な入力の「台所の流しを投げる」ことを提唱する傾向がありますが、コンピュータ科学者は入力の理論的な理由を提唱する傾向があります(統計学者は時々選択の正当化における理論の重要性に言及するかもしれませんが)傾向スコアモデルへの入力)。その違いは、コンピューター科学者(特にユダヤパール)が有向非巡回グラフに関して因果関係を考える傾向があるという事実に起因すると私は信じています。有向非循環グラフを介して因果関係を表示すると、いわゆる「コライダー」変数で条件付けできることが簡単にわかります。これは、バックドアパスを「ブロック解除」し、実際に因果効果の推定にバイアスを引き起こす可能性があります。

私の持ち帰り?治療への選択に影響を与えるものについて確固たる理論がある場合は、傾向スコア推定でそれを使用してください。次に、感度分析を行って、観測されていない交絡変数に対する推定の感度を決定します。あなたを導くための理論がほとんどない場合は、「台所の流し」を投入し、感度分析を行ってください。

傾向スコアモデルの入力の選択に関する注意事項(これは明白かもしれませんが、観測データから因果効果を推定することに慣れていない他の人には注意する価値があります):治療後の変数を制御しないでください。つまり、傾向スコアモデルへの入力を治療前に測定し、結果を治療後に測定する必要があります。観測データでは、これは事実上、共変量のベースラインの詳細なセット、2番目の波で測定された治療、および最後の波で測定された結果を含む、3つのデータ波が必要であることを意味します。


これは、コライダー変数の条件付けの問題に対処する最近の論文です(彼らの論文は、Mバイアスがおそらく小さいことを示唆しており、傾向スコアモデルに入力を投げる「キッチンシンク」アプローチに信用を与えています:arxiv.org/abs /1408.0324
statsRus

7

P

ロジットPSを使用した共変量調整には多くの利点があります。私は通常、PSのロジットにスプラインをかけ、非重複領域に関するデューデリジェンスを行った後、多自由度調整変数として含めます。参照http://www.citeulike.org/user/harrelfe/article/13340175http://www.citeulike.org/user/harrelfe/article/13265389にし、より多くの記事をhttp://www.citeulike.org/ user / harrelfe / tag / propensity-score

Y

私は、一致する観測を破棄する結果となる、またはデータセットの順序に大きく依存するすべての一致方法に疑問があります。破棄された観測は、共変量効果をどのように推定すべきかについて多くのことを述べています。


リンクが壊れています。マッチングに生のPSではなくPSのロジットを使用する利点は何ですか?
DS_Enthusiast

マッチングについては関係ありません。ただし、マッチングの使用はお勧めしません。
フランクハレル

3

X

XX治療を見越して、仮定を無効にします。たとえば、エージェントがワクチンが来ることを知っている場合、彼は彼の発砲前の行動を調整するかもしれません。インストゥルメント(結果ではなく参加に影響を与える変数)を含めることも悪い考えです。彼らは選択の偏りには役立ちませんし、サポートの問題を劇的に悪化させるかもしれません。たとえば、一部の人々が治療を受けることを奨励されている場合、あなたはそれを条件にしたくありません。傾向スコアの指定に無関係な変数を含めると、処理された一部を分析から破棄する必要があるか、制御ユニットを複数回使用する必要があるか、帯域幅を増やす必要があるため、分散が増加する可能性があります。要するに、台所の流しのアプローチは絶対にお勧めできません。

CIAは、実験データまたは「過剰識別」仮定(プログラム前テストまたは他の偽プラセボテストの場合のように)なしではテストできません。十分な履歴データがある場合は、厳選されたセットで間違いなく後者を試します。


編集への対応:
腎臓は私の領域の外にあるので、コメントすることはできません(パイ以外は知っています)。アーバンは、治療と検査のための病院への旅行に関連するコストを通じて、参加と結果の両方に影響を与える変数のようです。それは夜に私たちを追い続ける観測できないもののいくつかを拾うかもしれません。私が念頭に置いている予想の話は、たとえば食事療法を変えることによって将来治療されることがわかっている場合、人々は彼らの行動を調整するかもしれないということです。


2

傾向スコアモデルは純粋に予測的であるため、係数には興味がありません。コホートエントリと結果の両方に影響を与えるすべての変数を当てはめるよりも、常に理解しています。モデルの予測品質を向上させている限り、これらの変数を好きなようにねじることができます-それらを二乗したり、ルート化したり、すべてのタイプの相互作用などを行うことができます。

理論的には、これらの結果をサンプルを超えて一般化する必要がないため、予測モデルのホールドアウトデータについて心配する必要はありません(基本的に、「過剰適合」のリスクは問題ではありません)。最後に、ロジスティック回帰に限定する必要はありません。バイナリ出力をモデリングしているときは、GAMモデルを使用することもできます。基本的には、予測率を向上させるために何でも使用できます。

(私は@statsRusの使用上のポイントに反対の注記として追加する必要があります:私の経験では、すべての変数を使用するのはコンピューター科学者であり、それぞれを慎重に検討する統計学者です。異なる仕事の背景は異なる作業習慣を生み出すと思います。)

スコアの使用に関しては、一般的にスコアを共変量として使用することはお勧めしません-影響は少なく、スコアリング変数を作成するために使用される変数と一緒に使用することはできません。傾向スコアで連続変数(たとえば、年齢)を分類した場合、モデルに連続バージョンを含めることができますが、実際には変数を最初に分類しないと、議論が生じる可能性があります...

マッチングにスコアを使用すること(キャリパーを使用-特に可変1:Nマッチング)は人気がありますが、最もインパクトのある手法は、インバースプロポーショナルトリートメントウェイト(IPTW)だと思います。できます。

トロント大学のピーターC.オースティンの研究を見てみてください。彼は傾向スコアに関する大量の論文を書いています。 たとえば、マッチングに関するものです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.