Cox PH分析および共変量選択における傾向スコアの重み付け


10

イベント発生までの時間の生存データのコックス比例ハザードモデリングを行う際の傾向スコアの重み付け(IPTW)について:

私は、ほとんどの場合、患者がベースラインですでに服用していた薬剤の治療効果を調べることに関心がある、予想されるレジストリデータを持っています。したがって、データを最適に分析する方法がわかりません。潜在的に、いくつかのベースライン変数はかなりの程度、治療によって影響され、その逆ではありません(たとえば、特定のバイオマーカー)。重みを推定するための傾向スコアモデルに含める必要がある共変量と、coxphモデルに共変量として含める必要がある共変量(ある場合)について少し迷っています。正しい方向のヒントがあれば役立ちます。現在のところ、CoxPhモデリングでこれに関する文献を見つけることはできません。

ベースラインで開始され、結果に影響を与える可能性のある治療を表す共変量は、Cox PH共変量として含める必要があると考えていますが、これはわかりません。

傾向スコアの重みの計算に使用するのではなく、Coxモデルに共変量として含める必要がある変数をどのように決定しますか?


フォローアップの質問:

私は、すでに始まっている特定の介入の治療効果を評価するという相続問題を理解しています。つまり、観察を始める前に、患者に蔓延しています。リスクの時間変動に関連するバイアスの導入(たとえば、治療の最初の年に一般的な有害な副作用)と治療によって影響を受ける共変量の両方について。私が間違っていない場合-これは、心血管エンドポイントとホルモン補充療法に関して、観察と無作為化の間の不一致の原因として提案されています。一方、私のデータセットでは、治療の悪影響の可能性を調べることに関心があります。

傾向スコア調整を使用して、一般的なユーザー間の治療効果を調査する場合、つまり、観察が始まる前にすでに薬物を使用しているコホートデータで、薬物療法の悪影響を観察した場合(これは私たちが探していたものです)。治療に伴うリスクを過大評価する可能性を排除できますか?つまり、リスクが大幅に上昇している限り、それは最も「確実に」防御的ではありませんか?

この種のバイアスが、この文脈での偽のリスク関連のリスクの過大評価をもたらす可能性がある例を完全に描くことはできません。

回答:


8

理論的には、傾向スコアの重みの一部として選択するすべての変数をモデルの共変量として含める必要はありません。これは、潜在的な交絡について重み付けがすでに制御されているためです。適切な重み付けモデルを使用すると、文字通り、露出の影響をモデル化できます。

そうは言っても、モデルに用語を含めたい理由はいくつかあります。

  • 「二重にロバスト」な見積もり。精度の低下を除いて、重み付けモデルと共変量の両方で変数を使用できない理由はありません。理論的には、2つの方法が混乱しないように保護します(したがって、この手法は「二重に堅牢」と呼ばれます)。これは、正しいモデルを指定する「2回目のチャンス」を与えることで、PSモデルまたは共変量モデルのいずれかが誤って指定されるのを防ぐだけであり、魔法の修正ではないことに注意してください。
  • 興味のある複数の見積もり。重み付けにより、共変量からの効果の推定値が消えます。変数の回帰係数が必要な場合は、PSモデルではなく CoxPHステップに共変量としてそれを含めます。

疫学アメリカの疫学ジャーナルなどのジャーナルや生物統計学の文献で「二重に頑健」や類似の用語を検索してみてください。有用な情報源がいくつか見つかります。


(迅速)かつ明確な答えをありがとう!二重の堅牢性が言及されているのを見てきましたが、多くのことを検討しました。私は間違いなくそうします。重み付け後に共変量が適切に調整されない場合(たとえば)治療グループ間の有意差が依然としてある場合、二重にロバストな推定値の使用が保証されると思いますか?
Kjetil Loland 2013年

1
@KjetilLolandそれは二重にロバストな推定を使用する理由かもしれません-一般に、変数を制御するための1つの方法が誤指定に悩んでいることを心配するときはいつでもそれは見るべきものです。また、PSモデルが機能していないことと、2つのグループ間で傾向スコアが重複していることを確認します。
2013年

1
ハザード比は折りたたみできないため、PSに変数を含めるだけでは不十分です。PSに「キッチンシンク」を含め、既知の最も重要な予測子を共変量として再び含めるのが一般的です。これにより、曝露のハザード比の過小評価を防ぐことができます。
フランクハレル2013年

繰り返しますが、@ EpiGradとFrankの両方に回答いただきありがとうございます。治療グループが良い、重複する傾向スコアを持っているとは正確には言えません。だから私は多分大規模な共変量調整を使用することになるでしょう。余談ですが、実際にはtwangパッケージを使用しているときにIPTWを作成したことに気づきました-これは一般化されたブースト回帰を使用して重みを推定します(私が正しい場合)-しかし、それは一般的なアプローチを変更しないと思いますたくさん。
Kjetil Loland 2013年

@KjetilLoland治療グループごとの分布のプロットの重複を確認することにより、PSスコアが重複しているかどうかを少なくとも視覚的に検査できます。
2013年

3

「治療の影響を受ける」と「治療に関連する」を区別することが重要です。後者には、傾向や共変量調整で調整しようとしているものなどの治療選択係数を含めることができます。「治療の影響を受ける」とは、共変量がゼロ時間後(たとえば、ランダム化後または治療開始後)に測定されることを意味します。つまり、これらはほとんど使用されません。


もう一度、ハレル博士に感謝します。私たちの変数のいくつかは間違いなく「治療の影響を受けています」。私たちが調査しようとしている治療は、ベースラインの前に開始されましたが、これはもちろん理想的ではありません。傾向スコア調整がこの種の分析にまったく適しているかどうかは、おそらくもっと良い問題です。しかし、私はこれを調査する他の方法を知りません。
Kjetil Loland

研究デザインは、あなたがやりたいことに適していない場合があります。この研究は解釈が非常に難しいでしょう。あなたは、主題の専門家に、治療によって変化しない可能性が非常に高い変数のサブセットを考え出そうとするかもしれませんが、含意による交絡の調整は不完全かもしれません。
フランクハレル2013年

そうですか。これは、CVDに関する古い観察対ランダム化HRT研究のように見え始めていると思います。私が間違っている場合は修正してください。ただし、考えられる有害な治療効果(私たちが求めているもの)のリスクを過小評価するために「リスクを負う」わけではありません。つまり、治療が有害であると示している限りこれらの種類の交絡因子は、発見を弱めるだけかもしれませんか?それに応じて質問を更新しました。
Kjetil Loland 2013年

2
これは観察とランダム化の問題以上のものですが、HRT研究との関係があります。いくつかの注意深い推論は、結果を下限を提供するものとして扱うことを正当化するかもしれないことは正しいかもしれません。
フランクハレル2013年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.