非比例ハザードに関する推奨事項


7

これは長い間悩まされてきた問題であり、教科書、Google、またはStack Exchangeで良い答えを見つけられませんでした。

4つの治療法が比較されている10万人を超える患者のデータセットがあります。研究の問題は、一連の臨床的/人口統計学的変数を調整した後、これらの治療の間で生存率が異なるかどうかです。未調整のKM曲線は次のとおりです。

ここに画像の説明を入力してください

非比例ハザードは、私が使用したすべての方法で示されました(たとえば、調整されていない対数-生存曲線、時間との相互作用、シェーンフィールド残差とランク付き生存時間の相関、これらは調整されたCox PHモデルに基づいています)。対数生存曲線は以下のとおりです。ご覧のとおり、非比例の形は混乱しています。2つのグループの比較はどれも、個別に処理するのが難しいほどのものではありませんが、6つの比較があるという事実は、本当に困惑しています。私の推測では、1つのモデルですべてを処理することはできません。

ここに画像の説明を入力してください

これらのデータをどうするかについての推奨事項を探しています。拡張されたCoxモデルを使用してこれらの効果をモデル化することは、非比例の比較と異なる形式の数を考えると、おそらく不可能です。彼らが治療の違いに興味を持っていることを考えると、全体的な層別モデルは、これらの違いを推定することができないため、選択肢にはなりません。

したがって、私を自由に引き離してください。しかし、最初に層別モデルを推定して、他の共変量の効果を得るために(もちろん、相互作用なしの仮定をテストして)、次に、それぞれについて個別の多変数Coxモデルを再推定することを考えていました。 2グループ比較(つまり、合計6モデル)。このようにして、2つのグループの比較ごとに非比例の形式に対処し、誤った推定HRを取得できます。標準誤差には偏りがあることは理解していますが、サンプルサイズを考えると、すべてが「統計的に」有意である可能性があります。


Cox回帰の代わりに傾向スコアで臨床/人口統計変数を調整してみましたか?この豊富なデータの傾向を利用して、スコアとのマッチングが可能になる場合があります。
EdM 2017年

@EdMこれらのデータは対象外です。傾向スコアを複数のカテゴリデータ(つまり、> 2カテゴリ)と正確に一致させる方法に関する私の不確実性のため、この方法を試すことができませんでした。ただし、私の経験では、多変数分析の結果は、傾向スコア一致分析の結果と非常に似ています(両方の目的が選択バイアスに対処することである場合)。ですから、私は同じように非比例性の問題が発生すると思います。
ライアンW.17年

それは結果の異質性を交絡させるためではありません。
フランクハレル2017年

回答:


3

素晴らしい質問の素晴らしい答え。対数正規生存モデルなど、非常に異なる仮定をしたモデルを検討する必要があることを付け加えます。log-logの代わりに、y_axisに通常の逆関数を使用します。まだ共変量調整が必要です。したがって、処理によって層別化された残差の正規性も見てください。これは、http://biostat.mc.vanderbilt.edu/rmsのコースノートの終わり近くのケーススタディで説明されています。


あなたの洞察をありがとう; 私はパラメトリックモデルを考慮していませんでした。ほとんどのモデリングはSASで行うので、rmsパッケージを使用して対数正規モデルを推定する方法を示すコースノートは非常に役に立ちました。対数正規モデルの適合は理想的ではありませんが、報告することは十分であり、十分だと思います(残差)。PIは必然的に、単一の研究が決して決定的なものではないことを思い出させる必要があります。再度、感謝します。
ライアンW.

5

あなたは確かに限界比例ハザードを持っていません。これは、条件付き比例ハザードがないという意味ではありません!

さらに詳しく説明するために、次の状況を考えてみましょう。グループ1があり、非常に均質でハザード= 1が一定であるとします。ここで、グループ2には、不均一な母集団があります。50%はグループ1(ハザード= 0.5)よりもリスクが低く、残りはグループ1(ハザード= 3)よりもリスクが高くなっています。明らかに、グループ2の全員がリスクの高い対象か低い対象かを知っていれば、誰もが比例して危険を伴うことになります。これは条件付きの危険です。

しかし、グループ2の誰かが高リスクか低リスクかを知らない(または無視する)としましょう。次に、それらの周辺分布は混合モデルのものです。50%の確率でハザード= 0.5、50%でハザード= 3になります。以下に、2つのハザードのプロットと共にRコードをいくつか示します。

# Function for computing the hazards from 
# a 50/50 heterogenious population
mix_hazard <- function(x, hzd1 = 0.5, hzd2 = 3){
  x_dens <- 0.5 * dexp(x, hzd1) + 0.5 * dexp(x, hzd2)
  x_s    <- 1 - ( 0.5 * pexp(x, hzd1) + 0.5 * pexp(x, hzd2)) 
  hzd    <- x_dens/x_s
  return(hzd)
}

x <- 0:100/20
plot(x, mix_hazard(x), 
     type = 'l',
     col = 'purple', ylim = c(0, 2), 
     xlab = 'Time', 
     ylab = 'Hazard', 
     lwd = 2)
lines(x, rep(1, length(x)), col = 'red', lwd = 2)

legend('topright', 
       legend = c('Homogeneous',
                  'Heterogeneous'), 
       lwd = 2,
       col = c('red', 'purple'))

ここに画像の説明を入力してください

比例しない限界的な危険がはっきりと見えます!ただし、グループ2の被験者が高リスク被験者であるか低リスク被験者であるかを知っている場合、比例ハザードが発生することに注意してください。

それで、これはあなたにどのように影響しますか?まあ、あなたはあなたがこれらの主題について他の多くの共変量を持っていると述べました。これらの共変量を無視すると、ハザードが非比例的である可能性が非常に高くなりますが、それらを調整した後、さまざまなグループの不均一性の原因を把握し、非比例的ハザードの問題を修正できます。


1
返信してくれてありがとう!欠落している共変量問題が非比例ハザードとして現れる可能性があるため、あなたの主張はよく理解されています。対数対数生存曲線は調整されていませんが、関心のあるすべての共変量を調整した後、時間との相互作用およびシェーンフィールド残差を使用して非比例性をテストしたことを言及するのを忘れていました。これを反映するように投稿を編集しました。
Ryan W.
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.