これは長い間悩まされてきた問題であり、教科書、Google、またはStack Exchangeで良い答えを見つけられませんでした。
4つの治療法が比較されている10万人を超える患者のデータセットがあります。研究の問題は、一連の臨床的/人口統計学的変数を調整した後、これらの治療の間で生存率が異なるかどうかです。未調整のKM曲線は次のとおりです。
非比例ハザードは、私が使用したすべての方法で示されました(たとえば、調整されていない対数-生存曲線、時間との相互作用、シェーンフィールド残差とランク付き生存時間の相関、これらは調整されたCox PHモデルに基づいています)。対数生存曲線は以下のとおりです。ご覧のとおり、非比例の形は混乱しています。2つのグループの比較はどれも、個別に処理するのが難しいほどのものではありませんが、6つの比較があるという事実は、本当に困惑しています。私の推測では、1つのモデルですべてを処理することはできません。
これらのデータをどうするかについての推奨事項を探しています。拡張されたCoxモデルを使用してこれらの効果をモデル化することは、非比例の比較と異なる形式の数を考えると、おそらく不可能です。彼らが治療の違いに興味を持っていることを考えると、全体的な層別モデルは、これらの違いを推定することができないため、選択肢にはなりません。
したがって、私を自由に引き離してください。しかし、最初に層別モデルを推定して、他の共変量の効果を得るために(もちろん、相互作用なしの仮定をテストして)、次に、それぞれについて個別の多変数Coxモデルを再推定することを考えていました。 2グループ比較(つまり、合計6モデル)。このようにして、2つのグループの比較ごとに非比例の形式に対処し、誤った推定HRを取得できます。標準誤差には偏りがあることは理解していますが、サンプルサイズを考えると、すべてが「統計的に」有意である可能性があります。