私は生存分析の初心者ですが、分類と回帰についてはある程度の知識があります。
回帰については、MSEとRの2乗統計があります。しかし、生存モデルAは、ある種のグラフィカルプロット(KM曲線)に加えて、生存モデルBよりも優れていると言えるでしょうか。
可能であれば、違いを例で説明してください(Rのrpartパッケージなど)。1つのCARTサバイバルツリーが別のCARTサバイバルツリーよりも優れていることをどのように示すことができますか?どの指標を使用できますか?
私は生存分析の初心者ですが、分類と回帰についてはある程度の知識があります。
回帰については、MSEとRの2乗統計があります。しかし、生存モデルAは、ある種のグラフィカルプロット(KM曲線)に加えて、生存モデルBよりも優れていると言えるでしょうか。
可能であれば、違いを例で説明してください(Rのrpartパッケージなど)。1つのCARTサバイバルツリーが別のCARTサバイバルツリーよりも優れていることをどのように示すことができますか?どの指標を使用できますか?
回答:
Coxモデルような統計に関する主な問題(別の回答で説明されています)は、データの検閲分布に非常に依存しているということです。nullモデルに対する尤度比など、他の自然なものにもこの問題があります。(これは基本的に、1つはPDFから、もう1つはCDFからのイベントであるため、打ち切りデータポイントの尤度への寄与は、イベントが観測されたデータポイントの寄与とは大きく異なるためです。)さまざまな研究者がこれを回避する方法を提案しましたが、私が見た方法は通常、検閲分布のモデルまたは同等に非実用的なモデルを必要とします。この依存関係が実際にどれほどひどいのかは調べていません。そのため、検閲がかなり穏やかな場合でも、尤度比ベースの統計を調べることができます。サバイバルCARTモデルの場合、
一般的な生存モデルの場合、頻繁に使用される統計の1つは、Kendallの類似したHarrellのcインデックスまたは生存モデルのROC AUCです。基本的に、cは、1つのインスタンスが他のインスタンスよりも後にイベントを経験したことがわかっているすべてのインスタンスのうち、モデルが正しくランク付けされる割合です。(つまり、ここで分母に含まれるインスタンスのペアでは、多くても1つを打ち切り可能であり、他の1つがイベントを経験した後で打ち切りにする必要があります。)cインデックスは、検閲分布にも依存しますが、ハレルによれば、私が前述した他の統計よりも依存は穏やかです。残念ながら、ハレルのcまた、上記の統計よりも感度が低いため、モデル間の差が小さい場合は、それに基づいてモデルを選択したくない場合があります。これは、異なるモデルを比較する方法よりも、一般的なパフォーマンスの解釈可能なインデックスとして役立ちます。
(最後に、もちろん、モデルに特定の目的がある場合、つまり、予測損失関数が何であるかを知っている場合は、常に損失関数に従ってモデルを評価できます。しかし、私は推測しています。それほど幸運ではありません...)
尤度比統計とハレルのcの両方の詳細については、ハレルの優れた教科書「回帰モデリング戦略」をご覧ください。生存モデルの評価に関するセクションは§19.10、pp。492-493です。申し訳ありませんが、明確な答えは1つもありませんが、これは解決された問題ではないと思います。
生存データのコックス比例ハザード回帰は、多くの点で標準回帰に対応すると考えることができます。たとえば、Cox回帰は、残差標準誤差とR二乗統計も提供します。coxph
R survival
パッケージの関数を参照してください。(KM曲線は、標準統計のノンパラメトリック分析に対応すると考えることができます。ノンパラメトリック検定をCARTにどのように組み込みますか?)実際に臨床データを使用すると、残留標準誤差は高くなり、R二乗値は低くなる傾向がありますコックス回帰。
したがって、標準回帰とCox回帰には同様の要件と制限があります。コックス分析では、比較されているハザードが時間に比例しているという仮定がさらに含まれているという根本的な仮定にデータが適合していることを確認する必要があります。それでも、過剰適合を回避する必要があり、モデルを検証する必要があります。そして、CARTを理解しているので、私自身はCARTを使用していませんが、ネストされていないモデルを比較することによって生じる困難に直面することになります。
rpart
他のRパッケージとコードに基づいて、サバイバルツリーを構築および選択する方法のかなり最近のレビューと比較です。