生存関数の適合度を評価する方法


9

私は生存分析の初心者ですが、分類と回帰についてはある程度の知識があります。

回帰については、MSEとRの2乗統計があります。しかし、生存モデルAは、ある種のグラフィカルプロット(KM曲線)に加えて、生存モデルBよりも優れていると言えるでしょうか。

可能であれば、違いを例で説明してください(Rのrpartパッケージなど)。1つのCARTサバイバルツリーが別のCARTサバイバルツリーよりも優れていることをどのように示すことができますか?どの指標を使用できますか?


3
生存分析にはさまざまな種類があります。それらのいくつかは確かに回帰に基づいています。それらのいくつかは、KMのように、生存関連の統計の推定量としてより簡単に考えられるかもしれません。
Alexis

引き続き質問の改善に努めていただきありがとうございます。私はそれが現在CVに答えられる/適切であると思う。再開のために推薦しました。他の人が同意するかどうかを確認します。あなたが人々がこれらの問題を説明するのに使うために2つのCARTタイプの生存モデルを投稿することができればそれは助けになるかもしれません。
gung-モニカの復活

1
ベン、それで基本的に、コックス比例ハザード回帰分析では、(これまでのところ)適合度を評価する良い方法はないと言っているのですか?R-Squareは、打ち切られた観測と打ち切られていない観測を正しく処理できないため、良い結果につながりませんか?あなたはハレルスcについて話しているのですが、その方法がCox-PH回帰に適用できないことは理解できましたか?
コスタS.17年

回答:


9

Coxモデルような統計に関する主な問題R2(別の回答で説明されています)は、データの検閲分布に非常に依存しているということです。nullモデルに対する尤度比など、他の自然なものにもこの問題があります。(これは基本的に、1つはPDFから、もう1つはCDFからのイベントであるため、打ち切りデータポイントの尤度への寄与は、イベントが観測されたデータポイントの寄与とは大きく異なるためです。)さまざまな研究者がこれを回避する方法を提案しましたが、私が見た方法は通常、検閲分布のモデルまたは同等に非実用的なモデルを必要とします。この依存関係が実際にどれほどひどいのかは調べていません。そのため、検閲がかなり穏やかな場合でも、尤度比ベースの統計を調べることができます。サバイバルCARTモデルの場合、

一般的な生存モデルの場合、頻繁に使用される統計の1つは、Kendallの類似したHarrellのcインデックスまたは生存モデルのROC AUCです。基本的に、cは、1つのインスタンスが他のインスタンスよりも後にイベントを経験したことがわかっているすべてのインスタンスのうち、モデルが正しくランク付けされる割合です。(つまり、ここで分母に含まれるインスタンスのペアでは、多くても1つを打ち切り可能であり、他の1つがイベントを経験したで打ち切りする必要があります。)cインデックスは、検閲分布にも依存しますが、ハレルによれば、私が前述した他の統計よりも依存は穏やかです。残念ながら、ハレルのcτまた、上記の統計よりも感度が低いため、モデル間の差が小さい場合は、それに基づいてモデルを選択したくない場合があります。これは、異なるモデルを比較する方法よりも、一般的なパフォーマンスの解釈可能なインデックスとして役立ちます。

(最後に、もちろん、モデルに特定の目的がある場合、つまり、予測損失関数が何であるかを知っている場合は、常に損失関数に従ってモデルを評価できます。しかし、私は推測しています。それほど幸運ではありません...)

尤度比統計とハレルのcの両方の詳細については、ハレルの優れた教科書「回帰モデリング戦略」をご覧ください。生存モデルの評価に関するセクションは§19.10、pp。492-493です。申し訳ありませんが、明確な答えは1つもありませんが、これは解決された問題ではないと思います。


5

生存データのコックス比例ハザード回帰は、多くの点で標準回帰に対応すると考えることができます。たとえば、Cox回帰は、残差標準誤差とR二乗統計も提供します。coxphR survivalパッケージの関数を参照してください。(KM曲線は、標準統計のノンパラメトリック分析に対応すると考えることができます。ノンパラメトリック検定をCARTにどのように組み込みますか?)実際に臨床データを使用すると、残留標準誤差は高くなり、R二乗値は低くなる傾向がありますコックス回帰。

したがって、標準回帰とCox回帰には同様の要件と制限があります。コックス分析では、比較されているハザードが時間に比例しているという仮定がさらに含まれているという根本的な仮定にデータが適合していることを確認する必要があります。それでも、過剰適合を回避する必要があり、モデルを検証する必要があります。そして、CARTを理解しているので、私自身はCARTを使用していませんが、ネストされていないモデルを比較することによって生じる困難に直面することになります。


Cox回帰と回帰の違いと関係についてお答えいただきありがとうございます。しかし、私は2つのrpart(CART)決定木生存モデルを比較する方法を知りたいです。
2014

projecteuclid.org/euclid.ssu/1315833185でリンクされているオープンアクセスペーパーは、rpart他のRパッケージとコードに基づいて、サバイバルツリーを構築および選択する方法のかなり最近のレビューと比較です。
EdM 2014

紙をご用意いただきありがとうございます。今すぐ新聞を読みます。
2014年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.