Cox比例ハザードモデルで相互検証を行う方法


15

1つのデータセット(モデル構築データセット)で特定の疾患の発生に関する予測モデルを構築し、新しいデータセット(検証データセット)でモデルがどのように機能するかを確認したいとします。ロジスティック回帰で構築されたモデルの場合、モデル構築データセットから取得したモデル係数に基づいて検証データセット内の各人の予測確率を計算し、カットオフ値でそれらの確率を二分した後、2x2テーブルを構築できますこれにより、真の陽性率(感度)と真の陰性率(特異性)を計算できます。さらに、カットオフを変更してROC曲線全体を作成し、ROCグラフのAUCを取得できます。

ここで、実際に生存データがあると仮定します。そのため、モデル作成データセットでCox比例ハザードモデルを使用し、検証データセットでモデルがどのように機能するかを確認したいと思います。ベースラインリスクはCoxモデルのパラメトリック関数ではないため、モデル構築データセットで取得したモデル係数に基づいて検証データセットの各人の予測生存確率を取得する方法はわかりません。それでは、検証データセットでモデルがどのように機能するかを確認するにはどうすればよいですか?これを行うための確立された方法はありますか?はいの場合、それらはソフトウェアに実装されていますか?提案を事前に感謝します!

回答:


9

この設定では、ROC曲線は役に立ちませんが、一般化されたROC領域(c-index、二分法はまったく必要ありません)は有用です。R rmsパッケージは、c-indexを計算し、クロス検証またはブートストラップのオーバーフィッティング修正バージョンを計算します。モデルを完全に事前指定するか、リサンプルごとに後方ステップダウンアルゴリズムを繰り返す場合、データを保持することなくこれを実行できます。あなたが本当に外部の検証を行いたい場合は、あなたの検証のサンプルが膨大である場合、すなわち、次のように使用できるrms機能を:rcorr.censval.surv


答えてくれてありがとう。この設定でROC曲線が役に立たない理由を説明できますか?そのようなアプローチが使用されたいくつかの著名なアプリケーションを見てきました(例:Hippisley-Cox et al。(2007)。英国の新しい心血管疾患リスクスコアであるQRISKの導出と検証:前向き公開コホート研究。)British Medical Journal 、335(7611):136)、だから今私は彼らの方法について疑問に思っています。
ウルフギャング

1
ここに例えがあります。老化がランニング能力にどのように関係しているかを評価することに興味があるとします。ROCアプローチでは、誰かのランニング能力を考慮して、特定の(任意の)年齢を超える確率を質問します。コホート研究では、唯一の独立変数と従属変数の役割を逆に混乱を追加し、ROC曲線も悪い統計的習慣であることが知られており、予測、上のカットオフを作るために1を誘惑-参照biostat.mc.vanderbilt.edu/をCatContinuous。havockの作成に加えて、カットポイントは実際には他のすべての予測子の関数でなければなりません。
フランクハレル

繰り返しますが、返信いただきありがとうございます。しかし、私は完全には納得していません。連続変数の任意の分類は悪い習慣であることに完全に同意しますが、ROCアプローチはすべての可能なカットオフを分類し、AUCを介してその情報を要約します。したがって、その中に意性はありません。また、ロジスティック回帰モデルの標準的で受け入れられている慣行のようです。だから、一般的にROC曲線の使用に反対ですか、それとも単に生存モデルのコンテキストでですか?
ウルフギャング

2
X=xX>c

私の経験から、多くの研究者/実践者が実際に二分法の決定ルールを望んでいることがわかります(それが有用かどうかは別として)。とにかく、私はそれらのR関数のいくつかをフォローアップし、これが私をどこに導くかを見ます。議論してくれてありがとう。
ウルフギャング

0

私はこの質問がかなり古いことを知っていますが、同じ問題に遭遇したときにやったことは、予測セットを使用して検証セットの各サブジェクトの「スコア」を取得することでした。これに続いて、スコアが中央値よりも高いか低いかに応じて被験者を分割し​​、カプラン・マイヤー曲線をプロットしました。モデルが予測的である場合、これは被験者の分離を示すはずです。また、Rの生存パッケージのcoxph関数を使用して、スコア(実際にはそのln(正規分布)の)と生存の相関をテストしました。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.