ROC曲線分析での共変量の調整


20

この質問は、相関スケールの存在下で、バイナリエンドポイントを予測するための多次元スクリーニングアンケートのカットオフスコアの推定に関するものです。

アルコール依存症のスクリーニングに使用される可能性のある測定スケール(性格特性)の各次元でカットオフスコアを考案する際に、関連するサブスコアを制御することの関心について尋ねられました。つまり、この特定のケースでは、人は外部共変量(予測子)の調整に関心がありませんでした-これは、共変量調整ROC曲線((1-2)など)の下の(部分)領域につながりますが、本質的には他のスコアそれらは互いに相関しているため、同じアンケートから(例えば、「衝動性」と「感覚を求める」)。左側に関心のあるスコア(カットオフを求める)と同じアンケートから計算された別のスコアを含むGLMを構築しますが、右側には結果が飲酒ステータスである場合があります。

(@robinリクエストごとに)明確にするために、我々は持っていると仮定し言う、スコアを(例えば、不安、衝動性、神経症、感覚求めて)を、そして私たちは、カットオフ値の検索したい場合(すなわち、「正の場合」、それ以外の場合は「負のケース」)。通常、このようなカットオフを考案する際に、性別や年齢などの他のリスク要因を調整します(ROC曲線分析を使用)。さて、SSはIMPと相関することが知られているので、性別、年齢、および感覚探索(SS)の衝動性(IMP)を調整するのはどうでしょうか。言い換えれば、年齢、性別、不安レベルの影響が取り除かれたIMPのカットオフ値があります。x j t j x j > t jj=4xjtjxj>tj

カットオフはできる限りシンプルに保つ必要があると言うこととは別に、私の応答は

共変量については、予測パフォーマンスが向上するかどうかを確認するために、調整ありと調整なしでAUCを推定することをお勧めします。ここで、共変量は同じ測定機器から定義された他のサブスコアに過ぎず、このような状況に直面したことはありません(通常、年齢や性別などの既知のリスク要因に基づいて調整します)。[...]また、あなたは予後の問題(すなわち、アンケートのスクリーニング効果)に興味があるので、陽性の予測値(PPV、陽性結果が正しく分類された患者の確率)の推定にも興味があります。アンケートのサブスコアに応じて、被験者を「ポジティブ」または「ネガティブ」に分類できます。ただし、

可能であれば、関連する論文へのリンクを使用して、この特定の状況をより完全に理解していますか?

参照資料

  1. Janes、H and Pepe、MS(2008)。診断、スクリーニング、または予後マーカーの研究における共変量の調整:新しい設定における古い概念American Journal of Epidemiology、168(1):89-97。
  2. Janes、H and Pepe、MS(2008)。ROC分析における共変量の調整UW Biostatistics Working Paper Series、ペーパー322。

私は専門家ではありませんが、「測定スケールの各次元でカットオフスコアを考案する際に関連するサブスコアを制御する」という文は少し難解でした。もう1行説明してもらえますか(そうでなければ、質問を理解するのが難しいと思います)。
ロビンギラード

j=4tjバツj>tj

調査の質問に対する[相関]回答が与えられた場合、最終目標がバイナリ値を予測することである場合、これは標準のバイナリ分類問題によく似ています。このように考えるのが適切でしょうか?または、「カットオフ値」(これについては何も知りません)を思いつくことが非常に重要ですか?
DavidR

@DavidRさて、アイデアはカットオフ値を決定することです(「特定の値を超えるリスクにさらされている対象」を読んでください)。こちらです。(以前にあなたのコメントに気付かなかったのでごめんなさい!)
chl

回答:


7

あなたが分析を想像した方法は、実際に私があなたがそれについて考えることから始めることを提案する方法ではありません。まず、カットオフを使用する必要がある場合、カットオフは個々のフィーチャではなく全体的な予測確率に適用されることを示すのは簡単です。単一の共変量の最適なカットオフは、他の共変量のすべてのレベルに依存します。一定にすることはできません。第二に、ROC曲線は、個々の被験者に最適な決定を下すという目標を達成する上で役割を果たしません。

相関スケールを処理するには、多くのデータ削減手法が役立ちます。それらの1つは、各予測変数が他のすべての予測変数から非線形に予測される形式的な冗長性分析です。これはredun、R Hmiscパッケージの関数に実装されています。変数クラスタリング、主成分分析、因子分析なども可能です。しかし、私の見解では、分析の主要な部分は、適切な確率モデル(たとえば、バイナリロジスティックモデル)を構築する必要があります。


1
個人とグループの決定に関する重要な区別については+1。ここでの回答またはmedstatsメーリングリストでのあなたの別の回答を考えて、私はあなたの応答を予期していたはずです。また、診断リスクモデルに基づく診断ユーティリティの直接的な測定に関するあなたの講演も、この点で特に啓発的でした。
chl

診断リスクモデル上の診断ユーティリティベースの直接の措置の話は今ここで見つけることができますkc.vanderbilt.edu/quant/Seminar/HarrellPresentMay12.pdf
Epifunky

3

共変量を調整したROC曲線に関するJanes、Pepeの記事のポイントは、推定ROC曲線値のより柔軟な解釈を可能にします。これは、関心のある母集団の特定のグループ間でROC曲線を階層化する方法です。推定真陽性割合(TPF; eq。感度)および真陰性割合(TNF; eq。特異性)は、「同じ[調整済み変数の個体間で疾患状態がY / Nである場合の正しいスクリーニング結果の確率リスト]"。一見したところ、パネルにもっと多くのマーカーを組み込むことで、あなたがやろうとしているのは診断テストを改善することです。

これらの方法をもう少しよく理解するための良い背景は、Cox比例ハザードモデルについて読んで、Pepeの本「分類と医療検査の統計的評価」を参照することです。スクリーニングの信頼性測定値は、近似スコアを生存時間と考えて、生存曲線と同様の多くの特性を共有していることに気付くでしょう。Coxモデルが生存曲線の層化を可能にするように、彼らは層化された信頼性尺度を与えることを提案します。

これが私たちにとって重要な理由は、バイナリ混合効果モデルのコンテキストで正当化される可能性があります。あなたがメット中毒になるリスクを予測したいとします。SESにはこれに対する明らかな支配的な効果があり、何らかの方法で層別化せずに、個人の行動に基づいた診断テストを評価するのは愚かに思えます。なぜなら、金持ちがman病やうつ病の症状を示したとしても、おそらく彼らは覚醒剤を試すことはないだろうからです。しかし、貧しい人は、そのような心理的症状を抱えるはるかに大きなリスクの増加を示します(そして、より高いリスクスコア)。リスクの大まかな分析では、2つのグループの同じ差が信頼できないため、予測モデルのパフォーマンスが非常に低いことが示されます。ただし、層別化した場合(金持ちと貧乏人)、

共変量調整のポイントは、異なるモデル間でのリスクモデルの普及率と相互作用が低いため、異なるグループを同種と見なすことです。


(+1)それは興味深い反応です、ありがとうございました。この記事の執筆時点での主な懸念は、カットオフ値がいくぶん「相互依存」することでした。しかし、私は(いくつかの配布資料を発見したペペの本をチェックよここその間に)。
chl

医療検査の開発と評価に同じデータを使用することには問題がありますが、修正は簡単です。ある種の相互検証、またはデータを「トレーニング」サブセットと「検証」サブセットに分割することを検討する必要があります。これは通常、診断/予後/リスク予測モデルを開発するための有効なアプローチです。
AdamO
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.