ROC曲線は、従来の推論ではできないことを教えてくれますか?


12

結果に対する測定の予測能力を判断するために、他のいくつかのテストでROC曲線を使用する傾向があるのはいつですか?

離散的な結果(生存/死亡、現在/不在)を処理する場合、ROC曲線がカイ二乗のようなものよりも多かれ少なかれ強力になるのはなぜですか?


ROC曲線とは何ですか?リンクを提供していただけますか?

回答:


12

ROC関数(必ずしも曲線ではない)を使用すると、特定の統計モデル(予測変数またはそれらのセットで構成される)によって提供される識別能力を評価できます。

ROCの主な考慮事項は、モデル予測は、予測変数によって提供される証拠に基づいて予測を判別/作成するモデルの能力に起因するだけではないということです。また、動作は、モデルが応答を予測するために必要な証拠の量と、これらの応答の結果を定義する応答基準です。応答基準に対して確立された値は、モデルの予測に大きく影響し、最終的にはモデルが行う間違いのタイプに影響します。

予測変数と応答基準を持つ一般的なモデルを考えます。このモデルは、YesまたはNoと応答することにより、Xの存在を予測しようとしています。したがって、次の混同マトリックスがあります。

                                **X present               X absent**
 **Model Predicts X Present**       Hit                   False Alarm

 **Model Predicts X Absent**      Miss                 Correct Rejection

このマトリックスでは、ヒットと誤報の割合のみを考慮する必要があります(他のものは1対1である必要があるため、これらから派生できるため)。応答基準ごとに、異なる混同マトリックスを作成します。エラー(ミスおよび誤アラーム)は負の関係にあります。つまり、誤アラームを最小化する応答基準はミスを最大化し、その逆も同様です。メッセージは次のとおりです。無料のランチはありません。

そのため、確立された応答基準とは無関係に、モデルがケースをどのように判別/予測するかを理解するために、考えられる応答基準の範囲全体で生成されたヒット率と偽率をプロットします。

このプロットから得られるのはROC関数です。関数の下の領域は、モデルの識別能力の公平でノンパラメトリックな尺度を提供します。この基準は、応答基準によって生じる可能性のある交絡がないため、非常に重要です。

2番目の重要な側面は、関数を分析することにより、目的に適した応答基準を定義できることです。回避したいエラーの種類とエラーは何でも構いません。たとえば、HIVテストを考えてみましょう。これは、何らかの証拠(この場合は抗体)を検索し、証拠と応答基準の比較に基づいて差別/予測を行うテストです。通常、この応答基準は非常に低く設定されるため、Missesを最小限に抑えることができます。もちろん、これにより、より多くの誤報が発生します。これにはコストがかかりますが、ミスと比較すると無視できるコストです。

ROCを使用すると、応答基準とは無関係にモデルの識別能力を評価できます。また、測定対象のニーズと制約を考慮して、最適な応答基準を確立することもできます。hi-squareのようなテストは、予測がチャンスレベルであるかどうかをテストしても、多くのさまざまなHit-Falseアラームペアがチャンスレベルと一致するため、これではまったく役に立ちません。

信号検出理論のようないくつかのフレームワークは、差別に利用可能な証拠が特定の分布(例えば、正規分布、またはガンマ分布)を持っていることを演prior的に仮定します。これらの仮定が成り立つ(またはかなり近い)場合、生活を楽にするいくつかの本当に素晴らしい手段が利用可能です。

これがROCの利点を明らかにするのに役立つことを願っています


私はこれについて7年間考えており、あなたの答えを受け入れました。
jermdemo

6

ROC曲線は、予測変数が連続的で結果が離散的である場合に使用されるため、カイ2乗検定は適用できません。実際、ROC分析はある意味でMann-Whitneyテストと同等です。曲線の下の面積はP(X> Y)であり、MWテストでテストされる量です。ただし、Mann-Whitney分析では、ROC分析の主要なポイントであるカットオフの選択を強調していません。さらに、ROC曲線は、共変量の予測能力の単なる視覚的な表示として使用されることがよくあります。


6

最短の答えは、信号検出の従来のテストではROC(受信者動作特性)上の1点のみが得られるのに対し、曲線では値の範囲全体で応答を確認できるということです。曲線全体でシフトすると、基準とd 'がシフトする可能性があります。これは、予測変数の2つのクラスを選択することによって生成されるt検定と、各予測変数のパラメトリック操作を見ることによって生成される2つの回帰直線の違いに似ています。


2

さらに参考文献に興味がある場合は、KH ZouのWebサイトであるReceiver Operating Characteristic(ROC)文献研究で広範な論文のリストを利用できます。

ROC曲線は、生物医学研究やバイオインフォマティクスの幅広いアプリケーションで、さまざまな分類器のパフォーマンスを比較することに関心がある場合にも使用されます。


1

多くの点で、ROCはモデルの主要な推論および推定ツールから逸脱しています。そこにはあまり価値がありません。


機会があれば、詳しく説明してください!私は他の著作からのあなたの議論の一般的な考えを持っていると思います、そしてそれはここで非常に貴重な追加になるでしょう。
マットパーカー

1
モデルを信じる場合、モデルベースの推定値が理想的であり、それらは最も強力/高感度/正確です。次のような説明された変動測定など、測定のさまざまなクラスがありますR2そしてその一般化。他の手段は、モデルによって達成されるさまざまな予測に集中します。予測値のヒストグラムは大いに役立ちます。ROC曲線は、さまざまなカットオフを想定しています。カットオフは誤解を招く危険です。それらは、カテゴリー的思考、すなわち、グループ内のすべての人を同一の特性を持っているかのように扱うことを引き起こします。別のアプローチ:パーティション逸脱。
フランクハレル
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.