結果に対する測定の予測能力を判断するために、他のいくつかのテストでROC曲線を使用する傾向があるのはいつですか?
離散的な結果(生存/死亡、現在/不在)を処理する場合、ROC曲線がカイ二乗のようなものよりも多かれ少なかれ強力になるのはなぜですか?
結果に対する測定の予測能力を判断するために、他のいくつかのテストでROC曲線を使用する傾向があるのはいつですか?
離散的な結果(生存/死亡、現在/不在)を処理する場合、ROC曲線がカイ二乗のようなものよりも多かれ少なかれ強力になるのはなぜですか?
回答:
ROC関数(必ずしも曲線ではない)を使用すると、特定の統計モデル(予測変数またはそれらのセットで構成される)によって提供される識別能力を評価できます。
ROCの主な考慮事項は、モデル予測は、予測変数によって提供される証拠に基づいて予測を判別/作成するモデルの能力に起因するだけではないということです。また、動作は、モデルが応答を予測するために必要な証拠の量と、これらの応答の結果を定義する応答基準です。応答基準に対して確立された値は、モデルの予測に大きく影響し、最終的にはモデルが行う間違いのタイプに影響します。
予測変数と応答基準を持つ一般的なモデルを考えます。このモデルは、YesまたはNoと応答することにより、Xの存在を予測しようとしています。したがって、次の混同マトリックスがあります。
**X present X absent**
**Model Predicts X Present** Hit False Alarm
**Model Predicts X Absent** Miss Correct Rejection
このマトリックスでは、ヒットと誤報の割合のみを考慮する必要があります(他のものは1対1である必要があるため、これらから派生できるため)。応答基準ごとに、異なる混同マトリックスを作成します。エラー(ミスおよび誤アラーム)は負の関係にあります。つまり、誤アラームを最小化する応答基準はミスを最大化し、その逆も同様です。メッセージは次のとおりです。無料のランチはありません。
そのため、確立された応答基準とは無関係に、モデルがケースをどのように判別/予測するかを理解するために、考えられる応答基準の範囲全体で生成されたヒット率と偽率をプロットします。
このプロットから得られるのはROC関数です。関数の下の領域は、モデルの識別能力の公平でノンパラメトリックな尺度を提供します。この基準は、応答基準によって生じる可能性のある交絡がないため、非常に重要です。
2番目の重要な側面は、関数を分析することにより、目的に適した応答基準を定義できることです。回避したいエラーの種類とエラーは何でも構いません。たとえば、HIVテストを考えてみましょう。これは、何らかの証拠(この場合は抗体)を検索し、証拠と応答基準の比較に基づいて差別/予測を行うテストです。通常、この応答基準は非常に低く設定されるため、Missesを最小限に抑えることができます。もちろん、これにより、より多くの誤報が発生します。これにはコストがかかりますが、ミスと比較すると無視できるコストです。
ROCを使用すると、応答基準とは無関係にモデルの識別能力を評価できます。また、測定対象のニーズと制約を考慮して、最適な応答基準を確立することもできます。hi-squareのようなテストは、予測がチャンスレベルであるかどうかをテストしても、多くのさまざまなHit-Falseアラームペアがチャンスレベルと一致するため、これではまったく役に立ちません。
信号検出理論のようないくつかのフレームワークは、差別に利用可能な証拠が特定の分布(例えば、正規分布、またはガンマ分布)を持っていることを演prior的に仮定します。これらの仮定が成り立つ(またはかなり近い)場合、生活を楽にするいくつかの本当に素晴らしい手段が利用可能です。
これがROCの利点を明らかにするのに役立つことを願っています
さらに参考文献に興味がある場合は、KH ZouのWebサイトであるReceiver Operating Characteristic(ROC)文献研究で広範な論文のリストを利用できます。
ROC曲線は、生物医学研究やバイオインフォマティクスの幅広いアプリケーションで、さまざまな分類器のパフォーマンスを比較することに関心がある場合にも使用されます。
多くの点で、ROCはモデルの主要な推論および推定ツールから逸脱しています。そこにはあまり価値がありません。