2つの統計測定値は相関している可能性がありますが、分類器の異なる品質を測定します。
オーロク
曲線下面積(AUC)は、ランダムに選択された負の例よりもランダムに選択された正のインスタンスを分類子がランク付けする確率に等しくなります。実際にパターンをクラスに割り当てることなく、ポジティブクラスに属する度合いに応じて一連のパターンをランク付けする分類器のスキルを測定します。
全体的な精度は、分類器がパターンをランク付けする能力にも依存しますが、しきい値を上回る場合はパターンをポジティブクラスに、以下であればネガティブクラスにパターンを割り当てるために使用されるランキングのしきい値を選択する能力にも依存します。
したがって、パターン(AUROCが測定する)のランク付けはAUROCと全体の精度の両方にとって有益であるため、より高いAUROC統計(すべての条件が等しい)の分類器も全体の精度が高くなる可能性があります。ただし、1つの分類子がパターンを適切にランク付けしても、しきい値を誤って選択すると、AUROCは高くなりますが、全体の精度は低下します。
実用
実際には、全体的な精度、AUROC、および分類子がクラスメンバーシップの確率、クロスエントロピーまたは予測情報を推定する場合に収集するのが好きです。次に、ハード分類を実行する生の能力を測定するメトリックがあります(誤検出と誤検出の誤分類コストが等しく、サンプルのクラス頻度が運用時のクラス頻度と同じであると仮定-大きな仮定!)、パターンをランク付けする機能を測定するメトリックと、ランク付けが確率としてどの程度調整されているかを測定するメトリック。
多くのタスクでは、運用の誤分類コストは不明または変動するか、運用クラスの頻度がトレーニングサンプルの頻度と異なるか、変動します。その場合、全体の精度はかなり無意味であることが多く、AUROCはパフォーマンスのより良い指標であり、理想的には、運用中のこれらの問題を補正できるように、十分に較正された確率を出力する分類器が必要です。本質的にどのメトリックが重要かは、解決しようとしている問題によって異なります。