(d-prime)とAUC(ROC曲線下の領域)の間の接続。基礎となる仮定


13

機械学習では、ROC曲線の下領域(多くの場合、省略されたAUCまたはAUROC)を使用して、システムが2つのカテゴリーをどれだけうまく区別できるかを要約します。信号検出理論では、d(感度指数)が同様の目的で使用されることがよくあります。この2つは密接に関連しており、特定の前提条件が満たされていれば、両者は同等であると思います。

の計算は、通常、(例えば、上記のリンクウィキペディアを参照)の信号分布のために正規分布を仮定に基づいて提示されます。ROC曲線の計算ではこの仮定は行われません。これは、しきい値処理可能な連続値の決定基準を出力する分類子に適用できます。d

ウィキペディアによれば2 AUC 1に相当します。両方の仮定が満たされている場合、これは正しいようです。しかし、仮定が同じでない場合、それは普遍的な真実ではありません。d2AUC1

仮定の違いを「AUCは基礎となる分布についての仮定を少なくする」と特徴づけることは公正ですか?または、実際にはAUCと同じくらい広く適用できますが、d を使用する人々が正規分布を仮定する計算を使用する傾向があるのは、単なる一般的な慣習ですか?私が見逃した根本的な仮定に他の違いはありますか?dd

回答:


7

いいえ。AUCの最大値は1です。d 'に最大値はありません。

私はd 'がqnorm(AUC)* sqrt(2)と等しいと信じています(古い統計の本の私の記憶は今は見つかりませんが、Webで見つけたいくつかのデータに対してチェックアウトしているようです)。ここで、qnorm(x)は「正規分布の分位関数」です(Rピーク)。つまり、分布のx比率がそれを下回る正規分布の値を返します。


2
おかげで、これは私には正しいように聞こえますが、(qnorm()を使用しているため)分布が正常であると想定している場合のみです。ウィキペディアの文言を修正しました。
Dan Stowell、2015
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.