サイコロ係数は精度と同じですか?


12

ボリュームの類似性(https://en.wikipedia.org/wiki/S%C3%B8rensen%E2%80%93Dice_coefficient)と精度(https://en.wikipedia.org/wiki/Accuracy_and_precisionのダイス係数に遭遇しました)。

これら2つの対策は同じように思えます。何かご意見は?


1
これは、すべての情報を提供していstats.stackexchange.com/questions/195006/...
ランク-1

1
@ rank1ありがとう。明確にしたいのですが、私の質問へのリンクではありません:)
RockTheStar

回答:


18

これらは同じものではなく、異なるコンテキストで使用されることがよくあります。ダイススコアは、画像セグメンテーション手法のパフォーマンスを定量化するためによく使用されます。そこで、画像のグラウンドトゥルース領域に注釈を付け、それを行うための自動アルゴリズムを作成します。アルゴリズムを検証するには、オブジェクトの類似性の尺度であるDiceスコアを計算します。つまり、2つのセグメンテーションのオーバーラップのサイズを2つのオブジェクトの合計サイズで割ったものです。精度を説明するのと同じ用語を使用し、ダイスのスコアは:

Dice score=2number of true positives2number of true positives + number of false positives + number of false negatives

Diceスコアは、検出されたポジティブの数の測定値であるだけでなく、精度と同様に、メソッドが検出したフォールスポジティブにもペナルティを課します。したがって、精度よりも精度に似ています。唯一の違いは分母です。この方法では、メソッドが検出した陽性のみではなく、陽性の総数が得られます。したがって、ダイスのスコアは、アルゴリズム/メソッドが見つけられなかったポジティブにもペナルティを課しています。

AB

  • A
  • ABABAB
  • BA

出版物でこれを行う場合は、ダイスという名前の男にちなんで名前が付けられているため、大文字のDでダイスを記述します。

編集:修正に関するコメントについて:サイコロ係数の計算に従来の式を使用しませんが、他の回答の表記に変換すると、次のようになります。

Dice score=2|AB|2|AB|+|BA|+|AB|

これは従来の定義と同等です。誤検知に関して式を述べるために、私が最初に書いた方法でそれを書く方が便利です。バックスラッシュはセットマイナスです。


2
返信いただきありがとうございます。画像セグメンテーションの比較のために。したがって、このダイススコアが使用されます。たとえば、画像Aと画像Bを与えます。画像Aはグラウンドトゥルー(0または1)であり、画像Bは私のセグメンテーションです。それで、ポジティブ(1)の総数は何ですか、それはAの1の数+ Bの1の数ですか?ここでは少し混乱しています。誤
検知と

1
@RockTheStar画像のセグメンテーションを考慮して、回答を編集します。
Gumeo 2016

1
素晴らしい、あなたの説明をたくさんありがとう。さらにもう1つ質問があります。Dの範囲はどうですか?0から1の間ですか?
RockTheStar 2016

2
まことにありがとうございます!これを実装して結果を確認します
RockTheStar

2
@Gumeoあなたは修正したい、または少なくともあなたの答えを説明したいかもしれません。詳細については私の新しい答えを見てください
dvb

20

ダイス係数(また、ダイス類似度指標として知られている)が同じであるF1スコア、それは精度と同じではありません。主な違いは、精度が真のネガティブを考慮に入れるのに対し、ダイス係数および他の多くのメジャーは真のネガティブを興味のないデフォルトとして処理するという事実である可能性があります(分類子評価の基本、パート1を参照)。

私の知る限り、ダイス係数は、実際にはJaccardインデックス(コンピュータビジョンでは「ユニオンの交差」とも呼ばれます)の式を含む以前の回答で説明されているように計算されません。

Dice(A,B)=2|AB||A|+|B|F1(A,B)=2|A|/|AB|+|B|/|AB|Jaccard(A,B)=|AB||max(A,B)|=|AB||A|+|B||AB|Accuracy(A,B)=|AB|+|A¯B¯||All|

A,BAll|AB|AB|A¯B¯|AB

ダイス係数とJaccardインデックスは単調に関連しており、Tverskyインデックスはそれらを一般化します。詳細については、Fスコア、ダイス、Jaccardセットの類似性を参照してください。

ダイス係数は、感度と精度の調和平均でもあります。なぜ意味があるのか​​を理解するには、「F-Measureが調和平均であり、PrecisionおよびRecallメジャーの算術平均ではないのはなぜですか」を参照してください

この回答の多くの用語とそれらの関係について詳しくは、バイナリ分類子の評価をご覧ください。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.