ボリュームの類似性(https://en.wikipedia.org/wiki/S%C3%B8rensen%E2%80%93Dice_coefficient)と精度(https://en.wikipedia.org/wiki/Accuracy_and_precisionのダイス係数に遭遇しました)。
これら2つの対策は同じように思えます。何かご意見は?
ボリュームの類似性(https://en.wikipedia.org/wiki/S%C3%B8rensen%E2%80%93Dice_coefficient)と精度(https://en.wikipedia.org/wiki/Accuracy_and_precisionのダイス係数に遭遇しました)。
これら2つの対策は同じように思えます。何かご意見は?
回答:
これらは同じものではなく、異なるコンテキストで使用されることがよくあります。ダイススコアは、画像セグメンテーション手法のパフォーマンスを定量化するためによく使用されます。そこで、画像のグラウンドトゥルース領域に注釈を付け、それを行うための自動アルゴリズムを作成します。アルゴリズムを検証するには、オブジェクトの類似性の尺度であるDiceスコアを計算します。つまり、2つのセグメンテーションのオーバーラップのサイズを2つのオブジェクトの合計サイズで割ったものです。精度を説明するのと同じ用語を使用し、ダイスのスコアは:
Diceスコアは、検出されたポジティブの数の測定値であるだけでなく、精度と同様に、メソッドが検出したフォールスポジティブにもペナルティを課します。したがって、精度よりも精度に似ています。唯一の違いは分母です。この方法では、メソッドが検出した陽性のみではなく、陽性の総数が得られます。したがって、ダイスのスコアは、アルゴリズム/メソッドが見つけられなかったポジティブにもペナルティを課しています。
出版物でこれを行う場合は、ダイスという名前の男にちなんで名前が付けられているため、大文字のDでダイスを記述します。
編集:修正に関するコメントについて:サイコロ係数の計算に従来の式を使用しませんが、他の回答の表記に変換すると、次のようになります。
これは従来の定義と同等です。誤検知に関して式を述べるために、私が最初に書いた方法でそれを書く方が便利です。バックスラッシュはセットマイナスです。
ダイス係数(また、ダイス類似度指標として知られている)が同じであるF1スコア、それは精度と同じではありません。主な違いは、精度が真のネガティブを考慮に入れるのに対し、ダイス係数および他の多くのメジャーは真のネガティブを興味のないデフォルトとして処理するという事実である可能性があります(分類子評価の基本、パート1を参照)。
私の知る限り、ダイス係数は、実際にはJaccardインデックス(コンピュータビジョンでは「ユニオンの交差」とも呼ばれます)の式を含む以前の回答で説明されているように計算されません。
ダイス係数とJaccardインデックスは単調に関連しており、Tverskyインデックスはそれらを一般化します。詳細については、Fスコア、ダイス、Jaccardセットの類似性を参照してください。
ダイス係数は、感度と精度の調和平均でもあります。なぜ意味があるのかを理解するには、「F-Measureが調和平均であり、PrecisionおよびRecallメジャーの算術平均ではないのはなぜですか」を参照してください。。
この回答の多くの用語とそれらの関係について詳しくは、バイナリ分類子の評価をご覧ください。