マルチクラスのマシューズ相関係数

9

マシューズ相関係数（）は、バイナリ分類の品質を測定する測定値です（[Wikipedia] [1]）。定式化は、真陽性（）、偽陽性（）、偽陰性（）、および真陰性（）の値を利用して、以下のようにバイナリ分類を行います。 $\textrm{MCC}$ $\textrm{MCC}$ $TP$ $FP$ $FN$ $TN$

MCC = \frac{T P \times T N - F P \times F N}{\sqrt{(T P + F P) (T P + F N) (T N + F P) (T N + F N)}}

$\textrm {MCC} = \frac{TP\times TN - FP\times FN}{\sqrt{\left(TP+FP\right)\left(TP+FN\right)\left(TN+FP\right)\left(TN+FN\right)}}$

、、 3つの異なるクラスを分類する必要がある場合があります。上記の定式化を適用して、以下に示すように各クラスの、、、および値を計算した後、マルチクラスケースのを計算できますか？ $A$ $B$ $C$ $\textrm{MCC}$ $TP$ $TN$ $FP$ $FN$

T P = T P_{A} + T P_{B} + T P_{C}; T N = T N_{A} + T N_{B} + T N_{C}; F P = F P_{A} + F P_{B} + F P_{C}; F N = F N_{A} + F N_{B} + F N_{C};

$TP = TP_A + TP_B + TP_C;\\ TN = TN_A + TN_B + TN_C;\\ FP = FP_A + FP_B + FP_C;\\ FN = FN_A + FN_B + FN_C;$

— ジョン・デイビッド
ソース

マシューズ相関係数（バイナリ分類の場合、これは単にファイまたはピアソン相関です）は、マルチクラス分類のRk相関と呼ばれるものになります。その2つの公式が、私のWebページのドキュメント「パーティションの比較」で引用されています。

— ttnphns

5

はい、一般的には可能です。使用したいこのアプローチは、「マイクロ平均化」と呼ばれることもあります。最初に、各クラスのすべての、などを合計してからTN、対象FPの統計を計算します。

個々のクラスの統計を組み合わせる別の方法は、いわゆる「マクロ平均」を使用することです。ここでは、最初に個々のクラスの統計を計算し（A対Aではなく、B対Bではないなど）、次に平均を計算します。それら。

追加の詳細については、こちらをご覧ください。このページでは、精度と再現率について説明していますが、マシューの係数だけでなく、分割表に基づく他の統計にも当てはまると思います。

— アレクセイ・グリゴレフ
ソース

4

マクロ平均化手法は、精度、感度、および特異性に適しています。しかし、クライアントセンターで試したところ、適切な結果が得られませんでした。マルチクラスMCC計算の詳細については、以下を参照してください。

Jurman G、Riccadonna S、Furlanello C（2012）「マルチクラス予測におけるMCCとCENの誤差測定の比較」。PLoS ONE 7（8）：e41882。doi：10.1371 / journal.pone.0041882
ジャーマン、ジュゼッペ、チェザーレフルラネッロ。「マルチクラス予測におけるパフォーマンス測定の統一ビュー。」arXivプレプリントarXiv：1008.2908（2010）。

次のコードは私のために働きました：

% the confusion matrix at input is given by matrix cm_svm_array
mcc_numerator=0;count=1;
% limits klm=1 TO n SUM(ckk.cml - clk.ckm)
for k = 1:1:length(cm_svm_array)
    for l=1:1:length(cm_svm_array)
        for m=1:1:length(cm_svm_array)
          mcc_numerator1(count) = (cm_svm_array(k,k) *cm_svm_array(m,l))-
                                  (cm_svm_array(l,k)*cm_svm_array(k,m))
          mcc_numerator=mcc_numerator+mcc_numerator1(count)
          count=count+1;
        end
    end
end

mcc_denominator_1=0 ; count=1;
for k=1:1:length(cm_svm_array)
     mcc_den_1_part1=0;
    for l=1:1:length(cm_svm_array)
        mcc_den_1_part1= mcc_den_1_part1+cm_svm_array(l,k);
    end
    mcc_den_1_part2=0;
    for f=1:1:length(cm_svm_array)
        if f ~=k
          for g=1:1:length(cm_svm_array)
            mcc_den_1_part2= mcc_den_1_part2+cm_svm_array(g,f);
          end
        end
    end
    mcc_denominator_1=(mcc_denominator_1+(mcc_den_1_part1*mcc_den_1_part2));
end

mcc_denominator_2=0; count=1;
for k=1:1:length(cm_svm_array)
     mcc_den_2_part1=0;
    for l=1:1:length(cm_svm_array)
        mcc_den_2_part1= mcc_den_2_part1+cm_svm_array(k,l);
    end
    mcc_den_2_part2=0;
    for f=1:1:length(cm_svm_array)
        if f ~=k
          for g=1:1:length(cm_svm_array)
            mcc_den_2_part2= mcc_den_2_part2+cm_svm_array(f,g);
          end
        end
    end
    mcc_denominator_2=(mcc_denominator_2+(mcc_den_2_part1*mcc_den_2_part2));
end

mcc = (mcc_numerator)/((mcc_denominator_1^0.5)*(mcc_denominator_2^0.5))

— スワティ・シラスカー
ソース

1

MCCは、バイナリおよびマルチクラス分類ウィキペディアに使用でき、バイナリおよびマルチクラスラベルのsci-kit学習に実装されています。

— デビッド・マコヴォス
ソース

0

MCCはバイナリ分類用に設計されています。

分類子の同様の測定値が必要な場合は、コーエンのカッパを試すことができます。これは、マルチクラス混同行列に適用できます。

— ニコ
ソース