回答:
他の答えが正しく述べているように、ロジスティック回帰や単純ベイズなどのモデルから報告される確率は、クラス確率の推定値です。モデルが真の場合、確率は実際に正しい分類の確率になります。
ただし、モデルが推定され、したがって正しいモデルではないため、これは誤解を招く可能性があることを理解することが非常に重要です。少なくとも3つの問題があります。
不確実性確率は単に推定値であることだけでどこにでも存在事実です。推定されたクラス確率の信頼区間は、(分類ではなく、クラス確率の)不確実性についてのアイデアを提供できます。
推定手順が(意図的に)偏った推定値を提供する場合、クラスの確率は間違っています。これは、なげなわやロジスティック回帰のリッジなどの正則化方法で見られるものです。正則化の交差検証された選択は、分類に関して良好なパフォーマンスを備えたモデルにつながりますが、結果のクラス確率はテストケースで明らかに過小評価されます(0.5に近すぎます)。これは必ずしも悪いことではありませんが、注意することが重要です。
2クラスの分類器(2クラスの線形判別分類器またはロジスティック回帰分類器など)を指定すると、両方のクラスの判別値をsoftmax関数に適用して、そのクラスの事後確率の推定値を得ることができます。
P1 = exp(d1)/(exp(d1)+ exp(d2))
ここで、P1はクラス1の事後確率推定であり、d1とd2はそれぞれクラス1と2の判別値です。この場合、特定のクラスの推定事後確率は、特定のケースではP1が1-P2に等しいため、クラスの信頼度と見なすことができます。