ロジスティック回帰の予測確率を分類の信頼度として解釈できますか


12

予測されたクラス値と確率(たとえば、ロジスティック回帰または単純ベイズ)を出力する分類器から取得された事後確率を、その予測されたクラス値に割り当てられた何らかの信頼スコアとして解釈できますか?

回答:


8

他の答えが正しく述べているように、ロジスティック回帰や単純ベイズなどのモデルから報告される確率は、クラス確率の推定値です。モデルが真の場合、確率は実際に正しい分類の確率になります。

ただし、モデルが推定され、したがって正しいモデルではないため、これは誤解を招く可能性があることを理解することが非常に重要です。少なくとも3つの問題があります。

  • 推定値の不確実性。
  • モデルの仕様ミス。
  • バイアス。

不確実性確率は単に推定値であることだけでどこにでも存在事実です。推定されたクラス確率の信頼区間は、(分類ではなく、クラス確率の)不確実性についてのアイデアを提供できます。

推定手順が(意図的に)偏った推定値を提供する場合、クラスの確率は間違っています。これは、なげなわやロジスティック回帰のリッジなどの正則化方法で見られるものです。正則化の交差検証された選択は、分類に関して良好なパフォーマンスを備えたモデルにつながりますが、結果のクラス確率はテストケースで明らかに過小評価されます(0.5に近すぎます)。これは必ずしも悪いことではありませんが、注意することが重要です。


2

ためのテストケース(特定の入力)、クラス(バイナリ出力のラベル1と言う)の予測確率は、試験例は、そのクラスに属する確率です。このようなテストケースの多くで、クラス1に属する割合は予測確率になります。信頼に は信頼区間の意味合いがあり、これはまったく異なるものです。


1

分類子が特定のクラスを確率で予測する場合、その数はその分類の信頼度のプロキシとして使用できます。信頼区間と混同しないでください。たとえば、分類子Pが確率80%と60%で2つのケースを+1と-1として予測する場合、-1分類より+1分類の方が確実であると言うのは正しいことです。p(1-p)で測定される分散も不確実性の良い尺度です。ベースラインの信頼度は0ではなく50%です。


1

2クラスの分類器(2クラスの線形判別分類器またはロジスティック回帰分類器など)を指定すると、両方のクラスの判別値をsoftmax関数に適用して、そのクラスの事後確率の推定値を得ることができます。

P1 = exp(d1)/(exp(d1)+ exp(d2))

ここで、P1はクラス1の事後確率推定であり、d1とd2はそれぞれクラス1と2の判別値です。この場合、特定のクラスの推定事後確率は、特定のケースではP1が1-P2に等しいため、クラスの信頼度と見なすことができます。


1
この答えは、「確率」と「信頼」を同等と見なしているようですが、@ Yodaの答えは(正確に)2つを区別しています。
whuber

@whuber一般的に言えば、自信は信念の強さとして見ることができると思います。そのように、それは確率のようなものです。信頼と信頼区間は2つの異なるものです。ただし、信頼区間という用語であっても、信頼レベルはランダムな区間のカバレッジ確率です。
マイケルR.チャーニック

「信頼スコア」のような用語はほとんど何でも意味する可能性があるという意味で、@ Michael、あなたの発言に同意しません(しかし、その使用はまさにその理由で廃止されるべきかもしれません)。しかし、どのような意味で、ロジスティック回帰による値の適合は「カバレッジ確率」ですか?信念の強さとしての「自信」の提案された使用は、主観的な「確率」と同義になりますか、それとも何らかの区別がまだ維持されていますか?(もしそうなら、何?)
whuber

1
@whuberあなたは私の発言で意図したよりもはるかにこれに深く入り込んでいると思います。「confidence」という単語を一般的に信頼区間と結び付けているからといって、OPs用語の信頼スコアが確率を意味するために使用できないことを意味するわけではありません信じているが、必ずしもそうではない)。
マイケルR.チャーニック

1
@whuber、私は確かに「信念の強さ」の意味でクラスラベルの信頼性について言及していました。つまり、特定のクラスの事後確率値が大きいほど、予測されるクラスラベルの信頼性が高くなります。ただし、この回答を削除させていただきます。
BGreene
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.