サポートベクターマシンから確率を取得することは実際に可能です。これは、任意の「スコア」値よりも有用で解釈しやすいかもしれません。これを行うためのいくつかのアプローチがあります。開始するための1つの合理的な場所は、Platt(1999)です。
ほとんどのSVMパッケージ/ライブラリはこのようなものを実装します(たとえば、-b 1オプションはLibSVMに確率を生成させます)。自分でロールする場合は、Lin、Lin、およびWeng(2007)によってこのノートに要約されているいくつかの潜在的な数値の問題があることに注意してください。また、いくつかの疑似コードも提供されます。これも役立つ場合があります。
コメントに応じて編集する:特に最小限の追加労力で確率を得ることができるので、確率よりもスコアを好む理由は少しわかりません。そうは言っても、ほとんどの確率計算は、点と超平面の間の距離から導出されているように見えます。プラット紙のセクション2を見ると、彼は動機を説明し、次のように述べています。
マージン間のクラス条件付き密度は、明らかに指数関数的です。2つの指数に関するベイズの規則は、シグモイドのパラメトリック形式の使用を示唆しています:
このシグモイドモデルは、出力がSVMの確率は、正のトレーニング例の対数尤度に比例します。[MK:は他の場所で生のSVM出力として定義されました]。 f
P(y= 1 | f)= 11 + exp(A f+ B )
f
メソッドセクションの残りの部分では、そのシグモイドのパラメーターとパラメーターを近似する方法について説明します。序論(セクション1.0および1.1)で、PlattはVapnik、Wahba、およびHasti&Tibshiraniによる他のいくつかのアプローチをレビューします。これらのメソッドは、超平面までの距離のようなものも使用し、さまざまな方法で操作されます。これらはすべて、超平面までの距離にいくつかの有用な情報が含まれていることを示唆しているようです。したがって、生の距離を信頼性の(非線形)尺度として使用できると思います。BあB