ヒンジ損失とロジスティック損失の長所と短所/制限


14

ヒンジ損失を使用して定義することができる、ログ損失として定義することができるログ1つの+ EXP - Y I W Tは、xは Iを最大01ywTバツログ1+expywTバツ

次の質問があります。

  1. ヒンジ損失の欠点はありますか(例:http://www.unc.edu/~yfliu/papers/rsvm.pdfに記載されている外れ値に敏感)。

  2. 一方と他方の違い、長所、短所は何ですか?

回答:


22

対数損失の最小化は、行儀の良い確率的出力につながります。

ヒンジの損失により、デュアルのスパースが(保証されません)なりますが、確率の推定には役立ちません。代わりに、誤分類を罰します(そのため、マージンを決定することが非常に便利です)。ヒンジ損失の減少には、マージンの誤分類全体の減少が伴います。

だから、要約:

  • 対数損失は精度を犠牲にしてより良い確率推定につながります

  • ヒンジの損失により、確率に関する感度が大幅に低下しますが、精度とスパース性が向上します


1
+1。ロジスティック損失の最小化は、二項尤度の最大化に対応します。二乗誤差損失の最小化は、ガウス尤度の最大化に対応します(これは単なるOLS回帰です。2クラス分類の場合、実際にはLDAと同等です)。ヒンジ損失を最小化することが、他の可能性を最大化することに対応するかどうか知っていますか?すなわち、ヒンジ損失に対応する確率モデルはありますか?
アメーバは、モニカを復活させる

1
@amoeba興味深い質問ですが、SVMは本質的に統計モデリングに基づいていません。そうは言っても、Glen_bによるこの回答を確認してください。スレッド全体はそれについてですが、代わりにイプシロンに反応しないヒンジ用です。
Firebug

4

@Firebugの回答は正しかった(+1)。実際、ここでも同様の質問がありました。

0-1損失を近似するために分類で異なる損失関数を選択することの影響は何ですか

ロジスティック損失のもう1つの大きな利点である確率的解釈にさらに追加したいと思います。例、見つけることができますここにあります

具体的には、ロジスティック回帰は統計文献の古典的なモデルです。(「ロジスティック回帰」という名前の意味は?。)対数尤度推定の最大化、尤度比検定、二項の仮定など、ロジスティック損失に関連する多くの重要な概念があります。関連するディスカッションを次に示します。

Rの尤度比検定

ロジスティック回帰がロジスティック分類と呼ばれないのはなぜですか?

ロジスティック回帰にiidの仮定はありますか?

ロジットモデルとプロビットモデルの違い


1

@ hxd1011にはクロスエントロピーの利点が追加されたため、この欠点の1つを追加します。

クロスエントロピーエラーは、確率分布間の多くの距離尺度の1つですが、欠点の1つは、可能性の低いイベントにあまりにも多くの重みを与えて、長いテールを持つ分布を貧弱にモデル化できることです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.