ログロスの直感的な説明


9

いくつかのkaggleコンテストでは、採点は「ログロス」に基づいていました。これは分類エラーに関連しています。

ここに技術的な答えがありますが、私は直感的な答えを探しています。私はマハラノビス距離に関するこの質問への回答が本当に好きでしたが、PCAは対数損失ではありません。

私の分類ソフトウェアが提供する値を使用することはできますが、私はそれを本当に理解していません。真/偽陽性/陰性率の代わりになぜそれを使用するのですか?これを私の祖母や現場の初心者に説明できるように手伝ってくれませんか。

私も引用を気に入って同意します:

祖母に説明できない限り、あなたは本当に何かを理解していません
-アルバート・アインシュタイン

ここに投稿する前に、自分でこれに答えてみました。

私が直感的または本当に役に立たなかったリンクは次のとおりです。

これらは有益で正確です。これらは技術的な読者を対象としています。彼らは簡単な絵を描いたり、簡単でアクセス可能な例を与えたりしません。彼らは私の祖母のために書かれていません。


あなたはあなたの技術的な答えへのリンクを提供しませんでした
bdeonovic


@ EhsanM.Kermani-私が参照したマハラノビスのような直感的なものは見つかりませんでした。
EngrStudent 2016

1
kaggleウェブサイトエントリは、ログロスのかなり簡潔な説明を提供します
bdeonovic

このリンクが見つかりました:exegetic.biz/blog/2015/12/making-sense-logarithmic-loss。役立つかもしれません。
Deolu A 2016

回答:


7

ログロスは、すべての確率の積の対数です。アリスが予測したとしましょう:

  • 確率0.2で、ジョンはジャックを殺します
  • 確率0.001で、メアリーはジョンと結婚します
  • 確率0.01で、ビルは殺人者です。

メアリーはジョンと結婚しなかったことが判明し、ビルは殺人者ではなかったが、ジョンはジャックを殺した。アリスによると、確率の積は0.2 * 0.999 * 0.99 = 0.197802です。

ボブは予測しました:

  • 確率0.5で、ジョンはジャックを殺します
  • 確率0.5で、メアリーはジョンと結婚します
  • 確率0.5で、ビルは殺人者です。

積は0.5 * 0.5 * 0.5 = 0.125です。

アリスはボブよりも優れた予測因子です。


「すべての確率の積」が機能する理由 これは期待最大化の親戚のように聞こえます。
EngrStudent 2016

3
正式な証明が必要ですか?これは、topicstarterによって言及された「テクニカルアンサー」にあります。なぜ非公式な「祖母」の理由が必要ですか?あなたは言う:この仲間が正しい予測を与えたとしましょう。それが本当に起こったようにすべてが起こる確率はどれくらいですか?これは確率の積です。
user31264

「確率の産物」は「おばあちゃん」ではありません。確率の積の対数は、対数確率の合計であり、期待値の最大化に使用され、「期待値」と呼ばれます。KL divergenceでもエンコードされていると思います。...おばあちゃんの話では、「最も可能性が高い」=複数のイベントの全体的な確率が最も高いと言えます。1)結合確率を最大化するか、2)負の結合確率を最小化します。ほとんどのマシン学習は「勾配降下法」または問題の最小化を好みます。対数損失は、サンプルサイズでスケーリングされた負の確率であり、最小化されます
EngrStudent

ここにリンクして、彼らが言う「expは(-loss)正しい予測の平均確率です。」
EngrStudent 2017年

私はここで司教のrefが好きでした。これは、式4.108であり、クロスエントロピーエラー関数です。
EngrStudent 2017
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.