0-1損失関数の説明


18

損失関数の目的を把握しようとしていますが、理解できません。

したがって、損失関数は、誤った決定の「コスト」を測定できるある種のメトリックを導入するためのものです。

だから、30個のオブジェクトのデータセットがあり、20/10のようなトレーニング/テストセットに分割したとしましょう。0-1損失関数を使用するので、クラスラベルのセットはMで、関数は次のようになります:

Lj={0=j1jjM

そこで、トレーニングデータに基づいてモデルを作成し、Naive Bayes分類器を使用しているとしましょう。このモデルでは、7つのオブジェクトが正しく分類され(正しいクラスラベルが割り当てられ)、3つのオブジェクトが誤って分類されました。

したがって、損失関数は「0」を7回、「1」を3回返します。これからどのような情報を取得できますか?私のモデルがオブジェクトの30%を誤って分類したということですか?それとももっとありますか?

私の考え方に間違いがある場合、非常に申し訳ありませんが、ただ学習しようとしています。もし私が提供した例が「抽象的すぎる」なら、私に知らせてください、私はもっと具体的にしようとします。別の例を使用して概念を説明しようとする場合は、0-1損失関数を使用してください。

回答:


13

0-1損失関数を正確に効果的に見ると正しく要約しました。あなたの1は、どのように誤分類されたかに関係なく、誤分類された項目の指標になります。10個のアイテムのうち3個の1があるため、分類の精度は70%です。

損失関数の重みを変更すると、この解釈は適用されなくなります。たとえば、疾患の分類では、疾患の誤診(偽陽性)よりも、疾患の陽性症例を見逃す(偽陰性)方が費用がかかる場合があります。この場合、損失関数は、偽陰性の誤分類により重くのしかかるでしょう。損失の合計は、この場合の精度を表すのではなく、誤分類の合計「コスト」を表します。0-1損失関数は精度と同等の点でユニークです。なぜなら、あなたが気にするのはそれが正しいかどうかであり、エラーがどのように行われるかではないからです。


統計でaccurracyの定義である、参照@JohnnyJohansson en.wikipedia.org/wiki/Sensitivity_and_specificity
ティム

@Tim-0-1損失関数にまだ混乱しています-結果のマトリックスは1より大きい値を持っている可能性があります。つまり、3つのミス分類がある場合、対応するエントリに3の値が表示されますか?ここを参照してくださいmath.stackexchange.com/questions/2623072/...
ザビエル・ブーレSicotte


0

あなたの混乱は、1つのデータポイントの損失とデータセット全体の損失を区別していないと思います。

Lyy^

Lyy^

実際に違いはわかりますが、データセット全体の損失を計算する以外に、1つのデータポイントでこの損失が何を必要とするかを理解するのは困難ですか?また、特定の問題に対して適切な損失関数を選択する場合、何を考慮する必要がありますか?
ジョニーヨハンソン
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.