アンサンブルベースの方法でのハード投票、ソフト投票


9

私は、Scikit-LearnとTensorFlowを使用した実践的な機械学習:インテリジェントシステムを構築するための概念、ツール、テクニックを読んでいます。次に、アンサンブルベースのメソッドのコンテキストで、ハード投票とソフト投票の違いを理解できません。

本からそれらの説明を引用します。上から2つ目の画像はハード投票の説明で、最後の1つはソフト投票の画像です。

ここに画像の説明を入力してください

ここに画像の説明を入力してください

ここに画像の説明を入力してください

私の見解では、ハード投票は多数決ですが、ソフト投票と、ソフト投票がハード投票よりも優れている理由はわかりません。誰かが私にこれらを教えますか?

私が読んだ投稿


テキストの段落を長文で入力し、画像からテキストの一部を切り抜いてください。画像をテキストとして投稿しないでください。これは、「ハード投票は非常に信頼できる投票に重みを与える」のような重要なキーワードを検索および索引付けすることによってこの質問を見つけるために重要です。
smci

回答:


13

両方のアプローチがどのように機能するかを説明する簡単な例を見てみましょう。

3つの分類子(1、2、3)と2つのクラス(A、B)があり、トレーニング後に単一点のクラスを予測するとします。

ハード投票

予測

分類子1はクラスAを予測します

分類子2はクラスBを予測します

分類子3はクラスBを予測します

2/3の分類子はクラスBを予測するため、クラスBは集団の決定です。

ソフト投票

予測

(これは前の例と同じですが、確率で表現されています。問題はバイナリであるため、ここではクラスAについてのみ値を示しています):

分類子1は、99%の確率でクラスAを予測します

分類子2は、確率49%でクラスAを予測します

分類子3は、49%の確率でクラスAを予測します

分類子全体でクラスAに属する確率の平均は(99 + 49 + 49) / 3 = 65.67%です。したがって、クラスAはアンサンブル決定です。


同じケースで、ソフト投票とハード投票が異なる決定につながる可能性があることがわかります。ソフト投票は、より多くの情報を考慮に入れるため、ハード投票を改善できます。最終的な決定では、各分類子の不確実性を使用します。ここで分類子2と3の不確実性が高いということは、最終的なアンサンブル決定が分類子1に強く依存していることを本質的に意味します。

これは極端な例ですが、この不確実性が最終決定を変更することは珍しくありません。


1
あなたの明るい説明をありがとう、mkt。私はこの問題を完全に理解しました。
gogogogogo
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.