マルチクラス問題とマルチラベル問題の違いは何ですか?
マルチクラス問題とマルチラベル問題の違いは何ですか?
回答:
違いは、マルチクラス問題ではクラスが相互に排他的であるのに対し、マルチラベル問題では各ラベルが異なる分類タスクを表しているが、タスクは何らかの形で関連しているためだと考えています)。たとえば、有名なLeptograspus crabs データセットには、2色のカニの雄と雌の例があります。これは、4つのクラス(男性-青、女性-青、男性-オレンジ、女性-オレンジ)のマルチクラス問題として、または一方のラベルが男性/女性、もう一方が青のマルチラベル問題としてアプローチできます。 /オレンジ。基本的にマルチラベルの問題では、パターンは複数のクラスに属することができます。
マルチクラス分類とは、3つ以上のクラスを持つ分類タスクを意味します。たとえば、オレンジ、リンゴ、ナシなどの果物の画像セットを分類します。マルチクラス分類では、各サンプルは1つのラベルにのみ割り当てられると仮定しています。果物はリンゴまたはナシのいずれかですが、両方を同時に使用することはできません。
マルチラベル分類は、各サンプルにターゲットラベルのセットを割り当てます。これは、ドキュメントに関連するトピックなど、相互に排他的ではないデータポイントのプロパティを予測するものと考えることができます。テキストは、宗教、政治、金融、または教育のいずれかに関するものである場合もあれば、まったくない場合もあります。
他の回答を補足するために、いくつかの図を示します。1行= 1サンプルの予想出力。
1列= 1クラス(ワンホットエンコーディング)
1列= 1クラス
あなたはそれを見ます:
副次的な注意事項として、マルチ出力-マルチクラス分類の問題を防ぐことはできません。
複数クラスの問題には、相互に排他的な有限のクラスコレクションのいずれかにインスタンスが割り当てられます。(@Dikranからの)カニの既に与えられた例のように:男性青、女性青、男性オレンジ、女性オレンジ。これらのそれぞれは、他のものを除外しており、総合すると総合的です。
マルチラベル問題の1つの形式は、これらを性別と色の2つのラベルに分割することです。性別は男性または女性で、色は青またはオレンジです。しかし、これはすべてのインスタンスがすべてのラベルを取得するため、マルチラベル問題の特殊なケースであることに注意してください(つまり、すべてのカニには性別と色の両方があります)。
マルチラベルの問題には、各インスタンスに可変数のラベルを割り当てることができる他のケースも含まれます。たとえば、新聞や電信の記事は、ニュース、政治、スポーツ、医学などのカテゴリに割り当てられます。重要なスポーツイベントに関する1つのストーリーには、SPORTSというラベルが割り当てられます。一方、特定のスポーツイベントで明らかになった政治的緊張を伴うものは、SPORTSとPOLITICSの両方のラベルを取得する可能性があります。私が米国にいる場合、イベントの社会的影響を考慮して、スーパーボウルの結果にはスポーツとニュースの両方のラベルが付けられています。
この形式のラベル付けは、可変数のラベルを使用して、カニを使用した例と同様の形式に再キャストできます。ただし、すべてのラベルはLABEL-Xまたはnot-LABEL-Xとして扱われます。ただし、すべてのメソッドでこの再キャストが必要なわけではありません。