マルチクラス問題とマルチラベル問題の違いは何ですか


52

マルチクラス問題とマルチラベル問題の違いは何ですか?


両方のタスクは、Vowpal Wabbitソフトウェアパッケージで実行できます(コマンドライン、Pythonバインディングが利用可能です)。
ヴラディスラフドブガレス

私はこの概念を学び、この投稿で理解を深めました。彼らはマルチラベル分類を非常にエレガントな方法で説明しました。
user235077

回答:


45

違いは、マルチクラス問題ではクラスが相互に排他的であるのに対し、マルチラベル問題では各ラベルが異なる分類タスクを表しているが、タスクは何らかの形で関連しているためだと考えています)。たとえば、有名なLeptograspus crabs データセットには、2色のカニの雄と雌の例があります。これは、4つのクラス(男性-青、女性-青、男性-オレンジ、女性-オレンジ)のマルチクラス問題として、または一方のラベルが男性/女性、もう一方が青のマルチラベル問題としてアプローチできます。 /オレンジ。基本的にマルチラベルの問題では、パターンは複数のクラスに属することができます。


@Dirkranご説明ありがとうございます。あなたは私以外のマルチラベルのデータセットを得ることができ、他のソースを知っていますcsie.ntu.edu.tw/~cjlin/libsvmtools/datasets/multilabel.htmlmulan.sourceforge.net/datasets.htmlを
学習者

@Learner申し訳ありませんが、私があまり取り組んできたことではありません。マルチラベル学習といくつかの類似点があるマルチタスク学習をご覧ください。おそらく、そのために使用されるデータセットの一部は、マルチラベル学習のベンチマークとしても役立つ可能性があります。
ディクランマースピアル

26

マルチクラス分類とは、3つ以上のクラスを持つ分類タスクを意味します。たとえば、オレンジ、リンゴ、ナシなどの果物の画像セットを分類します。マルチクラス分類では、各サンプルは1つのラベルにのみ割り当てられると仮定しています。果物はリンゴまたはナシのいずれかですが、両方を同時に使用することはできません。

マルチラベル分類は、各サンプルにターゲットラベルのセットを割り当てます。これは、ドキュメントに関連するトピックなど、相互に排他的ではないデータポイントのプロパティを予測するものと考えることができます。テキストは、宗教、政治、金融、または教育のいずれかに関するものである場合もあれば、まったくない場合もあります。

http://scikit-learn.org/stable/modules/multiclass.htmlから取得


18

他の回答を補足するために、いくつかの図を示します。1行= 1サンプルの予想出力。

マルチクラス

1列= 1クラス(ワンホットエンコーディング)

ここに画像の説明を入力してください

マルチラベル

1列= 1クラス

ここに画像の説明を入力してください


あなたはそれを見ます:

  • マルチラベルの場合、1つのサンプルに複数のクラスが割り当てられる場合があります。
  • マルチクラスの場合、合計で2つ以上のクラスがあります。

副次的な注意事項として、マルチ出力-マルチクラス分類の問題を防ぐことはできません。

ここに画像の説明を入力してください


7

複数クラスの問題には、相互に排他的な有限のクラスコレクションのいずれかにインスタンスが割り当てられます。(@Dikranからの)カニの既に与えられた例のように:男性青、女性青、男性オレンジ、女性オレンジ。これらのそれぞれは、他のものを除外しており、総合すると総合的です。

マルチラベル問題の1つの形式は、これらを性別と色の2つのラベルに分割することです。性別は男性または女性で、色は青またはオレンジです。しかし、これはすべてのインスタンスがすべてのラベルを取得するため、マルチラベル問題の特殊なケースであることに注意してください(つまり、すべてのカニには性別と色の両方があります)。

マルチラベルの問題には、各インスタンスに可変数のラベルを割り当てることができる他のケースも含まれます。たとえば、新聞や電信の記事は、ニュース、政治、スポーツ、医学などのカテゴリに割り当てられます。重要なスポーツイベントに関する1つのストーリーには、SPORTSというラベルが割り当てられます。一方、特定のスポーツイベントで明らかになった政治的緊張を伴うものは、SPORTSとPOLITICSの両方のラベルを取得する可能性があります。私が米国にいる場合、イベントの社会的影響を考慮して、スーパーボウルの結果にはスポーツとニュースの両方のラベルが付けられています。

この形式のラベル付けは、可変数のラベルを使用して、カニを使用した例と同様の形式に再キャストできます。ただし、すべてのラベルはLABEL-Xまたはnot-LABEL-Xとして扱われます。ただし、すべてのメソッドでこの再キャストが必要なわけではありません。


2

さらにもう1つの違いは、マルチラベル問題ではモデルが異なるクラス間の相関を学習する必要があることですが、マルチクラス問題では異なるクラスは互いに独立しています。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.