マルチクラス分類器の構築は、いくつかのバイナリ分類器よりも優れていますか?


18

URLをカテゴリに分類する必要があります。すべてのURLをゼロにする15のカテゴリがあるとします。

15ウェイ分類器の方が良いですか?15個のラベルがあり、各データポイントの機能を生成します。

または、15種類のバイナリ分類子を作成します。たとえば、映画または非映画で、これらの分類から取得した数値を使用して、ランキングを作成し、最適なカテゴリを選択します。

回答:


12

まず、問題がマルチラベル(つまり、1つのURLが複数のクラスに属することができる)かどうか(つまり、1つのURLが1つのクラスにのみ属することができるか)を自問する必要があります。

前者の場合は、一連のバイナリ分類器を使用します。これは、これがマルチラベルの問題を行うデフォルトの方法だからです。

後者の場合、答えはデータの見え方、分析の目的、使用している方法の組み合わせに依存します。おそらく両方を試して最適なものを選択する必要があります。
一部のメソッド(SVMなど)は、定義方法が原因で実際​​にはマルチクラス分類を実行できないため、一連のバイナリ分類子を内部的に使用していることに注意してください。


私の問題のステートメントは、以前の仮定@mbqを考慮しています。マルチラベルがあることは知っています。はい、あなたが言ったように、15のバイナリ分類子を使用することにしましたが、再び、最高のカテゴリを1つ選択するためにランク付けする必要があります。そのため、一連のバイナリ分類器から取得した数値を使用して、別のトップレベルの分類を実行してみます。問題はありますか?
madCode

SVMはマルチクラス分類を実行できます。この方法は、ソフトマックス回帰に非常に似ています(「マルチクラスカーネルベースのベクトルマシンのアルゴリズム実装について」を参照)。
user1149913

4

これは、データの分散方法に依存します。OPが単一の線形判別関数が集団A対BまたはCまたはAを分離する複数の線形判別関数に基づいたものを決定するためのより良い分類器であるかどうかを知りたいという類似の質問に最近与えられた美しい例がありますBとC。ある場合は、2つの判別式を使用する方がその場合の方が優れていることを示すために、非常に素晴らしい色の散布図を与えました。私はそれにリンクしようとします。


待って。私はそれを見つけるのに苦労していますが、私は探し続けます。
マイケルR.チャーニック

リンクが見つからないことを残念に思います。左にある色、中央にある色、右にある色の雲を想像してください。2つの線形判別ラインは、中央のグループを左右のグループから分離するのに適していますが、単一のラインではまったくうまくいきません。絵はこれらすべての言葉よりも価値があります。
マイケルR.チャーニック

1
@MichaelChernickこれはあなたが探しているリンクですか?

あなたが言っていることを理解していると思います:bit.ly/M1NydS-このプレゼンテーションで出会ったあなたが定義した写真。4ウェイまたは3ウェイの分類。直接行うことができます。しかし.. 15通りの分類を行うと精度/リコールが損なわれるのではないかと思います、Dr。Chernick。
madCode

@Procrastinatorそれを見つけてくれてありがとう。私はそれを見つけるのにとても苦労していました、そして、私は多くの時間を探していました!それは最近の投稿だったので、私はシジュウカラを見つけるのは簡単でしょうが。
マイケルR.チェルニック

1

いくつかのメソッドは、マルチクラス、ランダムフォレスト、MLPなどをうまく処理します。

そのようにしたくない場合は、ECOCが問題に対して1-vs-Allを十分に実行する可能性があり、テストのみがわかります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.