回答:
まず、問題がマルチラベル(つまり、1つのURLが複数のクラスに属することができる)かどうか(つまり、1つのURLが1つのクラスにのみ属することができるか)を自問する必要があります。
前者の場合は、一連のバイナリ分類器を使用します。これは、これがマルチラベルの問題を行うデフォルトの方法だからです。
後者の場合、答えはデータの見え方、分析の目的、使用している方法の組み合わせに依存します。おそらく両方を試して最適なものを選択する必要があります。
一部のメソッド(SVMなど)は、定義方法が原因で実際にはマルチクラス分類を実行できないため、一連のバイナリ分類子を内部的に使用していることに注意してください。
これは、データの分散方法に依存します。OPが単一の線形判別関数が集団A対BまたはCまたはAを分離する複数の線形判別関数に基づいたものを決定するためのより良い分類器であるかどうかを知りたいという類似の質問に最近与えられた美しい例がありますBとC。ある場合は、2つの判別式を使用する方がその場合の方が優れていることを示すために、非常に素晴らしい色の散布図を与えました。私はそれにリンクしようとします。
いくつかのメソッドは、マルチクラス、ランダムフォレスト、MLPなどをうまく処理します。
そのようにしたくない場合は、ECOCが問題に対して1-vs-Allを十分に実行する可能性があり、テストのみがわかります。