対応するトピックを含むテキストのコーパスがあります。たとえば、"A rapper Tupac was shot in LA"とラベル付けされました["celebrity", "murder"]。したがって、基本的に各特徴ベクトルには多くのラベルを付けることができます(同じ量ではありません。最初の特徴ベクトルには3つのラベル、2番目に1番目、3番目に5番目のラベルを付けることができます)。 各テキストに対応するラベルが1つしかない場合は、単純ベイズ分類器を試してみますが、ラベルが多数ある場合にどうすればよいかわかりません。 ナイーブベイズをマルチラベル分類問題に変換する方法はありますか(より良いアプローチがある場合-私に知らせてください)? PS私が持っているデータについていくつかのこと。 データセット内の約10.000要素 テキストは約2〜3文 テキストあたり最大7つのラベル