ロジスティック回帰を使用してマルチラベルデータを分類する方法はありますか?マルチラベルとは、複数のカテゴリに同時に属することができるデータを意味します。
このアプローチを使用して、いくつかの生物学的データを分類したいと思います。
ロジスティック回帰を使用してマルチラベルデータを分類する方法はありますか?マルチラベルとは、複数のカテゴリに同時に属することができるデータを意味します。
このアプローチを使用して、いくつかの生物学的データを分類したいと思います。
回答:
私は原則、そうです-しかし、これらの手法が依然としてロジスティック回帰と呼ばれるかどうかはわかりません。
実際、あなたの質問は、通常の分類子に対する2つの独立した拡張機能を参照できます。
各ケースのすべてのメンバーシップの合計を1にする必要があります(「クローズドワールド」=通常のケース)、
またはこの制約をドロップすることができます(「1クラス分類子」と呼ばれることもあります)。
これは、1クラスでも複数の独立したLRモデルによってトレーニングできます。問題は不適切な場合が多く(このクラスとあらゆる方向に存在する可能性のあるすべての種類の例外)、LRは特に適していません。
部分クラスメンバシップ:それぞれの場合は、会員と属しクラスごとに、ファジークラスタ分析におけるメンバシップと同様:
3つのクラスA、Bが存在すると仮定する、C.次にサンプリングすることができますこれは、メンバーシップベクトル[ A = 0 、B = 1 、C = 0 ]としても記述できます。この表記では、部分的なメンバーシップはたとえば[ A = 0.05 、B =
など
問題(ファジーメンバーシップまたは確率)に応じて、異なる解釈を適用できます。
予測のために、例えば事後確率は可能であるだけでなく、実際にはかなり一般的です
そして検証さえ
これの全体的な考え方は、境界線の場合には、それらを明確に1つのクラスに割り当てることができない場合があるということです。
nnet:::multinom
MASSの一部であるR eg では、そのようなデータをトレーニングに受け入れます。ロジスティックシグモイドがあり、隠れ層がないANNが、舞台裏で使用されています。検証部分の
パッケージを開発しsoftclassval
ました。
1クラスの分類子は、Richard G. Brereton:パターン認識のためのケモメトリックス、Wiley、2009でうまく説明されています。
このペーパーのメンバーシップの詳細については、 クローディアベーライト、カトリンガイガー、マティアスキルシュ、ステファンBソボトカ、ガブリエレシャッカート&ライナーサルツァー:星細胞腫組織のラマン分光グレーディング:ソフトリファレンス情報を使用しています。Anal Bioanal Chem、2011、Vol。400(9)、pp.2801-2816
この問題は、サンプルのラベルの予測にコストがかかる可能性がある、コストに敏感な学習にも関連しています。マルチラベルサンプルの場合、これらのラベルのコストは低く、他のラベルのコストは高くなります。
あなたは見てとることができ、このチュートリアルあなたも対応するスライドを見つけることができるここに。