マルチクラスLDAと2クラスLDA


8

LDAを使用してマルチクラス分類器を設計する問題は、2クラス問題(1つ対その他すべて)またはマルチクラス問題として表すことができます。

特定のケースでマルチクラスLDA分類器2クラスLDA(1つ対他のすべて)を上回る、またはその逆の場合があるのはなぜですか。


かなり控えめな質問に詳細を追加していただけませんか。例。そして、ここでLDAの両方の段階(抽出と分類、または分類のみ)を検討しますか?
ttnphns

よく、私は27次元のベクトルをより低い次元に投影して、ベクトルを比較しようとしています。その動機は、可能な限り分類するための簡単な分類手法を設計することです。
garak

1
時折、一つのクラスが互いに接近して、残りのものから、遠く離れた「外れ値」であるときに、2つのクラス分類は、例えば(より正確であるときは、データが発生することがあります。原則としてしかし、Kクラス分類を。。。良いことが判明しなければならないまず、k個のクラスがより判別軸を可能に第二に、K-1クラスの塊は、一般的にLDAの分類段階が見るJohnSmithの答えに依存している多変量正規分布に従うことが期待されていません。
ttnphns

回答:


12

マルチクラスLDA分類器は常に(ほとんどの実際的なタスクでは)2クラスLDAよりも優れていると思います。そして、その理由を説明しようと思います。

サンプルデータセットをご覧ください。 3つのクラスのサンプルデータセット

ここには3つのクラスがあります。そして、青いクラスのLDAを使用して1対その他の分類子を作成するとします。

クラス「青」の推定平均はゼロですが、クラス「その他」の推定平均もゼロです。そして、LDAの定義から、共分散は同じです。つまり、LDAはより多くの要素を持つラベルで応答します。そして、それは決してクラス「青」を決して返しません!

マルチクラスLDAの場合、適切なクラスを完全に見つけることができます。

これに関する背景は、ほとんどの場合、ガウシアンの混合はもはやガウスではないということです。したがって、LDAのこの仮定は失敗します。そして、私はすべてのクラスがガウスであるデータセットの例を思い付くのは本当に難しいと言わざるを得ません。

そのため、マルチクラスLDAを使用することを強くお勧めします。お役に立てれば幸いです。


1
ジョンがここで非常にうまく示しているのは、2つのクラスのLDAがクラスを分離するために単一の行を使用していることだと思います。ただし、この例では、適切な分類には2つの行が必要であり、3つのクラスの問題で行われます。
Michael R. Chernick

@MichaelChernick、そう、そうです、それは他の観点からの説明です、あなたのコメントに感謝します!
Dmitry Laptev

クイックアンサーの皆さんありがとう!しかし、数日前に遭遇しました。10クラスの分類問題で、マルチクラスLDA(精度60%)が2クラスLDA(精度80%以上)よりもはるかに効率が悪い場合です。
garak

@MichaelChernickしかし、LDAを投影法として使用する場合、2つの次元(最大固有値の2つの固有ベクトル)を維持し、探している分離を取得することができます(平面を分離する代わりにkNN分類法を使用)、または明らかなものがないのですか?
Matthieu
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.