線形、二次、フィッシャーの判別分析における出典の不一致


10

私は判別分析を勉強していますが、いくつかの異なる説明を調整するのに苦労しています。私は何かを見逃しているに違いないと私は信じています。これまでこのレベルの矛盾に遭遇したことがないからです。とはいえ、このWebサイトでの判別分析に関する質問の数は、その複雑さを証明しているようです。

いくつかのクラスのLDAとQDA

私の主な教科書は、Johnson&Wichern Applied Multivariate Statistical Analysis(AMSA)とこれに基づく私の先生のメモです。2つのグループの設定は無視します。これは、この設定の簡略化された式が少なくともいくつかの混乱を引き起こしているためです。この情報源によると、LDAとQDAは、予想誤分類コスト(ECM)に基づく分類ルールのパラメトリック(多変量正規性を想定)拡張として定義されています。ECMは、新しい観測値xを任意のグループに分類するための条件付き予想コストを合計し(誤分類コストと事前確率を組み込んで)、これを最小化する分類領域を選択します。ここで

ECM=i=1groupspi[k=1; ikgroupsP(k|i)c(k|i)]
P(k|i)=P(classifying item as group k | item is group i)=Rkfi(x)dxfi(x)は人口密度、Rkはグループkの観測値のセット、cはコスト、piは事前確率です。次に、新しい観測値を、内側の項が最小であるグループ、または内側の項の省略された部分p_k f_k(\ boldsymbol {x})pkfk(x)が最大であるグループに割り当てることができます。

この分類規則は、「事後確率を最大化するもの」(sic AMSA)に相当すると思われます。これは、私が言及したベイズのアプローチであるとしか想定できません。これは正しいです?そして、ECMは古い方法です。それが他の場所で発生するのを見たことがないからです。

正規母集団の場合、このルールは2次判別スコアに簡略化されます:。

diQ(x)=12log(Σi)12(xμi)TΣi1(xμi)+log(pi)

これは、112ページの「統計学習の要素(ESL)の式4.12」と同等のようですが、スコアではなく二次判別関数として記述されています。さらに、多変量密度の対数比(4.9)を介してここに到着します。これはベイズのアプローチの別の名前ですか?

共分散が等しいと仮定すると、式は線形判別スコアをさらに単純化します。

di(x)=μiTΣ1x12μiTΣ1μi+log(pi)

この式は、ESL(4.10)とは異なります。最初の項が逆になっています:。ESLバージョンは、Rの統計学習にリストされているバージョンでもあります。さらに、AMSAで提示されるSAS出力では、定数と係数で構成される線形判別関数が記述されていベクトル、ESLバージョンと一見一貫性があります。xTΣ1μk0.5X¯jTCOV1X¯j+ln priorjCOV1X¯j

この矛盾の背後にある理由は何でしょうか?

判別式とフィッシャーの方法

注:この質問が大きすぎると思われる場合は、このセクションを削除して新しい質問を開きますが、前のセクションに基づいています。テキストの壁に関係なくお詫び申し上げます。私はそれをいくらか構造化するために最善を尽くしましたが、この方法に関する私の混乱がロジックのかなり奇妙なジャンプにつながったと確信しています。

AMSAの本では、フィッシャーの手法についても、いくつかのグループについて説明しています。しかし、ttnphnsは指摘している複数 FDAは、単に二つのグループとLDAであること。では、このマルチクラスFDAとは何でしょうか。おそらくFDAは複数の意味を持つことができますか?

AMSAはフィッシャーの判別式をの固有ベクトルとして説明し、の比率を最大化します。線形結合は、サンプル判別式()です。分類のために、の最小値を持つグループkを選択しますここで、rは使用する判別式の数です。すべての判別式を使用する場合、このルールは線形判別関数と同等になります。W1Ba^TBa^a^TWa^e^ixmin(g1,p)j=1r[e^jT(xx¯k)]2

LDAに関する多くの説明は、AMSAの本でFDAと呼ばれている方法論を説明しているようです。つまり、この間/内の変動性の側面から始まります。BWマトリックスの分解ではない場合、FDAは何を意味しますか?

教科書が判別分析の次元削減の側面について言及するのはこれが初めてですが、このサイトのいくつかの 回答はこの手法の2段階の性質を強調していますが、1つしかないため、これは2つのグループ設定では明確ではありません。弁別。上記の式がマルチクラスLDAおよびQDAであることを考えると、判別式がどこに現れるのかはまだわかりません。

このコメントは特に混乱し、ベイズ分類は基本的に元の変数に対して実行できると指摘しました。しかし、本とここで指摘されているように、FDAとLDAが数学的に同等である場合、次元削減は関数固有のものではないのでしょうか。これが最後のリンクで対処していることだと思いますが、完全にはわかりません。di

私の教師のコースノートは、FDAが本質的に正準相関分析の形式であることを説明し続けます。私はこの側面について語っている他の情報源を1つだけ見つけましたが、これもまた、その間および変動内で分解するフィッシャーのアプローチと密接に関連しているようです。SASは、フィッシャーの方法(https://stats.stackexchange.com/a/105116/62518)に明らかに関連しているLDA / QDA手順(DISCRIM)で結果を提示します。ただし、SASのFDAオプション(CANDISC)は、これらのいわゆるフィッシャーの分類係数を提示せずに、基本的に正準相関を実行します。lda(MASS)によって取得されたRのW-1B固有ベクトルと同等であると信じる生の正準係数を示します(https://support.sas.com/documentation/cdl/en/statug/63033/HTML/default/viewer.htm#statug_candisc_sect019.htm)。分類係数は、LDAとQDAのセクションで説明した判別関数から得られるようです(母集団ごとに1つの関数があり、最大のものを選択するため)。

木々の間から森を見るのに役立つ情報源への説明や参照があれば、私は感謝します。私の混乱の主な原因は、別の教科書が別の名前でメソッドを呼び出したり、他の可能性を認識せずに数学のわずかなバリエーションを提示したりすることです。 。


If we use all the discriminants this rule would be equivalent to the linear discriminant functionはっきりしない。「判別式」と「判別関数」は同義語です。すべての判別式を使用することも、それらの中で最も強い/有意なものだけを使用することもできます。私はAMSAの本には目を向けませんでしたが、著者にとってはFDA = LDAだと思います。実は「Fisher LDA」は余計な言葉になると個人的に思っています。
ttnphns

LDA分類に関するこの回答への「追加」で、変数から「フィッシャー線形分類関数」を直接計算することExtract the discriminants -> classify by them all (using Bayes approach, as usual)は、通常、デフォルトで、判別式のプールされたクラス内共分散行列が分類に使用される場合と同等であることに気付きました。
ttnphns

実際、「フィッシャーの線形分類関数」は、W^-1B「ベイズ」の固有分解を実行せずにLDAを実行する方法です。これは同等ですが、柔軟性低くなります(判別式の一部だけを選択したり、分類時に共分散行列内で個別に使用したりすることはできません)。
ttnphns

私はまだあなたの答えとリンクを消化しています(ありがとうございます):1)AMSAからの抜粋で、「判別」と「判別スコア」を明確にしています。i.imgur.com/7W7vc8u.jpg? 1用語を使用しました「スコア」と「機能」は互換的に使用できます。3)同じ抜粋で、AMSAブックは固有分解をフィッシャーの判別式を取得する方法として参照していることがわかります。それがここに示されている方法は、フィッシャーの方法はあくまで一ハード判別関数/得点につながる線形/二次の方法よりも柔軟なようだ...W1B
ゼニト

Zenitは、私にとって、判別スコアは(正規の)判別関数の値です。引用する式と、SPSSでの標準判別式の計算方法について知っいるものとを比較することはできません。計算して結果を比較し、結論を出すことをお勧めします。また、テキストによってラベル「フィッシャー」のラベルが異なる場合があるのではないかと思います。
ttnphns

回答:


8

私は質問の1つの側面のみを取り上げ、代数なしで直感的にそれを行います。

場合クラスが同一の分散共分散行列を有するとにおけるそれらの重心のシフトによってのみ異なる次元空間それらは完全に直線的に分離可能である「部分空間」。これは、LDAが行っていることです。変数空間に3つの同一の楕円体があるとします。エラーなしでクラスメンバーシップを予測するには、すべての変数の情報を使用する必要があります。しかし、これらは同じサイズで方向付けられた雲であったという事実により、単位半径のボールへの一般的な変換によってそれらを再スケーリングすることが可能です。次に、gpq=min(g1,p)V1,V2,V3q=g1=2以前と同じように正確にクラスメンバーシップを予測するには、独立した次元で十分です。これらの次元は、判別関数と呼ばれます。ポイントの同じサイズのボールが3つある場合、必要な軸線は2つだけであり、すべてのポイントを正しく割り当てるために、ボールの中心の座標をボールに合わせる必要があります。D1,D2

ここに画像の説明を入力してください

判別式は相関のない変数であり、クラス内の共分散行列は理想的には同一のもの(球)です。判別式は元の変数空間の部分空間を形成します-それらは線形結合です。ただし、これらは回転のような(PCAのような)軸ではありません。元の変数空間で見られるように、軸は相互に直交しいないため判別式です。

したがって、分類にLDAを使用するクラス内分散共分散の均一性の仮定の下では、既存の判別式はすべて、元の変数ですぐに分類するよりも悪くはありません。ただし、すべての判別式を使用する必要はありません。最初に最も強い/統計的に有意なのみを使用できます。これにより、分類のための最小限の情報が失われ、分類の誤りが最小限になります。この観点から見ると、LDAはPCAと同様のデータ削減であり、監視のみです。m<q

均質性(+多変量正規性)を想定し、使用する予定であるが分類のすべての判別式を提供すると仮定すると、判別式自体の抽出(一般化された固有問題を含む)をバイパスして、いわゆる「フィッシャーの分類関数」を計算できます。変数から直接、順に分類する、それらと同等の結果で、。したがって、クラスの形状が同じである場合、入力変数、フィッシャー関数、または判別式をすべて「分類子」の同等のセットと見なすことができます。しかし、判別式は多くの点でより便利です。gpgq1

通常、クラスは実際には「同一の楕円」ではないため、判別式による分類は、すべての元の変数によってベイズ分類を行う場合よりもやや劣ります。たとえば、このプロットでは、2つの楕円体は互いに平行ではありません。また、1つの既存の判別式では、2つの変数で可能な限り正確にポイントを分類するには不十分であることを視覚的に理解できます。QDA(二次判別分析)は、LDAよりも1ステップ優れた近似になります。LDAとQDAの中間にある実際的なアプローチは、LDA判別式を使用することですが、分類では観測された個別クラス共分散行列を使用します(を参照してください。qp)それらのプールされた行列の代わりに(これはIDです)。

(そして、はい、LDAはMANOVAと正準相関分析または削減ランクの多変量回帰と密接に関連していると見なすことができます。参照参照参照してください。)


1重要な用語の注記。一部のテキストでは、フィッシャーの分類関数は「フィッシャーの判別関数」と呼ばれることがあります。これは、正規判別関数である判別子と混同する場合があります(つまり、固有分解で取得されます)gqW1B)。明確にするために、「フィッシャーの分類関数」と「正準判別関数」(=判別式、略して)と言うことをお勧めします。現代の理解では、LDAは正準線形判別分析です。「フィッシャーの判別分析」は、少なくとも私の認識では、2つのクラスを持つLDA(単一の正準判別は必然的にフィッシャーの分類関数と同じものです)、または広くは、マルチクラス設定でのフィッシャーの分類関数の計算です。


用語集:LDAに関するWikipediaの記事(en.wikipedia.org/wiki/Linear_discriminant_analysis)は、「フィッシャーの線形判別とLDAはしばしば同じ意味で使用されますが、フィッシャーの元の記事[1]は実際にはわずかに異なる判別式を説明していますが、正規分布クラスや等クラス共分散など、LDAの仮定の一部を作成しないでください。」これに基づいて、2つのクラスのLDAは、グループの共分散が「同じ」である場合、「FDA」の特別なケースのようです。@ttnphns:これは正しいですか?
Laryx Decidua

@LaryxDecidua、私はこの場合の用語について100%確信が持てず、さまざまな意見を見てきました。「Fisher's DA」という言葉は一切使わない。しかし、人々が尋ねるとき、私はそれを私の心に返答します、「FDAは2つのクラスを持つLDAです」。
ttnphns

おかげで、私にとって最も興味深い側面は、Wikipediaによると、「FDA」は正常性を前提としないのに対し、「LDA」(およびQDA)は正常性を前提とすることです。おそらく「FDAは2つのクラスを持つLDAであり、正規性やホモスキャダシティを仮定していません」。
Laryx Decidua
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.