線形判別分析


9

James、Witten、Hastie、Tibshiraniによる「統計学習入門」を勉強しています。

彼らの本の139ページで、彼らはベイズの定理紹介することから始めました。は数学定数ではありませんが、事前確率を示します。この方程式には何も奇妙なことはありません。pk(X)=P(Y=k|X=x)=πkfk(x)l=1kπlfl(x)π

この本は、上記の方程式に組み込むことができる推定値を取得したいと主張しています。を推定するために、それが正常であると想定しています。1次元設定では、、ここでとは番目のクラスの平均と分散です。これは、想定された。(私は最後のステートメントから混乱し始めました。)fk(x)fk(x)fk(x)=12πσexp(12σ2(xμk)2)μkσk2kσ12=σ22==σK2

をにプラグ、これはかなり厄介な方程式(1)になります。fkpx

px(k)=πk12πσexp(12σ2(xμk)2)l=1Kπl12πσexp(12σ2(xμl)2).

繰り返しになりますが、これは単なる置換であるため、ここでの驚きはありません。


ベイズ分類器は、方程式(1)が最大であるクラスに観測値を割り当てることを含みます。式(1)の対数を取り、項を並べ替えると、これが次の値が最大であるクラスに観測値を割り当てることと同等であることを示すことは難しくありません。

δk(x)=xμkσ2μk22σ2+log(πk)

質問:これがどこから来たのか、そしてそれが何を意味するのかわかりません。方程式の対数を作ってみましたが、これにはなりません。これは最大の観測であるため、ここのどこかで導関数を使用していますか?

回答:


5

式(1)は比例定数まで表すことができます。

px(k)πk12πσexp(12σ2(xμk)2)

だからログを取るなら

logpx(k)logπklog(2πσ)12σ2(xμk)2

ここでは依存しないため、再び比例定数になります。次に、2乗項を展開すると、そこに移動します(括弧を展開すると、消える別の項が表示されることに注意してください)。log(2πσ)k


君の答えを読んで笑った。簡単なの?鮮やかさ!量(素人の言葉で意味することを知っていてもいいですか?統計のバックグラウンドは貧弱ですが、数学を理解することができます。δk(x)
cgo 2015

2
いや、それだけです。は線形判別関数と呼ばれます。これは、特性与えられた場合、観測値がクラス属する事後確率を記述する別の方法です。したがって、ベイズルールから事後確率が最も高いクラスを選択することは、LDAの値が最も高いクラスを選択することと同じです。あなたが設定することができる(観察として分類されるべきであるときのしきい値を与えるベイズ決定境界計算するまたは)。δk(x)kxδk(x)=δl(x)kl
アンディ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.