合計(クラス内+クラス間)散布図行列の導出


14

私はPCAとLDAの手法をいじっていましたが、ある時点で立ち往生しています。私はそれを見ることができないほど単純だと感じています。

クラス内()およびクラス間(S B)の散布行列は、次のように定義されます。SWSB

SW=i=1Ct=1N(xtiμi)(xtiμi)T

SB=i=1CN(μiμ)(μiμ)T

総散乱行列は次のように与えられます。ST

ST=i=1Ct=1N(xtiμ)(xtiμ)T=SW+SB

Cは、クラスの数であり、Nはサンプル数であり、サンプルでμ iは i番目のクラスの平均であり、μは全体平均です。xμiμ

を導き出そうとしている間に、私は次のようになりました。ST

(xμi)(μiμ)T+(μiμ)(xμi)T

用語として。これはゼロにする必要がありますが、なぜですか?


確かに:

ST=i=1Ct=1N(xtiμ)(xtiμ)T=i=1Ct=1N(xtiμi+μiμ)(xtiμi+μiμ)T=SW+SB+i=1Ct=1N[(xtiμi)(μiμ)T+(μiμ)(xtiμi)T]

2
答えは、平均の周りの値の偏差を合計しており、その合計はゼロであるということです。しかし、正確にはm、およびm iは何ですか?どのようにしているMmは私がに関連μμ Iを?回答の質は推測の精度に依存しますが、非常に多くの推測を行わざるを得ません。xmmmmμμ
whuber

@whuber:まったくその通りです。質問を修正しました。
nimcap

回答:


8

あなたが仮定する場合

1Nt=1Nバツt=μ

それから

=1Ct=1NバツtμμμT==1Ct=1NバツtμμμT=0

数式が保持されます。同様に2番目の用語を扱います。


2
(+1)最初の項の転置である2番目の項もゼロでなければなりません:-)。
whuber

@whuber、はい、それも:)
mpiktas

こんにちは、私は仮定がなぜ成り立つのか分かりませんか?誰かがそれを説明できますか?
Mvkt

1
@Mvktの定義ほど仮定ではありません μ私は考えます。それは言うことです:μ はグループの観測値の平均です 。OPは表記法を説明していないため、答えは「仮定」を使用することを期待しているので、グループの平均はμ
ビンセント
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.