3
PCAを行う前に、他の標準化因子ではなく標準偏差で割るのはなぜですか?
生データをその標準偏差で除算する理由について、次の正当化(cs229コースノートから)を読みました。 説明が言っていることは理解できますが、なぜ標準偏差で割るとそのような目標が達成されるのかはわかりません。誰もが同じ「スケール」にいるようにそれは言います。ただし、標準偏差で除算することでそれが達成される理由は完全には明らかではありません。同様に、分散で割ると何が悪いのでしょうか?なぜ他の数量ではないのですか?のような...絶対値の合計?または他の標準... STDを選択するための数学的な正当化はありますか? この抽出物の主張は、数学(および/または統計)を通じて導き出される/証明できる理論的な声明なのか、それとも「実践」で機能するように見えるために私たちが行う声明の1つですか? 基本的に、その直観が真実である理由の厳密な数学的説明のいずれかを提供できますか?または、それが単なる経験的な観察である場合、なぜPCAを行う前にそれが一般に機能すると考えるのですか? また、PCAのコンテキストでは、これは標準化または正規化のプロセスですか? 私が持っていたいくつかの他の考えは、STDがなぜ「説明」するかもしれない: 1n∑ni = 1(x私- μ )p1n∑i=1n(xi−μ)p\frac{1}{n} \sum^{n}_{i=1} (x_i -\mu)^p おそらく関連する質問があることがわかりました。 相関または共分散に関するPCA? しかし、「相関」または「共分散」をいつ使用するかについてはもっと話しているように見えましたが、厳密または説得力のある、または詳細な正当化が欠けていました。 同じ: 分析前にデータを正規化する必要がある理由 関連: SVD / PCAの変数の「正規化」