私はいくつかのメモを読んでいましたが、PCAは「データの範囲を限定」できると述べています。彼らが「データの球形化」と私に定義するのは、各次元を対応する固有値の平方根で割ることです。
「次元」とは、射影先の各基底ベクトル(つまり、射影先の固有ベクトル)を意味すると想定しています。したがって、私は彼らがやっていると思います:
ここで、は固有ベクトルの1つ(つまり、主成分の1つ)です。次に、その新しいベクトルを使用して、私たちが持っている生データ、たとえばを投影していると仮定します。したがって、投影される点は次のようになります。
彼らは、これを行うと、すべての機能が同じ分散を持つことが保証されると主張しています。
しかし、私がそれらが球形化によって何を意味するかについての私の解釈が正しいかどうかさえ確信がなく、それが正しいかどうかを確認したいと思っていました。また、それが正しかったとしても、このようなことをする意味は何ですか?私は彼らがそれが皆が同じ分散を持つことを確実にすることを主張することを知っています、しかし、なぜ私たちはこれをしたいのですか、そしてそれはどのようにこれを達成しますか?
u
は固有ベクトルの値であり、生のPC値に関連しています。u'
負荷と呼ばれ、正規化された(等分散)PC値に関連しています。あなたはそれについての私の答えを読みたいかもしれません:stats.stackexchange.com/a/35653/3277。