私の知る限り、主成分は、座標軸を回転させて最大分散の方向に合わせることで得られます。
それにもかかわらず、私は「回転していない主成分」について読み続け、私の統計ソフトウェア(SAS)は、回転していない主成分だけでなく、バリマックスで回転した主成分も提供してくれます。ここで混乱しています。主成分を計算するとき、軸はすでに回転しています。なぜ別の回転が必要なのですか?「回転していない主成分」とはどういう意味ですか?
私の知る限り、主成分は、座標軸を回転させて最大分散の方向に合わせることで得られます。
それにもかかわらず、私は「回転していない主成分」について読み続け、私の統計ソフトウェア(SAS)は、回転していない主成分だけでなく、バリマックスで回転した主成分も提供してくれます。ここで混乱しています。主成分を計算するとき、軸はすでに回転しています。なぜ別の回転が必要なのですか?「回転していない主成分」とはどういう意味ですか?
回答:
これは非技術的な答えになるでしょう。
正しい:PCAは基本的に座標軸の回転であり、成功した各軸が可能な限り多くの分散をキャプチャするように選択されます。
一部の学問分野(心理学など)では、結果の軸を解釈するためにPCAを適用するのが好きです。すなわち、主軸#1(元の変数の特定の線形結合である)には何らかの特定の意味があると言いたいのです。この意味を推測するために、彼らは線形結合の重みを見ます。しかし、これらの重みはしばしば乱雑であり、明確な意味を識別することはできません。
これらの場合、人々は時々バニラPCAソリューションを少しいじることを選択します。それらは、一定の数の主軸(何らかの基準によって「重要」と見なされる)を取り、さらに回転させて、「単純な構造」、つまり、解釈しやすい線形結合を実現しようとします。可能な限り単純な構造を探す特定のアルゴリズムがあります。それらの1つはvarimaxと呼ばれます。バリマックス回転後、連続するコンポーネントは、可能な限り多くの分散をキャプチャしなくなります!PCAのこの機能は、追加のバリマックス(またはその他の)回転を行うと壊れます。
そのため、バリマックス回転を適用する前に、「回転されていない」主成分があります。その後、「回転した」主成分が得られます。言い換えれば、この用語はPCAの結果自体の後処理を指し、PCAの回転そのものを指すものではありません。
これはすべて、回転するのは荷重であり、主軸ではないという事実により、やや複雑です。しかし、数学的な詳細については、ここでの私の長い答えにあなた(および興味のある読者)を紹介します:PCAの後に回転(バリマックスなど)が続いていますか?
what gets rotated are loadings and not principal axes as such
これは技術的な概念であると付け加えます。理論的には、これら2つの回転の種類は並置です。PCAでは、特定の直交基底(固有値の最も急峻なスクリープロットを持つ基底)を見つけるために回転します。バリマックスでは、回転して別の特定の直交基底を見つけます(最も相互に互換性のある構造を持つ)。あらゆる種類の直交基底を行うことができます。