質問に表示されるすべてのサマリーは、その2番目の瞬間にのみ依存します。または、同等に、行列。を点群と考えているため- 各点は行です- これらの点に対する簡単な操作で、のプロパティを保持するものを尋ねる場合があります。X ′ X X X X ′ Xバツバツ′バツバツバツバツ′バツ
1つは、に行列を左乗算することです。これにより、別の行列ます。これが機能するためには、それが不可欠です n × n U n × 2 U Xバツn × nうんn × 2U X
バツ′X =(U X )′U X = X′(U′U )X。
が単位行列である場合、つまりが直交する場合、等価性が保証されます。 n×n Uうん′うんn × nうん
これはよく知られている(かつ簡単に実証するために)直交行列はユークリッド反射及び回転の製品が(それらが形成する反射基で)。回転を賢く選択することで、劇的に単純化できます。1つのアイデアは、一度にクラウド内の2つのポイントのみに影響する回転に焦点を当てることです。これらは視覚化できるため、特に単純です。XRnバツ
具体的には、およびクラウド内の2つの異なる非ゼロポイントとし、行およびを構成します。これら2つのポイントのみに影響する列スペースの回転は、それらを(x j、y j)i j X R n(x私、y私)(xj、yj)私jバツRn
{ (x′私、y′私)= (cos(θ )x私+ 罪(θ )xj、cos(θ )y私+ 罪(θ )yj)(x′j、y′j)= (− sin(θ )x私+ cos(θ )xj、− 罪(θ )y私+ cos(θ )yj)。
これは、平面内でベクトルおよびをし、それらを角度だけ回転させることです。(ここで座標がどのように混ざり合うかに注意してください!がお互いに行き、が一緒に行きます。したがって、でのこの回転の効果は通常、描かれたベクトルおよび)(Y I、Y J)θ X 、Y R、N(X I、Y I)(XはJ、Y J)R 2(x私、xj)(y私、yj)θバツyRn(x私、y私)(xj、yj) R2
適切な角度を選択することにより、これらの新しいコンポーネントのいずれかをゼロにすることができます。具体的には、選択して、θ
⎧⎩⎨⎪⎪⎪⎪cos(θ )= ± x私バツ2私+ x2j√罪(θ )= ± xjバツ2私+ x2j√。
これにより、ます。記号を選択してます。、表されるクラウド内のポイントおよびを変更するこの操作を呼び出しましょう。Y ' J ≥ 0 I J X γ (I 、J )バツ′j= 0y′j≥ 0私jバツγ(i 、j )
再帰的に適用にの最初の列になりますのみに非ゼロであることが最初の行。幾何学的には、雲の1点を除くすべてを軸に移動します。今、我々は潜在的座標を含む、単一の回転を適用することができるで、それらの圧搾する単一点までポイント。同様に、はブロック形式に縮小されましたX X、Y 2 、3 、... 、N R N N - 1 Xγ(1 、2 )、γ(1 、3 )、... 、γ(1 、n )バツバツy2 、3 、... 、n個Rnn − 1バツ
X =(x′10y′1z)、
及びの両方列ベクトル座標を、そのような方法という点でz n − 10zn − 1
バツ′X =((x′1)2バツ′1y′1バツ′1y′1(y′1)2+ | | z | |2)。
この最終回転により、が上三角形式にさらに縮小されます。バツ
X = ⎛⎝⎜⎜⎜⎜⎜⎜⎜バツ′100⋮0y′1| | z | |0⋮0⎞⎠⎟⎟⎟⎟⎟⎟⎟。
実際には、作成されたはるかに単純な行列に関して理解できるようになりました。最後の2つのゼロ以外の点が残っていることでバツ2 × 2(x′10y′1| | z | |)
例として、2変量正規分布から4つのiidポイントを引き出し、それらの値を
X = ⎛⎝⎜⎜⎜0.09− 0.310.74− 1.80.12− 0.63− 0.23− 0.39⎞⎠⎟⎟⎟
この最初の点群は、次の図の左側に黒い実線のドットを使用して示されており、色付きの矢印が原点から各ドットを指します(ベクトルとして視覚化するため)。
これらのポイントに対しておよびによって実行される一連の操作により、中央に雲が表示されます。右端では、軸に沿った3つの点が1つの点に合体されており、縮小形の表現が残っています。赤い垂直ベクトルの長さは; もう1つの(青い)ベクトルはです。γ(1 、2 )、γ(1 、3 )、γ(1 、4 )yバツ| | z | |(x′1、y′1)
5つのパネルすべてで参照用に描かれたかすかな点線の形状に注意してください。 それは表現の最後の残りの柔軟性を表し:バツ我々は最初の2つの行を回転させると、最後の二つのベクトルは、この楕円を描きます。したがって、最初のベクトルはパスを追跡します
θ → (cos(θ )x′1、cos(θ )y′1+罪(θ )| | z | | )(1)
一方、2番目のベクトルは、
θ → (− sin (θ )x′1、− 罪(θ )y′1+ cos(θ )| | z | | )。(2)
この曲線は点の集合の画像であるため、退屈な代数を避けることができますによって決定される線形変換の下で{ (cos(θ )、sin(θ )):0 ≤ θ < 2 π}
(1 、0 )→ (X ′1、0 );(0 、1 )→ (Y ′1、| | z | | )、
楕円でなければなりません。(質問2は現在完全に回答されています。)したがって、パラメーター化には 4つの重要な値があり、そのうち2つは長軸の端に対応し、2つは短軸の端に対応します。そして、その直後に、同時にはそれぞれ短軸と長軸の端を与えます。このようなを選択すると、次のように、ポイントクラウド内の対応するポイントが主軸の端に配置されます。(1 )(2 )θθ(1 ) (2 )θ
これらは直交しており、楕円の軸に沿って向けられているため、PCAソリューションである主軸を正しく表します。それは質問1に答えます。
ここで与えられた分析は、マハラノビス距離の下から上への説明で私が答えたものを補完します。そこで、回転と再スケーリングを調べて、次元の点群が自然な座標系を幾何学的に決定する方法を説明しました。ここでは、線形変換下の円の画像である楕円を幾何学的に決定する方法を示しました。もちろん、この楕円は一定のマハラノビス距離の等高線です。 p=2 R 2R2p = 2R2
この分析によって達成されるもう1つのことは、QR分解(長方形行列の)と特異値分解(SVD )との密接な関係を表示することです。として知られているギブンス回転。それらの構成は、QR分解の直交部分または「」部分を構成します。残ったもの-の縮小形は、上三角、またはQR分解の「」部分です。同時に、回転と再スケーリング(他のポストの座標の再ラベル付けとして説明)は、SVD の部分を構成します。Q X R D ⋅ V ' X = Uγ(i 、j )QバツRD ⋅ V′ UX = UDV′。ちなみに、の行は、その投稿の最後の図に表示される点群を形成します。うん
最後に、ここで紹介する分析は、場合に明らかな方法で一般化しています。つまり、主成分が1つまたは2つ以上の場合です。p ≠ 2