これらの用語は、多変量統計に関するいくつかの本に記載されています。量的特徴データマトリックスn
によって個人がいるとしますp
。次に、軸が特徴である空間内の点として個人をプロットできます。それは、古典的な散布図、別名可変空間プロットになります。個人の雲は、axes-featuresで定義された空間にまたがっています。
点が変数で、軸が個人である散布図も考えられます。完全に以前と同様に、トプシー・タービーのみ。それは、それをまたがる変数、それを定義する個人を含む被験者空間プロット(または観測空間プロット)です。
n>p
p
n
p
p
1
サブジェクト空間プロットを描画する前にフィーチャ(データ行列の列)が中央に配置されていた場合、変数の長さは変数のノルム(平方根の平方和)に等しく、変数ベクトル間の角度の余弦はピアソン相関に等しくなります。 )または標準偏差(dfで除算した場合)。
可変スペースとサブジェクトスペースは同じコインの2つの面であり、それらは同じユークリッド分析スペースであり、互いに鏡のようにしか表示されません。それらは、ゼロ以外の固有値や固有ベクトルなどの同じプロパティを共有します。したがって、分析空間の主軸(または他の直交基底)の空間内の点として、被験者と変数の両方を並べてプロットすることが可能です。この共同プロットは、バイプロットと呼ばれます。「データ空間」という用語が何を意味するのか正確にはわかりません-それが特定のことを意味する場合、主観空間と変数空間が2つの仮説である共通の分析空間であると思います。
いくつかのローカルリンク:
1n=5
p=2