データ空間、変数空間、観測空間、モデル空間(例:線形回帰)


9

我々はデータ行列があるとであり、N行列P、およびラベルベクトルYであり、nは -by-一つ。ここで、行列の各行は観測値であり、各列は次元/変数に対応しています。(n > pと仮定)XnpYnn>p

次に何をすべきかdata spacevariable spaceobservation spacemodel space意味ですか?

列ベクトルにまたがる空間は、ランクpでありながらn座標を持っているため、(退化した) -D空間であり、変数ベクトルにまたがるため、可変空間と呼ばれますか?それとも、各次元/座標が観測に対応するため、観測空間と呼ばれますか?nnp

そして、行ベクトルがまたがる空間はどうですか?


5
これらは広く知られている用語ではありません。リファレンスはありますか?そうでない場合は、それらの意図が何であるかを推測している可能性があります。
whuber

1
参照はありません。昔、先生が言ったのを聞いたことがあります。
user3813057

3
したがって、あなたの教授がこれらの用語をある時点で定義したと私は確信しています。多分それらはあなたのクラスノートにあります...。
whuber

回答:


13

これらの用語は、多変量統計に関するいくつかの本に記載されています。量的特徴データマトリックスnによって個人がいるとしますp。次に、軸が特徴である空間内の点として個人をプロットできます。それは、古典的な散布図、別名可変空間プロットになります。個人の雲は、axes-featuresで定義された空間にまたがっています。

点が変数で、軸が個人である散布図も考えられます。完全に以前と同様に、トプシー・タービーのみ。それは、それをまたがる変数、それを定義する個人を含む被験者空間プロット(または観測空間プロット)です。

n>ppnpp1

サブジェクト空間プロットを描画する前にフィーチャ(データ行列の列)が中央に配置されていた場合、変数の長さは変数のノルム(平方根の平方和)に等しく、変数ベクトル間の角度の余弦はピアソン相関に等しくなります。 )または標準偏差(dfで除算した場合)。

可変スペースとサブジェクトスペースは同じコインの2つの面であり、それらは同じユークリッド分析スペースであり、互いに鏡のようにしか表示されません。それらは、ゼロ以外の固有値や固有ベクトルなどの同じプロパティを共有します。したがって、分析空間の主軸(または他の直交基底)の空間内の点として、被験者と変数の両方を並べてプロットすることが可能です。この共同プロットは、バイプロットと呼ばれます。「データ空間」という用語が何を意味するのか正確にはわかりません-それが特定のことを意味する場合、主観空間と変数空間が2つの仮説である共通の分析空間であると思います。

ここに画像の説明を入力してください

いくつかのローカルリンク:


1n=5p=2


2
+1。しかし、変数と主語空間が「同じユークリッド分析空間」であると言うことの正確な数学的意味が何であるかはわかりません。
amoeba 2016年

3
@amoeba、答えが数学的になることなく、私はそれが直観的に透明であることを望みました(特にあなたのような線形代数の専門家にとって)。たとえば、データマトリックス(svd、バイプロットのベース)の特異値分解では、固有値と左と右の固有ベクトルはどの空間を特徴付けますか?これは、さまざまな方法でレイアウトできる同じ分析空間ではありません。(ii)点としての行、軸としての列。(iii)列をポイント、行を軸として?
ttnphns 2016年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.