変数のベクトルはどのように超平面を表すことができますか?


11

Elements of Statistical Learningを読んでいます。12ページ(セクション2.3)では、線形モデルは次のように表記されています。

Y^=XTβ^

...ここで、は、予測子/独立変数/入力の列ベクトルの転置です。(これは、そうではない、このするであろう「全てのベクトルは列ベクトルであると仮定される」以前の状態X Tは、行ベクトルとβ列ベクトル?)XTXTβ^

は「1」が含まれており、対応する係数と乗算されて(定数)切片が与えられます。X1

それは続けて言う:

次元の入出力空間、X Yは超平面を表します。定数がXに含まれている場合、超平面は原点を含み、部分空間です。ない場合には、切断アフィン集合であるYは、点でγ軸 0 ^ β 0(p+1)(X, Y^)XY(0, β0^)

」、インターセプトの「予測因子の連結によって形成されるベクトル記述1」とYを?そして、なぜ「を含めない1における」X「確かにいることを、原点を通過するように超平面を強制1」を掛けたことがある^ β 0(X, Y^)1Y^1X1β0^

その本を理解できていない。リソースへのヘルプ/アドバイス/リンクは非常に高く評価されます。


4
最初にを検討すると役立つ場合があります。その場合にはY = β 0 + X ββ 0インターセプト。これは、通過する直線の方程式である0 β 0。高次元への拡張は即座に行われます。p=1y^=β^0+xβ^β0(0,β^0)
ocram 2013年

@ocramのヘルプだけでは不十分な場合は、ベクトルを書き出して乗算を試してください。
ピーターフロム-モニカの回復

2
これは素晴らしいグラフィカルなプレゼンテーションです:blog.stata.com/2011/03/03/…。表記は、あなたのXとxがあり、A異なっていますββ^
Dimitriy V.Masterov 2013年

2
間違っているか、少なくともそれは矛盾しています。明らかに、定数を含まない個の変数があります。このように設定{ X Y| X R pは }確かに超平面であるが、定数がされていることを言って間違っています「に含まX。」代わりに、定数が回帰に含まれていることを意味する本が、Xの一部と見なされるべきではないと思います。したがって、このモデルは、実際に書かれるべきY = β 0 +p{(X,Y^)|XRp}XX β β = β 1β 2... β P 'X = 0に設定すると、切片に関するアサーションがすぐに表示されます。Y^=β^0+Xβ^β=(β1,β2,,βp)X=0
whuber

1
我々は代わりに定数が含まれている場合(、我々はさせないことができ、Xは自由に上全ての変化のR P:これは内部に位置するように拘束されたp - 1。次元部分空間をグラフ{ X Y}は、その後、余次元を有しています少なくとも2つなので、実際には「超平面」ではありません。)XXRpp1{(X,Y^)}2
whuber

回答:


3

してみましょう観測の数であるK説明変数の数。NK

は実際には NX行列。単一の観測を見る場合にのみ、通常、各観測を x T i -1つの特定の観測スカラーの説明変数の行ベクトルに Kを掛けたものとして表しますN×KxiT列のベクトル β。さらに、 Y NK×1βYすべての観測値 Y nを保持する 1列のベクトル。N×1Yn

これで、2次元の超平面は、ベクトルXの one(!)列ベクトルの間に広がります。XNであることを覚えておいてくださいYXX行列。各説明変数は、行列 Xの正確に1つの列ベクトルで表されます。説明変数が1つしかなく、切片と Yがない場合、すべてのデータポイントは Y Xが張る2次元平面に沿って配置されます。N×KXYYX

重回帰の場合、と行列Xの間の超平面には合計でいくつの次元がありますか?回答:Xには説明変数のK列ベクトルがあるため、Kが必要です。YXKX次元超平面。K+1

通常、マトリックス設定では、勾配係数を適切に分析するために、回帰では不変である一定の切片が必要です。このトリックに対応するために、行列 1つの列が「1秒」のみで構成されるように強制します。この場合、推定β 1単独でスタンド代わりにランダム説明変数の各観察のための定数を掛け。係数β 1の、したがって期待値を表しYとすれば、X 1はiは値1で固定し、他の全ての変数はゼロで保持されます。したがって、KX1β1β1Yx1i次元超平面は、1つの次元だけ減少する K次元の部分空間、及び β 1つの「切片」に対応する K次元平面。K+1Kβ1K

yi=β1x1i+β2x2i+ui
Y=Xβ+uXN×2

<Y,X>

x11

yi=β1i+β2x2i+ui
X, Y<Y,X>β1x2i=0

<0,β1><0,0>β

(XX)β=Xy(XX)βXy=0X(yXβ)=0.
XyXβ=0

編集:2つ目の質問では、これは定数の再包含または除外を記述したのとまったく反対であることを認識しました。ただし、ここで解決策をすでに考案しており、その解決策が間違っている場合は修正します。

回帰の行列表現は最初はかなり混乱する可能性があることを知っていますが、最終的には、より複雑な代数を導出するときに大幅に簡略化されます。これが少し役に立てば幸いです。


1

私はそれを考える方法はその方程式を整理することだと思います:

Y^XTβ^=0

Y^
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.