してみましょう観測の数であるK説明変数の数。NK
は実際には NX行列。単一の観測を見る場合にのみ、通常、各観測を x T i -1つの特定の観測スカラーの説明変数の行ベクトルに Kを掛けたものとして表しますN×KxTi列のベクトル β。さらに、 Yは NK×1βYすべての観測値 Y nを保持する 1列のベクトル。N×1Yn
これで、2次元の超平面は、ベクトルとXの one(!)列ベクトルの間に広がります。XはNであることを覚えておいてくださいYXX行列。各説明変数は、行列 Xの正確に1つの列ベクトルで表されます。説明変数が1つしかなく、切片と Yがない場合、すべてのデータポイントは Yと Xが張る2次元平面に沿って配置されます。N×KXYYX
重回帰の場合、と行列Xの間の超平面には合計でいくつの次元がありますか?回答:Xには説明変数のK列ベクトルがあるため、Kが必要です。YXKX次元超平面。K+1
通常、マトリックス設定では、勾配係数を適切に分析するために、回帰では不変である一定の切片が必要です。このトリックに対応するために、行列 1つの列が「1秒」のみで構成されるように強制します。この場合、推定β 1単独でスタンド代わりにランダム説明変数の各観察のための定数を掛け。係数β 1の、したがって期待値を表しYとすれば、X 1はiは値1で固定し、他の全ての変数はゼロで保持されます。したがって、KX1β1β1Yx1i次元超平面は、1つの次元だけ減少する K次元の部分空間、及び β 1つの「切片」に対応する K次元平面。K+1Kβ1K
yi=β1x1i+β2x2i+ui
Y=Xβ+uXN×2
<Y,X>
x11
yi=β1i+β2x2i+ui
X, Y<Y,X>β1x2i=0
<0,β1><0,0>β
(X′X)β=X′y⟹(X′X)β−X′y=0⟹X′(y−Xβ)=0.
Xy−Xβ=0
(編集:2つ目の質問では、これは定数の再包含または除外を記述したのとまったく反対であることを認識しました。ただし、ここで解決策をすでに考案しており、その解決策が間違っている場合は修正します。)
回帰の行列表現は最初はかなり混乱する可能性があることを知っていますが、最終的には、より複雑な代数を導出するときに大幅に簡略化されます。これが少し役に立てば幸いです。