線形回帰におけるハット行列の重要性は何ですか?


9

回帰分析におけるハット行列の重要性は何ですか?H=X(XX)1X

計算を簡単にするためだけですか?


また、具体的に教えていただけますか?
スティーブS

@SteveS実際に私はなぜハットマトリックスが必要なのか知りたいですか?
ユーザー31466 14

なぜマトリックスに特別な名前/記号(つまり、「ハットマトリックス」、「H」)が必要なのか、または右側のマトリックス積の重要性についてさらに質問しているのですか。
スティーブS

回答:


14

線形回帰の研究では、基本的な開始点は、データ生成プロセス ここで、および確定的です。最小二乗基準を最小化した後、一方は推定を発見ためすなわち、。最初の式に推定器を接続すると、がデータ生成プロセスの線形モデルとして取得されます。これで、推定器に置き換えることができますy= XB + uuN(0,σ2I)XB^BB^=(XX)1Xyy^=XB^B^そして、y^=X(XX)1Xy.

したがって、は実際には射影行列です。すべての変数を想像してください。変数はベクトルであり、空間に広がります。したがって、あなたは、多重場合によって、あなたはあなたの中に観測値を投影し内の変数で張られる空間に。の推定値を与え、それがハットマトリックスと呼ばれる理由であり、それが非常に重要である理由です。結局のところ、線形回帰は単なる投影に過ぎず、投影行列では推定値を計算することしかできませんH=X(XX)1XXHyyXyyためのそれが本当に正常に分散されているかどうかの例チェックのためとすることができます。u

私はインターネット上でこの素晴らしい写真を見つけ、それがこの予測を視覚化しています。代わりにが使用されていることに注意してください。さらに、画像は、誤差項のベクトルが投影に直交しているため、推定値と相関していないことを強調していますβBy

ここに画像の説明を入力してください


5

ハットマトリックスは、いくつかの理由で非常に便利です。

  1. 代わりに、そのを取得します。ここで、はハット行列です。これにより、は観測値の線形マッピングであることがわかります。y^=Zβ^y^=PyPy^
  2. ハット行列から、残差を計算するのは簡単です。ことがわかります。Pϵ^ϵ^=yy^=yPy=(InP)y

0

これは、Ax = bの「最も近い」解を見つけることに他なりません。ここで、bはAの列空間にありません。bを列空間に投影し、Ax(hat)= pを解きます。ここで、pはbへの投影です。列スペース。


1
これはすべて、計算することなく実行できます。H
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.