残差は根本的な障害とどのように関連していますか?


9

最小二乗法では、モデルの未知のパラメーターを推定します。

Yj=α+βxj+εj(j=1...n)

(いくつかの観測値について)それを実行すると、近似回帰直線が得られます。

Yj=α^+β^x+ej(j=1,...n)

ここで明らかに、いくつかのプロットをチェックして、仮定が満たされていることを確認します。等分散性をチェックしたいとしますが、これを行うには、実際には残差チェックしています。残差対予測値のプロットを調べて、不等分散性が明らかであることがわかった場合、それが外乱項とどのように関係しているのでしょうか。残差の異分散性は、外乱条件の異分散性を意味しますか? ε Jejεj

回答:


3

これについて考える最も簡単な方法は、生の残差()が対応する外乱の推定値()であることです。ただし、さらに複雑さがいくつかあります。たとえば、標準のOLSモデルでは、誤差/外乱は独立していると想定していますが、残差はすべて独立しているわけではありません。一般に、平均モデルの推定に自由度を使用しており、残差は合計がになるように制約されているため、独立できるのは残差のみですε J = EのJ N - P - 1 、P - 1 0ej=yjy^jε^j=ejNp1p10。さらに、生の残差の標準偏差は実際には一定ではありません。一般に、回帰直線は、平均してレバレッジの高いポイントに近づくように調整されます。その結果、それらのポイントの残差の標準偏差は、レバレッジの低いポイントの標準偏差よりも小さくなります。(これについての詳細は、ここで回答を読むと役立つ場合があります:plot.lm()の解釈、および/またはここ:線形回帰でバイナリ/二分独立予測子の残差分析を実行する方法?


3
明確にするために、多くてもNp-1残差は独立していてもかまいませんが、通常はすべて相関しています。代わりに、Np-1個の独立したコンポーネントを持つことができるそれらの線形変換があります。
Glen_b-モニカを復活させる14

@Glen_b、良い点。
ガン-モニカを元に戻す

8

関係と。 εε^ε

ε^=(IH)ε

ここで、ハット行列であるはです。HX(XTX)1XT

つまり、はすべてのエラーの線形結合ですが、通常、重みのほとんどは番目のものに該当します。ε^ii

carsR のデータセットを使用した例を次に示します。紫色でマークされた点を考えます。

ここに画像の説明を入力してください

それをポイントと呼びましょう。残差、。ここで、他のエラーのは-0.02の範囲にあります。iε^i0.98εi+jiwjεjwj

ここに画像の説明を入力してください

これを次のように書き直すことができます。

ε^i0.98εi+ηi

より一般的に

ε^i=(1hii)εi+ηi

ここで、は番目の対角要素です。同様に、上記のはです。 i H w j h i jhiiiHwjhij

エラーがiid場合、この例では、他のエラーの加重和は、その残差に対する番目の観測値のエラーの影響の約1/7に対応する標準偏差になります。。IN(0,σ2)i

つまり、行儀の良い回帰では、残差はほとんど、観測できないエラー項の適度にノイズの多い推定のように扱うことができます。中心から離れた点を考えると、物事はいくらかうまく機能しません(残差はエラーへの重み付けが少なくなり、他のエラーの重みは均等になります)。

多くのパラメーターがある場合、またはがあまりうまく分布していない場合、残差はエラーのように少なくなります。いくつかの例を試してみてください。X


2
これが正しいアプローチです。さらに必要なのは、の対角要素は通常「小さい」という引数です。これは、トレースが独立変数の数(存在する場合は切片を含む)に等しいことを示すことによって作成されます。これは、射影行列であるという事実から直接です。この結果は、個々の分布の仮定とは無関係であることに注意してください。これらは正規である必要はありません。また、実際のには依存しません。次元数の結果です。ε IHεiH
whuber

観測値の数が小さい場合、残差がエラーのようにはるかに少なくなる別の状況ではないでしょうか?通常、@ whuberがのトレースが独立変数の数と等しいという事実を述べているように、対角要素が小さいことを意味しますが、これらの要素の数自体が小さい場合、これは必ずしもそうではありません。H nnHn
アダムベイリー

@AdamBailey確かにそれが起こる小さいです...しかしのでそれはだあれば比較的大きくさえあるわずか1または2であるp / n pnp/np
Glen_b -Reinstateモニカ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.