RがQQプロットの理論的な変位値に対して標準化された残差をプロットするのはなぜですか?


9

Rで、デフォルトの設定でqqplot(linear model)Y軸の標準化残差を使用するのはなぜですか?Rが「通常の」残差を使用しないのはなぜですか?

回答:


13

標準化された残差を使用する場合、残差の期待値はゼロであり、分散は(およそ)1です。これには2つの利点があります。

  1. 変数の1つを再スケールした場合(たとえば、キロメートルをマイルに変更した場合)、残差プロットは変更されません。
  2. qqplotでは、残差は直線上にある必要があります y = x
  3. 残差の95%が-1.96から1.96の間にあると予想します。これにより、外れ値を見つけやすくなります。

参考までに、95%が-1.96; 1.96の間にあることを教えてください。つまり、標準化された残差を必要があるのはなぜですか。diN(0,1)
MarkDollar、2011

@Mark:「標準化された残差」をググって最初のいくつかのヒットを見てください。
csgillespie 2011

4

線形モデルの理論上の残差は、独立して等しく正規分布しています。ただし、観測された残差は独立しておらず、分散は等しくありません。したがって、残差を標準化すると、その残差に関連する推定標準偏差で除算され、それらの分散がより等しくなります(これを計算するためにハットマトリックスからの情報を使用します)。これは、qqplotで確認するより意味のある残差です。

また、実際にフィットモデルでqqplotを実行していますか?それとも、モデルでプロットを実行することからのqqplotですか?


1
おい!plot(> lm <)を実行してqqplotについて話しています。ご回答有難うございます。彼の答えが速かったので、私はcsにマークを付けたいと思います。よろしくお願いします:)
MarkDollar
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.