生残差対標準化残差対スチューデント化残差-いつ使用するか


31

これは同様の質問のように見え、多くの回答を得られませんでした。

クックのDなどのテストを省略し、残差をグループとして見て、適合度を評価するときに他の人が残差を使用する方法に興味があります。生の残差を使用します:

  1. 正規性を評価するためのQQプロット
  2. 対残差の散布図で、(a)異分散性および(b)シリアル自己相関の眼球チェック用。y

と残差をプロットして、外れ値が発生する可能性のあるの値を調べるには、スチューデント化された残差を使用することを好みます。私の好みの理由は、標準化された残差は非常に類似した結果を提供しますが、どの値でどの残差が問題であるかを簡単に表示できることです。どの理論が使用されているかは、どの大学に行ったかに依存するというものです。y yyyy

これは、他の人が残差を使用する方法に似ていますか?他の人はこの数のグラフを要約統計と組み合わせて使用​​しますか?


3
スチューデント化された残差は、間違いなく外れ値の検出に優れており、多分、不均一分散検査では少し優れています。他の目的のために、どの残差を使用するかに違いはありません。
ttnphns

質問、ミシェルに注意を喚起したり、ステータスの変更(CWなど)を求めるには、質問の下にある「フラグ」リンクをたどってください。これにより、すべてのモデレーターに自動的に通知されます。質問、コメント、または返信へのリクエストの埋め込みは、モデレーター(または他の高返信ユーザー)が妥当な時間内に実際にそれを読むという希望に依存しているため、ヒット/ミスです!
whuber

@whuberああ、私はあなたの一人が最終的にそれを読むだろうと思いました。:)フラグの使用に関するヒントをありがとう。
ミシェル

1
こんにちは@ttnphns 特に、学生化は標準化よりも優れているのはなぜですか?(私はここで答えを本当に知りませんでした)
ピーターFlom-モニカの復職

4
@Peter、スチューデント化された残差は、OLSフィッティングアルゴリズムによる「歪み」が少なく、「エラー」の理論的概念に近いものです。適合線のさまざまな領域で直接比較することができるため、ポイントが外れ値である場合の判断がより優れています。
ttnphns

回答:


8

これは、用語の明確化というよりも、答えではありません。あなたの質問は、生の、標準化された、そしてスチューデント化された残差について尋ねます。ただし、これはほとんどの統計学者が使用している用語ではありませんが、クラスノートではそうであると述べています。

Raw:持っているものと同じです。

標準化:これは実際には、生の残差を残差の真の標準偏差で割ったものです。真の標準偏差はめったにわからないため、標準化された残差はほとんど使用されません。

内部的にスチューデント化:残差の真の標準偏差は通常知られていないため、代わりに推定標準偏差が使用されます。これは、スチューデント化された残差であり、標準化と呼ばれるものです。

外部スチューデント化:内部スチューデント化残差と同じですが、残差の標準偏差の推定値は、問題の観測値を除外した回帰から計算されます。

ピアソン:生の残差を残差ではなく、応答変数(y変数)の標準偏差で割ったもの。これはリストされていません。

「1つを省く」:正式な名前はありませんが、クラスのメモと同じです。

標準化された「1つを省く」:正式な名前もありませんが、これはクラスノートで学生化と呼ばれるものではありません。

ソース:

  1. スチューデント化残差についてあなたが持っているのと同じwikiリンク(「スチューデント化残差は、残差をその標準偏差の推定値で除算した結果の商」です)

  2. SASの残差計算に関するドキュメント


2
+1確かに、一部の統計学者はOPの質問の用語を使用しました(同じ単語を使用している他の統計学者と常に完全に一貫しているわけではありません)。あなたが使用する用語はより一般的になっていると思いますが、統計学者の間で比較的世界的に使用されていることを推測できる根拠は定かではありません。たとえば、論文は、平均的な統計学者が積極的に活動しないため、必ずしも役に立たないパブリッシング。あなたは正しいかもしれません-しかし、私たちはどのように知っていますか?[再度編集する場合、「標準化された」を末尾近くの「標準化された」に置き換えることができます。]
Glen_b -Reinstate Monica 14

2

再:プロット、

オーバーフィッティングなどがありますが、特に診断段階では、オーバープロットはあまり害を及ぼすことはありません。標準化された正規確率プロットは、QQプロットの隣を傷つけることはできません。分布の中央を評価する方が良いと思います。

再:残差、

標準化された残差と学生化された残差の両方をドラフト段階で実行し、通常は標準化された残差をコーディングします。他の人が実際に何を実行しているかはわかりません。診断は、私がオンラインで見つけた複製資料に実際にコード化されているからです。

再:診断、

vifhettestR2

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.