私がこれを尋ねる理由は、内部で学習した残差が生の推定残差と同じパターンを持っているように見えるためです。誰かが説明してくれるといいですね。
私がこれを尋ねる理由は、内部で学習した残差が生の推定残差と同じパターンを持っているように見えるためです。誰かが説明してくれるといいですね。
回答:
想定回帰モデルデザイン行列とX(1つのあなたの予測子続いてカラム)、予測Y = X(X ' X )- 1 X ' 、Y = H 、Y(Hです「HAT-マトリクス」)、及び残差E = Y - Y。回帰モデルは、真のエラーϵがすべて同じ分散(ホモスケダシティ)であると想定しています。
どのタイプのデータをテストプロットに使用しましたか?すべての仮定が成り立つ(または近づく)場合、生の残差とスチューデント化された残差の違いはあまり期待できません。主な利点は、影響力の大きいポイントがある場合です。正の線形傾向と非常に影響力の大きい外れ値を持つこの(シミュレーションされた)データを考えます。
これは、フィッティングされた値と生の残差のプロットです。
影響力のあるポイントの残差の値が、残りのポイントからの最小および最大残差よりも0に近いことに注意してください(3つの最も極端な未処理残差にはありません)。
これが、標準化された(内部で学生化された)残差のあるプロットです。
このプロットでは、その影響が考慮されているため、標準化された残差が際立っています。