学生化では不明であるため、標準化の分散では既知であるため、推定されますか?ありがとうございました。
学生化では不明であるため、標準化の分散では既知であるため、推定されますか?ありがとうございました。
回答:
短い要約。モデルがである場合、は、および、ここでは「帽子行列」です。残差は 。母分散は不明であり、(平均二乗誤差)で推定できます。X N × P β = (X ' X )- 1 X '、Y 、Y = X β = X (X ' X )- 1 X '、Y = H 、Y H = X (X ' X ) - 1 X ' E = Y -
半学習残差はとして定義され が、残差の分散はと両方に依存するため、推定される分散は次のとおりです。 ここで、はハット行列の番目の対角要素です。 σ2XV(EI)=MSE(1-HII)HIII
内部的にスチューデント化された残差とも呼ばれる標準化された残差は次のとおりです
ただし、単一のとは独立していないため、分布をことはできません。手順は、番目の観測値を削除し、回帰関数を残りの観測値に適合させ、で表すことができる新しいを取得します。違い: は削除残差と呼ばれます。再計算を必要としない同等の式は次のとおりです 新しいとをで表し 、 M S Eは、rはiが tはiがN - 1 、Yを Y I (iは) dのiは = Y I - Y I (I )
Kutner et al。、Applied Linear Statistical Models、第10章を参照してください。
編集:rpierceによる答えは完璧だと言わなければなりません。OPは標準化され、スチューデント化された残差に関するものだと思っていました(そして、標準化された残差を得るために母集団標準偏差で割ることは、もちろん私には奇妙に見えました)が、私は間違っていました。OTであっても、私の答えが誰かを助けることを願っています。
社会科学では、通常、Studentizatedスコアは、サンプル分散/標準偏差()から母分散/標準偏差を推定するためにスチューデント/ゴセットの計算を使用すると言われています。対照的に、標準化されたスコア(名詞、特定のタイプの統計、Zスコア)は、母標準偏差?()を使用すると言われています。σ
ただし、フィールド間で用語の違いがあるようです(この回答に関するコメントをご覧ください)。したがって、これらの区別を行う際には注意して進める必要があります。さらに、スチューデント化されたスコアがそのようなものと呼ばれることはめったになく、通常、回帰のコンテキストで「学生化された」値が表示されます。@Sergioは彼の答えで、これらのタイプのスチューデント化された削除された残差に関する詳細を提供します。
私はこの質問に答えるのにとても遅れています!!。しかし、非常に単純な言語で答えを見つけることができなかったので、これに答える謙虚な試み。
標準化を行う理由 2つのモデルがあると想像してください。1つは統計の学習に費やした時間から狂気を予測し、もう1つは統計の時間でログ(クレイジー)を予測します。
残差が両方とも異なる単位にあることを理解するのは難しいでしょう。したがって、それらを標準化します(Zスコアと同様の理論)
標準化された残差:-残差が標準偏差の推定値で除算される場合。一般に、絶対値が3より大きい場合、それは懸念の原因です。
これを使用して、モデルの外れ値を調査します。
スチューデント化された残差:これを使用して、モデルの安定性を研究します。
プロセスは簡単です。モデルから個々のテストケースを削除し、新しい予測値を見つけます。新しい値と元の観測値の差は、標準誤差を分割することで標準化できます。この値はスチューデント化された残差です
Rを使用してより多くの情報の検出のための静- http://www.statisticshell.com/html/dsur.html