一般化線形モデルの残差の予想される分布は何ですか?


12

一般的な線形モデルを実行しています。通常のモデルとは異なるファミリを指定する必要があります。

  • 残差の予想される分布は何ですか?
  • たとえば、残差は正常に分布する必要がありますか?

回答:


3
What is the expected distribution of residuals?

一般的に答えることが不可能になるように、モデルによって異なります。

For example, should the residuals be distributed normally?

一般的にはありません。


8

より対称的またはほぼ「通常の」(つまりガウス)なGLMの残差の設計を中心とするコテージ業界全体があります。たとえば、ピアソン残差、アンスコム残差、(調整済み)逸脱残差などです。たとえば、James Wの第6章を参照。Hardin and Joseph M. Hilbe(2007)「一般化線形モデルと拡張」第2版。テキサス州カレッジステーション:Stata Press。従属変数が離散的(インジケーター変数またはカウント)である場合、残差の予想分布を正確にガウス分布にすることは明らかに非常に困難です。

できることの1つは、モデルが真であるという仮定の下で新しいデータを繰り返しシミュレートし、そのシミュレートされたデータを使用してモデルを推定し、残差を計算し、実際の残差をシミュレートされた残差と比較することです。Stataでは、次のようにします。

sysuse nlsw88, clear
glm wage i.union grade c.ttl_exp##c.ttl_exp, link(log) family(poisson)

// collect which observations were used in estimation and the predicted mean
gen byte touse = e(sample)
predict double mu if touse

// predict residuals
predict resid if touse, anscombe

// prepare variables for plotting a cumulative distribution function
cumul resid, gen(c)

// collect the graph command in the local macro `graph'
local graph "twoway"

// create 19 simulations:
gen ysim = .
forvalues i = 1/19 {
    replace ysim = rpoisson(mu) if touse
    glm ysim i.union grade c.ttl_exp##c.ttl_exp, link(log) family(poisson)
    predict resid`i' if touse, anscombe
    cumul resid`i', gen(c`i')
    local graph "`graph' line c`i' resid`i', sort lpattern(solid) lcolor(gs8) ||"
}
local graph "`graph' line c resid, sort lpattern(solid) lcolor(black) "

// display the graph
`graph' legend(order(20 "actual residuals" 1 "simulations")) 

ここに画像の説明を入力してください


2
Rでは、cran.r-project.org / web / packages / DHARMa / index.htmlパッケージを使用してこれを行うことができます。
フロリアンハーティグ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.