回答:
What is the expected distribution of residuals?
一般的に答えることが不可能になるように、モデルによって異なります。
For example, should the residuals be distributed normally?
一般的にはありません。
より対称的またはほぼ「通常の」(つまりガウス)なGLMの残差の設計を中心とするコテージ業界全体があります。たとえば、ピアソン残差、アンスコム残差、(調整済み)逸脱残差などです。たとえば、James Wの第6章を参照。Hardin and Joseph M. Hilbe(2007)「一般化線形モデルと拡張」第2版。テキサス州カレッジステーション:Stata Press。従属変数が離散的(インジケーター変数またはカウント)である場合、残差の予想分布を正確にガウス分布にすることは明らかに非常に困難です。
できることの1つは、モデルが真であるという仮定の下で新しいデータを繰り返しシミュレートし、そのシミュレートされたデータを使用してモデルを推定し、残差を計算し、実際の残差をシミュレートされた残差と比較することです。Stataでは、次のようにします。
sysuse nlsw88, clear
glm wage i.union grade c.ttl_exp##c.ttl_exp, link(log) family(poisson)
// collect which observations were used in estimation and the predicted mean
gen byte touse = e(sample)
predict double mu if touse
// predict residuals
predict resid if touse, anscombe
// prepare variables for plotting a cumulative distribution function
cumul resid, gen(c)
// collect the graph command in the local macro `graph'
local graph "twoway"
// create 19 simulations:
gen ysim = .
forvalues i = 1/19 {
replace ysim = rpoisson(mu) if touse
glm ysim i.union grade c.ttl_exp##c.ttl_exp, link(log) family(poisson)
predict resid`i' if touse, anscombe
cumul resid`i', gen(c`i')
local graph "`graph' line c`i' resid`i', sort lpattern(solid) lcolor(gs8) ||"
}
local graph "`graph' line c resid, sort lpattern(solid) lcolor(black) "
// display the graph
`graph' legend(order(20 "actual residuals" 1 "simulations"))