QQラインの信頼帯


14

この質問は特にに関係するものRではありませんがR、説明のために使用することにしました。

(通常の)qqラインの周りに信頼帯を生成するコードを考えます。

library(car)
library(MASS)
b0<-lm(deaths~.,data=road)
qqPlot(b0$resid,pch=16,line="robust")

私はこれらの信頼帯がどのように構築されるかの説明(または代替の紙/オンライン文書へのリンク)を探しています(RのヘルプファイルでFox 2002への参照を見ましたが、悲しいことに私はこれを持っていません便利な本)。

私の質問は例を使用してより正確になります。Rこれらの特定のCIの計算方法は次のとおりです(で使用するコードを短縮/簡略化しましたcar::qqPlot)。

x<-b0$resid
good<-!is.na(x)
ord<-order(x[good])
ord.x<-x[good][ord]
n<-length(ord.x)
P<-ppoints(n)
z<-qnorm(P)
plot(z,ord.x,type="n")
coef<-coef(rlm(ord.x~z))
a<-coef[1]
b<-coef[2]
abline(a,b,col="red",lwd=2)
conf<-0.95
zz<-qnorm(1-(1-conf)/2)
SE<-(b/dnorm(z))*sqrt(P*(1-P)/n)     #[WHY?]
fit.value<-a+b*z
upper<-fit.value+zz*SE
lower<-fit.value-zz*SE
lines(z,upper,lty=2,lwd=2,col="red")
lines(z,lower,lty=2,lwd=2,col="red")

問題は、これらのSEを計算するために使用される式の正当化とは何ですか(例:line SE<-(b/dnorm(z))*sqrt(P*(1-P)/n))。

FWIWこの式は、線形回帰で使用される通常の信頼帯の式とは大きく異なります


2
私はそれに関係する情報を期待順序統計量の分布 、特に漸近的な結果
fX(k)(x)=n!(k1)!(nk)![FX(x)]k1[1FX(x)]nkfX(x)
X(np)AN(F1(p),p(1p)n[f(F1(p))]2
Glen_b -Reinstate Monica 14

4
@Glen_bが正しい。ジョンフォックスは35〜36ページに次のように書いています。「順序統計の標準誤差はここで、はCDF対応する確率密度関数です。近似直線に沿った値は。したがって、近似線の周りの約95%の信頼度「エンベロープ」は。 " S EX I = σバツ PZ)、PZXI=μ+σZIXI±2×SEXI
SEバツ=σ^pzP1Pn
pzPzバツ^=μ^+σ^zバツ^±2×SEバツ
COOLSerdash 14

2
まだ残っているのは、COOLSerdashが与えた方程式のがで推定されることだけだと思います。fF1ppz/σ^
グレン_b-モニカの復活14

回答:


6

それに関係してい 順序統計量の分布 、特に漸近的な結果

fバツkバツ=nk1nk[Fバツバツ]k1[1Fバツバツ]nkfバツバツ
バツnpANF1pp1pn[fF1p]2

COOLSerdashがコメントで言及しているように、John Fox [1]は35〜36ページに次のように書いています。

順序統計の標準誤差はここで、はCDF対応する確率密度関数です。線に沿った値は、与えられます。したがって、近似線の約95%の信頼度「エンベロープ」は、です。バツ

SEバツ=σ^pzP1Pn
pzPzバツ^=μ^+σ^zバツ^±2×SEバツ

次に、がによって推定されることを認識する必要があります。fF1ppz/σ^

[1] Fox、J.(2008)、
Applied Regression Analysis and Generalized Linear Models、2nd Ed。
Sage Publications、Inc

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.