ISLの例の信頼区間法の比較
Tibshirani、James、Hastieによる書籍「Introduction to Statistical Learning」は、賃金データの多項式ロジスティック回帰次数4の信頼区間のページ267の例を示しています。本を引用する:
次数4の多項式でロジスティック回帰を使用して、バイナリイベントのをモデル化します。250,000ドルを超える賃金の適合した事後確率は、推定95%信頼区間とともに青色で表示されます。wage>250
以下は、このような間隔を構築する2つの方法の簡単な要約と、それらを最初から実装する方法に関するコメントです。
Wald /エンドポイント変換間隔
- 線形結合の信頼区間の上限と下限を計算します(Wald CIを使用)xTβ
- 単調変換をエンドポイントして、確率を取得します。F(xTβ)
ための単調変換であるX T βPr(xTβ)=F(xTβ)xTβ
[Pr(xTβ)L≤Pr(xTβ)≤Pr(xTβ)U]=[F(xTβ)L≤F(xTβ)≤F(xTβ)U]
具体的には、これはを計算し、結果にロジット変換を適用して下限と上限を取得することを意味します。βTx±z∗SE(βTx)
[exTβ−z∗SE(xTβ)1+exTβ−z∗SE(xTβ),exTβ+z∗SE(xTβ)1+exTβ+z∗SE(xTβ),]
標準誤差の計算
Maximum Likelihood理論は、の近似分散が回帰係数の共分散行列を使用して計算できることを示しています。ΣxTβΣ
Var(xTβ)=xTΣx
設計行列と行列を次のように定義しますXV
X = ⎡⎣⎢⎢⎢⎢⎢11⋮1x1,1x2,1⋮xn,1……⋱…x1,px2,p⋮xn,p⎤⎦⎥⎥⎥⎥⎥ V = ⎡⎣⎢⎢⎢⎢⎢π^1(1−π^1)0⋮00π^2(1−π^2)⋮0……⋱…00⋮π^n(1−π^n)⎤⎦⎥⎥⎥⎥⎥
ここで、は番目の観測の番目の変数の値であり、 は観測予測確率を表します。xi,jjiπ^ii
共分散行列は次のようになります: および標準誤差はΣ=(XTVX)−1SE(xTβ)=Var(xTβ)−−−−−−−−√
予測確率の95%信頼区間は、次のようにプロットできます。
デルタ法の信頼区間
アプローチは、関数線形近似の分散を計算し、これを使用して大きなサンプル信頼区間を構築することです。F
Var[F(xTβ^)]≈∇FT Σ ∇F
ここで、は勾配で、は推定共分散行列です。1つの次元で次のことに注意してください。 ∇Σ
∂F(xβ)∂β=∂F(xβ)∂xβ∂xβ∂β=xf(xβ)
ここで、はの導関数です。これは多変量の場合に一般化されますfF
Var[F(xTβ^)]≈fT xT Σ x f
私たちの場合、Fはロジスティック関数(を表します)で、その導関数はπ(xTβ)
π′(xTβ)=π(xTβ)(1−π(xTβ))
これで、上記で計算した分散を使用して信頼区間を構築できます。
C.I.=[Pr(xβ^)−z∗Var[π(xβ^)]−−−−−−−−−√≤Pr(xβ^)+z∗Var[π(xβ^)]−−−−−−−−−√]
多変量の場合のベクトル形式
C.I.=[π(xTβ^)±z∗(π(xTβ^)(1−π(xTβ^)))TxT Var[β^] x π(xTβ^)(1−π(xTβ^))]−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−√
- は単一のデータポイント、つまり設計行列単一行を表すことに注意してください。xRp+1X
オープンエンドの結論
確率と負の対数オッズの両方の正規QQプロットを見ると、どちらも正規分布していないことがわかります。これで違いを説明できますか?
ソース: