より良い私の質問をするために、私は16変数モデル(両方からの出力のいくつか提供しているfit
)と17変数モデル(fit2
下記)を(これらのモデル内のすべての予測変数は、これらのモデル間の唯一の違いはそれがどこにあるか、連続してfit
いません変数17(var17)を含む):
fit Model Likelihood Discrimination Rank Discrim.
Ratio Test Indexes Indexes
Obs 102849 LR chi2 13602.84 R2 0.173 C 0.703
0 69833 d.f. 17 g 1.150 Dxy 0.407
1 33016 Pr(> chi2) <0.0001 gr 3.160 gamma 0.416
max |deriv| 3e-05 gp 0.180 tau-a 0.177
Brier 0.190
fit2 Model Likelihood Discrimination Rank Discrim.
Ratio Test Indexes Indexes
Obs 102849 LR chi2 13639.70 R2 0.174 C 0.703
0 69833 d.f. 18 g 1.154 Dxy 0.407
1 33016 Pr(> chi2) <0.0001 gr 3.170 gamma 0.412
max |deriv| 3e-05 gp 0.180 tau-a 0.177
Brier 0.190
rms
これらのlrm
モデルの作成には、フランクハレルのパッケージを使用しました。ご覧のように、これらのモデルは、識別インデックスとランクディスクリクル全体で、たとえあったとしても、それほど変化していないようです。インデックス ; ただし、を使用lrtest(fit,fit2)
すると、次の結果が得られました。
L.R. Chisq d.f. P
3.685374e+01 1.000000e+00 1.273315e-09
そのため、この尤度比検定の帰無仮説を棄却します。ただし、これはサンプルサイズが大きい(n = 102849)ためと考えられます。これらのモデルは同様の方法で実行されているように見えるためです。さらに、nが大きい場合にネストされたバイナリロジスティック回帰モデルを正式に比較するより良い方法を見つけることに興味があります。
これらのタイプのネストされたモデルを比較するという観点から、私を正しい方向に導くことができるフィードバック、Rスクリプト、またはドキュメントに非常に感謝します!ありがとう!
fit2
17変数モデルと記載されていますが、を省略したモデルでもありV17
ます。これを編集したいかもしれません。
fit2
しfit
ました。ありがとう!