ロジスティック回帰モデルの評価


13

この質問は、ロジスティックモデルで十分かどうかを判断する方法に関する実際の混乱から生じています。従属変数として形成されてから2年後に、個々のプロジェクトのペアの状態を使用するモデルがあります。結果は成功(1)または失敗(0)です。ペアの形成時に測定された独立変数があります。私の目的は、私が仮定した変数がペアの成功に影響を与えるかどうかをテストし、その成功に影響を与え、他の潜在的な影響を制御することです。モデルでは、対象の変数は重要です。

モデルはのglm()関数を使用して推定されましたR。モデルの品質を評価するために、私はいくつかのことを行っている:glm()あなたは与えresidual devianceAICそしてBICデフォルトで。さらに、モデルのエラー率を計算し、ビン化された残差をプロットしました。

  • 完全なモデルは、私が推定した(および完全なモデルにネストされている)他のモデルよりも小さい残差、AICおよびBICを持っているため、このモデルは他のモデルよりも「優れている」と思います。
  • モデルのエラー率はかなり低く、IMHO(Gelman and Hill、2007、pp.99のように:、
    error.rate <- mean((predicted>0.5 & y==0) | (predicted<0.5 & y==1)約20%です。

ここまでは順調ですね。しかし、ビン化された残差をプロットすると(再びGelman and Hillのアドバイスに従って)、ビンの大部分が95%CIの範囲外になります。 ビン化残差プロット

このプロットは、モデルにまったく問題があると思うように導きます。それはモデルを捨てることに私を導くべきですか?モデルが不完全であることを認める必要がありますが、それを維持し、対象変数の効果を解釈する必要がありますか?ビン化された残差プロットを実際に改善することなく、変数を順番に除外し、変換も試行錯誤しました。

編集:

  • 現時点では、モデルには多数の予測子と5つの相互作用効果があります。
  • これらのペアは、すべてが短時間で形成されるという意味で(ただし、厳密に言えば、すべて同時にではない)という意味で互いに「比較的」独立しており、多数のプロジェクト(13k)と多数の個人(19k )そのため、かなりの割合のプロジェクトには1人の個人しか参加していません(約20000ペアあります)。

2
Y

1
あなたの言うことを基にすると、サンプルサイズは問題ではないようです。なぜなら、私には約2000万ペア(うち約20%が成功している)があるからです。
アントワーヌヴェルネ

回答:


11

分類精度(エラー率)は不適切なスコアリングルール(偽のモデルで最適化)であり、任意で、不連続で、操作が簡単です。このコンテキストでは必要ありません。

予測子がいくつあるかは述べませんでした。モデルの適合度を評価する代わりに、単にモデルを適合させたいと思います。妥協アプローチは、相互作用は重要ではないと想定し、回帰スプラインを使用して連続予測変数を非線形にすることです。推定された関係をプロットします。rmsR のパッケージは、これらすべてを比較的簡単にします。詳細については、http://biostat.mc.vanderbilt.edu/rmsを参照してください。

「ペア」と、観測が独立しているかどうかについて詳しく説明します。


私が正しく理解している場合、あなたのアドバイスは、残差のプロットに集中し、他のものを行う前にこれをまっすぐにすることです、最終的に回帰スプラインを使用して、正しいですか?質問を編集して、予測変数の数と、ペアが「比較的」独立していることを示しました。
アントワーヌヴェルネ

こんにちは@フランク。分類精度が悪い方法だと言うのはなぜですか?それは、ここで、モデルが派生したのと同じデータで評価されるからですか?
ピーターフロム-モニカを回復

2
χ2c

2
いいえ、制限付き3次スプライン(自然スプライン)を使用して連続予測子を複数の項に展開することにより、対数オッズスケールで連続的に予測子を非線形に操作できるようにします。次に、推定された変換をプロットして、各予測子の部分効果について学習します。
フランクハレル

1
入力をありがとう、それは本当に役に立ちました。データを詳しく調べてみると、共線性の問題があることに気付きました(たとえ高いペアワイズ相関がなくても)。
アントワーヌ・ヴェルネ

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.