'glm'を使用してロジスティック回帰モデルの精度を見つける1つの方法は、AUCプロットを見つけることです。連続応答変数(ファミリー= 'ガウス')で見つかった回帰モデルについて同じことを確認するにはどうすればよいですか?
回帰モデルがデータにどの程度適合しているかを確認するためにどのような方法が使用されていますか?
'glm'を使用してロジスティック回帰モデルの精度を見つける1つの方法は、AUCプロットを見つけることです。連続応答変数(ファミリー= 'ガウス')で見つかった回帰モデルについて同じことを確認するにはどうすればよいですか?
回帰モデルがデータにどの程度適合しているかを確認するためにどのような方法が使用されていますか?
回答:
まず、「線形回帰モデル診断」について簡単に検索することをお勧めします。しかし、ここに私があなたに確認することを勧めるいくつかがあります:
想定が十分に満たされていることを確認します
scatterplotまたは成分と残差プロットを使用して、独立予測子と従属変数間の線形関係を調べます。
予測値に対して標準化された残差でプロットを作成し、非常に高い残差で極値が存在しないことを確認します。残差の広がりは、予測値に沿ってほぼ同様であり、残差の平均の上下にほぼ等しく広がります。ゼロ。
y軸を残差変更することもできます。このプロットは、不等分散を識別するのに役立ちます。
研究デザインを再検討して、独立性の仮定が妥当であることを確認します。
分散インフレ係数(VIF)または許容統計を取得して、共線性の可能性を調べます。
潜在的な影響力のあるポイントを調査する
と調整済み統計の変化を調べるR 2
必要なやり取りを確認する
モデルを別のデータセットに適用し、そのパフォーマンスを確認する
plot.lm
Penguin_Knightが言及する診断プロットのほとんどを提供できます。
を使用して、モデルがトレーニングデータにどれだけ適合するかを調べることができます。これにより、データの分散の何パーセントがモデルによって説明されるかがわかります。
実際の値と比較した場合、テストセットでの予測のRMSE(二乗平均平方根誤差)を使用することをお勧めします。これは、連続変数の予測誤差を報告する標準的な方法です。
ノンパラメトリック(たとえば、カーネル回帰)またはセミパラメトリック推定をプロットし、それをパラメトリック近似曲線と比較することにより、パラメーター推定器の関数形式をチェックするのに慣れています。多くの場合、これは相互作用項や高次の項を含めるよりも速く(そしておそらくより洞察に富む)最初のステップであると思います。
Rパッケージnpは、多くの優れたノンパラメトリックおよびセミパラメトリック関数を提供し、そのVignetteは適切に記述されています。http: //cran.r-project.org/web/packages/np/vignettes/np.pdf
r-squared
、タグやgoodness-of-fit
..タグを