あなたが仕事をしているとき、あなたが何をしているのかを認識していると、モデルに過剰適合したときの感覚を養います。一つには、モデルの調整されたR二乗の傾向または悪化を追跡できます。また、主要変数の回帰係数のp値の同様の劣化を追跡できます。
しかし、誰か他の人の研究を読んだだけで、自分の内部モデル開発プロセスに関する洞察力がない場合、モデルが過剰適合であるかどうかを明確に検出する方法はありません。
あなたが仕事をしているとき、あなたが何をしているのかを認識していると、モデルに過剰適合したときの感覚を養います。一つには、モデルの調整されたR二乗の傾向または悪化を追跡できます。また、主要変数の回帰係数のp値の同様の劣化を追跡できます。
しかし、誰か他の人の研究を読んだだけで、自分の内部モデル開発プロセスに関する洞察力がない場合、モデルが過剰適合であるかどうかを明確に検出する方法はありません。
回答:
自分でモデルを近似する場合、通常、近似プロセス中にAICやBICなどの情報基準を使用します。あるいは、最尤法に基づいたモデルの尤度比検定または最小二乗に基づいたモデルのF検定を使用します。
すべては、追加のパラメーターにペナルティを課すという点で概念的に類似しています。モデルに追加される新しいパラメーターごとに、「追加の説明力」のしきい値を設定します。それらはすべての形です正則化の。
他のモデルでは、メソッドセクションを見て、そのような手法が使用されているかどうかを確認し、パラメーターごとの観測数などの経験則も使用します-パラメーターごとに約5(またはそれ以下)の観測がある場合、私は疑問に思い始めます。
変数が重要であるためにモデル内で「有意」である必要はないことを常に覚えておいてください。私は交絡者である可能性があり、あなたの目標が他の変数の効果を推定することであるならば、それに基づいて含まれるべきです。
しますが、データを表示する前に、クラス内にいくつかの「理論的」モデルがあり、それらがより良いと予想される場合があります。