回帰モデルが適合しすぎていることを検出する方法は?


14

あなたが仕事をしているとき、あなたが何をしているのかを認識していると、モデルに過剰適合したときの感覚を養います。一つには、モデルの調整されたR二乗の傾向または悪化を追跡できます。また、主要変数の回帰係数のp値の同様の劣化を追跡できます。

しかし、誰か他の人の研究を読んだだけで、自分の内部モデル開発プロセスに関する洞察力がない場合、モデルが過剰適合であるかどうかを明確に検出する方法はありません。


被験者にいくつかのアイデアを投げかけるために、研究で標準回帰統計が開示されている場合、係数のt統計値とp値に焦点を当てることができます。モデルのRSquareが高い場合; ただし、1つ以上の変数の統計値が2.0未満です。これは赤旗である可能性があります。また、いくつかの変数の係数の符号が、おそらく別の危険信号であるロジックを無視している場合。調査でモデルの保留期間が開示されていない場合は、別の危険信号である可能性があります。うまくいけば、他のより良いアイデアがあるでしょう。
Sympa

1つの方法は、モデルが他の(ただし類似の)データに対してどのように機能するかを確認することです。
シェーン

回答:


15

交差検証と正則化は、過剰適合を防ぐためのかなり一般的な手法です。クイックテイクについては、クロス検証ミラー)の使用に関するAndrew Mooreのチュートリアルスライドをお勧めします-警告に特に注意してください。詳細については、EOSLの第3章と第7章を必ず読んでください。この章では、トピックと関連事項について詳しく説明しています。


2
おかげで、Andrew Mooreの相互検証に関するチュートリアルは世界クラスです。
-Sympa

7

自分でモデルを近似する場合、通常、近似プロセス中にAICBICなどの情報基準を使用します。あるいは、最尤法に基づいたモデルの尤度比検定または最小二乗に基づいたモデルのF検定を使用します。

すべては、追加のパラメーターにペナルティを課すという点で概念的に類似しています。モデルに追加される新しいパラメーターごとに、「追加の説明力」のしきい値を設定します。それらはすべての形です正則化の

他のモデルでは、メソッドセクションを見て、そのような手法が使用されているかどうかを確認し、パラメーターごとの観測数などの経験則も使用します-パラメーターごとに約5(またはそれ以下)の観測がある場合、私は疑問に思い始めます。

変数が重要であるためにモデル内で「有意」である必要はないことを常に覚えておいてください。私は交絡者である可能性があり、あなたの目標が他の変数の効果を推定することであるならば、それに基づいて含まれるべきです。


AICおよびBICテストへのリンクをありがとう。変数を追加するためにモデルにペナルティを課すことで同様のことを行う調整されたRスクエアに対して、彼らは多くの価値を追加しますか?
-Sympa

1
@Gaeten、調整済みR-2乗は、モデルの前と後のF検定が有意である場合に増加するため、通常は調整済みR-2乗を計算してもp値が返されないことを除き、同等です。
チラコレオ

1
@Gaeten-AICおよびBICは、F検定よりも一般的であり、通常は最小二乗法で近似されたモデルに限定される調整済みR乗法です。AICとBICは、尤度を計算でき、自由度を知ることができる(または推定できる)モデルに使用できます。
チラコレオ

変数セットのテストは、正規化(収縮)の形式ではありません。また、テストは変数を削除する誘惑を与えますが、これは過剰適合の削減とは関係ありません。
フランクハレル

@FrankHarrellあなたのこの古いコメントについて詳しく説明してください。変数を削除するとオーバーフィットが減少し、他のすべての条件が同じになるのは、オーバーフィットに使用できる自由度が低下するためです。ここでいくつかのニュアンスが欠けていると確信しています。
Lepidopterist

5

BICmM

P(model m is true|one of the M models is true)wmexp(12BICm)j=1Mwjexp(12BICj)
=11+jmMwjwmexp(12(BICjBICm))

wjwj=1しますが、データを表示する前に、クラス内にいくつかの「理論的」モデルがあり、それらがより良いと予想される場合があります。

BICfinal<BICjpd

M1+p+(p1)++(pd+1)=1+p(p1)(pd)(pd1)2

M1+p+(p1)++(d+1)=1+p(p1)d(d1)2

MBICjλBICm=BICjλ

11+(M1)exp(λ2)

λMM

11+p(p1)d(d1)2exp(λ2)

p=50d=20λP0

λ>2log(2(1P0)P0[p(p1)d(d1)])

P0=0.9λ>18.28


+1、これは本当に賢いです。これはどこかで公開されていますか?これに関する「公式」参照はありますか?
GUNG -復活モニカ

@gung-どうもありがとう。残念ながら、これは「封筒の裏側」の回答でした。あなたがより詳細に調査した場合、私はそれに問題があると確信しています。
確率論的
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.