弾性ネット回帰を考慮glmnet
損失関数の様パラメータ化n \ ll p (それぞれ44と3000)のデータセットがあり、繰り返し11分割交差検証を使用して、最適な正則化パラメーター\ alphaおよび\ lambdaを選択しています。通常、私はテストセットのパフォーマンスメトリックとして二乗誤差を使用します。たとえば、このR二乗のようなメトリック:L_ \ text {test} = 1- \ frac {\ lVert y_ \ text {test}-\ hat \ beta_0- X_ \ text {test} \ hat \ beta \ rVert ^ 2} {\ lVert y_ \ text {test}-\ hat \ beta_0 \ rVert ^ 2}、
これらの2つのパフォーマンスメトリックが完全に同等ではないことは明らかですが、奇妙なことに、それらはかなり強く反対します。
特に、小さなアルファ、たとえば(緑の線)で何が発生するかに注意してください。テストセットのが最大値と比較して大幅に低下すると、最大のテストセット相関が達成されます。一般に、与えられた、相関は二乗誤差よりも大きい\ lambdaで最大化されるようです。
なぜそれが起こり、それに対処するのですか?どの基準を優先すべきですか?誰かがこの影響に遭遇しましたか?