エラスティックネット回帰の交差検証:テストセットでの二乗誤差対相関


7

弾性ネット回帰を考慮glmnet損失関数の様パラメータ化n \ ll p (それぞれ44と3000)のデータセットがあり、繰り返し11分割交差検証を使用して、最適な正則化パラメーター\ alphaおよび\ lambdaを選択しています。通常、私はテストセットのパフォーマンスメトリックとして二乗誤差を使用します。たとえば、このR二乗のようなメトリック:L_ \ text {test} = 1- \ frac {\ lVert y_ \ text {test}-\ hat \ beta_0- X_ \ text {test} \ hat \ beta \ rVert ^ 2} {\ lVert y_ \ text {test}-\ hat \ beta_0 \ rVert ^ 2}、

L=12yβ0バツβ2+λαβ1+1αβ22/2
pαλ
Lテスト=1yテストβ^0バツテストβ^2yテストβ^02
しかし、今回は相関メトリックも使用しました(正則化されていないOLS回帰の場合、二乗誤差損失を最小化することは相関を最大化することと同等です):
Lテスト=コアyテストバツテストβ^

これらの2つのパフォーマンスメトリックが完全に同等ではないことは明らかですが、奇妙なことに、それらはかなり強く反対します。

エラスティックネットの相互検証

特に、小さなアルファ、たとえばα=.2(緑の線)で何が発生するかに注意してください。テストセットのR2が最大値と比較して大幅に低下すると、最大のテストセット相関が達成されます。一般に、与えられたα、相関は二乗誤差よりも大きい\ lambdaで最大化されるようλです。

なぜそれが起こり、それに対処するのですか?どの基準を優先すべきですか?誰かがこの影響に遭遇しましたか?


CVフォールドは各実験でまったく同じですか?
アレクセイバーナコフ2018

@AlexeyBurnakovはい。ループオーバー正則化パラメーターはループオーバーフォールド内にあります。
アメーバ2018

両方のグラフのモデルも同じである場合、計算に誤りがあるまで結果は意味をなさないと言えます。私はelasticnetを試しましたが、それらのパフォーマンスメトリックではしませんでした。
アレクセイバーナコフ2018

実際、CVを使用すると、損失メトリックはテストフォールドで平均化されます。この場合、R ^ 2は相関^ 2に正確に一致する必要はありませんか?たぶん、不一致は、どちらかの損失メトリックの値がCVテストフォールド全体で非常に不均一であることにありますか?たとえば、0.5、0.9、0.1、0.99、0.05、いずれの平均化によって、最終的には奇妙な図が他の図と完全に不一致になるのでしょうか。
アレクセイバーナコフ2018

1
@AlexeyBurnakovが何を意味しているかわからない。しかし、いずれにせよ、私が投稿したばかりの答えを見てください。
アメーバ2018

回答:


5

ここで何が起こっているのか理解できたと思います。

相関の値は長さに依存しないことに注意してください。したがって、テストのR二乗が低下する一方でテストの相関関係が増加し続ける場合は、が最適ではなく、スカラー係数によるスケールアップまたはスケールダウンが役立つ可能性があります。β^β^β^

これを実現した後、エラスティックネットだけでなく、なげなわでさえも係数を「過度に縮小」するという複数の主張が文献にあったことを思い出しました。投げ縄の場合、このバイアスを修正することを目的とした「リラックスした投げ縄」の手順があります。「二重投げ縄」または投げ縄を2回実行することの利点を参照してください。エラスティックネットの場合、元のZou&Hastie 2005の論文は実際に一定の係数で拡大することを提唱しました。 なぜglmnetはZou&Hastieの元の論文の「単純な」エラスティックネットを使用するのですか?。このようなスケーリングは相関の値を変更しませんが、R-2乗に影響を与えます。β^

Zou&Hastieヒューリスティックスケーリングを適用すると、次の結果が得られます。

β^=1+λ1αβ^

ここに画像の説明を入力してください

ここで、実線は私の質問の図と同じですが、左側のサブプロットの破線は再スケーリングされたベータを使用しています。これで、両方のメトリックがとほぼ同じ値によって最大化されます。αλ

マジック!


1
よくやった!微妙な...
マシュードゥルーリー2018
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.