LASSO回帰についての私の理解は、最小化問題を解決するために回帰係数が選択されることです。
実際には、これはラグランジュ乗数を使用して行われ、問題を解決します
とtの関係は何ですか?ウィキペディアは、それが「データに依存する」と単純に述べているが役に立たない。
なぜ気にするのですか?まずは知的好奇心。しかし、交差検証によって\ lambdaを選択した場合の結果についても心配しています。
具体的には、n分割交差検証を行っている場合、トレーニングデータのn個の異なるパーティションにn個の異なるモデルを適合させます。次に、指定された\ lambdaの未使用データの各モデルの精度を比較します。ただし、同じ\ lambdaは、データの異なるサブセットに対して異なる制約()を意味します(つまり、は「データ依存」です)。
最良のバイアス精度のトレードオフを与えるtを見つけるために本当に解決したい相互検証問題ではないですか?
実際にこの効果のサイズの大まかなアイデアを得るには、各交差分割とに対してを計算し、結果の分布を確認します。場合によっては、暗黙の制約()が交差検証サブセット全体で大幅に変化することがあります。ここで実質的に私は変動係数を意味し。
5
説明されていない反対投票を取り消すための賛成投票。質問は私の専門知識の外ですが、それは合理的に定式化されているようです。
—
mkt-モニカを2017年