なげなわ回帰の時間の複雑さは何ですか?


14

行または列の数が増えるにつれて、なげなわ回帰の漸近的な時間の複雑さは何ですか?

回答:


4

lassoはl1正則化を持つ線形モデルであることを思い出してください。

パラメーターの検索は、パラメーターが次のように与えられる、制約のない最適化問題として定式化できます。

argminβ||yXβ||2+α||β||1

制約された定式化では、パラメータは

argminβ||yXβ||2s.t.||β||1<α

これは二次計画問題であり、したがって多項式です。

ほとんどすべての凸最適化ルーチンは、ニューラルネットワークのような柔軟な非線形のものであっても、ターゲットwrtパラメーターの導関数の計算に依存しています。ただし、微分を取ることはできません。そのため、さまざまな手法に依存しています。パラメータを見つけるには多くの方法があります。これは、L1-Norm Regularizationを使用した最小二乗最適化に関するテーマのレビューペーパーです。反復凸最適化の時間複雑性は、収束基準に依存するため、分析するのが少し難しくなります。一般に、反復問題は、観測値が増加するにつれて、より少ないエポックで収束します。α||w||1


4
いくつかのこと:問題が「多項式」であると言うことは、おそらく何らかの組み合わせの問題(通常は指数関数的)を見ているのでない限り、特に役に立ちません。第二に、導関数の計算はほとんど常に制限ステップではありません。第三に、通常、反復アルゴリズムの時間の複雑さを議論するとき、通常はステップごとのコストを見るため、収束基準に依存しませ。最後に、通常、より多くの観測=より少ない反復回数ではありません。
クリフAB

13

@JacobMickはより広範な概要とレビューペーパーへのリンクを提供しますが、「ショートカットアンサー」(彼のアンサーの特別なケースと考えられる)を提供させてください。

候補変数(特徴、列)の数を、サンプルサイズ(観測の数、行)をnとします。LARSアルゴリズムを使用して実装されたLASSOを検討してください(Efron et al。、2004)。LASSOの計算の複雑さはOK 3 + K 2 n 同上です。KnO(K3+K2n)

  • 以下のためにK 3 < K 2 N及びLASSOの計算の複雑さOK 2 N との回帰と同じである、K個の変数(エフロンら、2004、頁443から444まで;また、シュミット、2005、セクション2.4 引用されています; 回帰の計算の複雑さについては、この投稿を参照してください)。K<nK3<K2nO(K2n)K
  • 以下のためにK 3K 2 N及びLASSOの計算の複雑さはOK 3エフロンら、2004)。KnK3K2nO(K3)

参照:


リチャード、stats.stackexchange.com / questions / 280304 /…で GLMアプローチの反復の複雑さについてコメントできますか?
rnoodle

@moodle、それを深く掘り下げることなく(現時点では時間がありません)、質問に対して+1することはできません。
リチャードハーディ

私は見ていたが、それは明確ではない-それに目をもう1組取得するのは良いことだ。そのため、反復の複雑さと完全な収束の複雑さがあり、文献については定義を曖昧にすることがあります。基本的に、非常に重要な位置で投げ縄ソルバーを使用するアルゴリズムがあるため、アルゴリズムの複雑さはソルバーに強く依存します。これを釘付けにすると良いでしょう。乾杯!ご意見をお
寄せ

@rnoodle、私はすぐそこにあなたを助けることができることを強く疑いますが、賞金は確かによりよく知っている他の人々を引き付けるかもしれません。幸運を!
リチャードハーディ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.