座標降下は一度に1つのパラメーターを更新しますが、勾配降下はすべてのパラメーターを一度に更新しようとします。
あるアルゴリズムが他のアルゴリズムよりも優れている場合を正確に指定するのは困難です。たとえば、私は座標降下がLASSOの最新技術であることを知って非常にショックを受けました。そして、私だけではありませんでした。スライド17を参照してください。
そうは言っても、降下を調整するために問題をより修正しやすい機能がいくつかあります。
(1)高速の条件付き更新。何らかの理由で問題が原因でパラメータを個別に非常に迅速に最適化できる場合、座標降下によりこれを利用できます。たとえば、データのサブセットのみを使用して特定のパラメーターを更新でき、これらの更新の計算コストを大幅に削減できます。別のケースは、他のすべてのパラメーターの値を条件として、個々のパラメーターに閉じた形式のソリューションがある場合です。
(2)パラメーターの比較的独立したモード。1つのパラメーターの最適値が他のパラメーター値から完全に独立している場合、1ラウンドの座標降下により解が導き出されます(各座標更新が現在のモードを検出すると仮定)。一方、特定のパラメーターのモードが他のパラメーター値に非常に大きく依存している場合、座標降下はインチごとに非常に小さく、各ラウンドで非常に小さな更新が行われます。
残念ながら、ほとんどの問題では、(2)は成り立たないため、座標降下法が代替アルゴリズムと比較してうまく機能することはまれです。LASSOでうまく機能する理由は、条件を制定するために使用できるトリックがたくさんあるからだと思います(1)。
α