新しい蒸留ジャーナルからの投稿、Why Momentum Really Worksを読んでいます。混乱を招く部分に至る主要な方程式を言い換えますが、この投稿では直感について詳しく説明しています。
勾配降下アルゴリズムは、次の反復プロセスによって与えられます
運動量を伴う勾配降下は、降下に「記憶」を追加することによって与えられます。これは、2つの方程式で表されます。
次のセクション「最初のステップ:勾配降下」では、著者は凸2次関数を検討します。
勾配降下法を使用する場合、次の方法でこの最適解に向かって反復します
次に、記事はさらに続けます。 「私はこれが理にかなっていると思いますが、私の直感はちょっとあいまいです。
すべての対称行列 固有値分解があります
どこ そして 対応する固有ベクトルを列として持つベクトルです(右?)。
この次の部分は私が何が起こっているのか理解できないところです:
根拠の変更を行うと、 、反復はバラバラになり、次のようになります。
元の空間に戻る 、私たちはそれを見ることができます
ここで何が起こっているのですか?撮る動機はどこですか固有ドメインに?とは?なぜベクターの個々の要素を見るのですか?私は計算を追跡しようとしましたが、 に依存する 依存する 、私たちはそれを排除しようとしていたと思いました。私の質問は、誰かがいくつかの直感と計算でこれらのいくつかのステップを拡張できるかどうかです。ありがとう。