勾配降下法の最適な学習率を決定するにはどうすればよいですか?コスト関数が前の反復よりも大きな値を返す場合(アルゴリズムは収束しない)、自動的に調整できると考えていますが、実際にどのような新しい値をとるのかわかりません。
willamette.edu/~gorr/classes/cs449/momrate.htmlローカルレート適応の形式でアニーリングを試みます:µ(t)= µ(0)/(1 + t / T); エラーの符号が変化したときにtを増分します。
—
Chris