ML / DLフィールドの部外者。Tensorflowに基づくUdacity Deep Learningコースを開始しました。課題3の問題4を行います。次の設定で学習率を調整しようとしています:
- バッチサイズ128
- ステップ数:2エポックを満たすのに十分
- 隠しレイヤーのサイズ:1024、305、75
- 重みの初期化:標準で切り捨てられた通常。sqrt(2 / n)の偏差。nは前のレイヤーのサイズ
- ドロップアウト維持確率:0.75
- 正則化:適用されません
- 学習率アルゴリズム:指数関数的減衰
学習率パラメーターをいじくりまわした。ほとんどの場合、効果がないようです。ここにコード ; 結果:
Accuracy learning_rate decay_steps decay_rate staircase
93.7 .1 3000 .96 True
94.0 .3 3000 .86 False
94.0 .3 3000 .96 False
94.0 .3 3000 .96 True
94.0 .5 3000 .96 True
- 学習率を体系的に調整するにはどうすればよいですか?
- 学習率はステップ数とどのように関係していますか?