タグ付けされた質問 「mini-batch-gradient-descent」

2
スライディングウィンドウは、LSTMでオーバーフィッティングにつながりますか?
スライディングウィンドウアプローチでLSTMをトレーニングする場合、LSTMをオーバーフィットしますか?なぜ人々はそれをLSTMに使用しないように見えるのですか? 簡単な例として、文字のシーケンスを予測する必要があると仮定します。 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 次のミニバッチを使用してLSTMをトレーニングし続けると、悪い(またはより良い)でしょうか。 A B C D E F G H I J K L M N, backprop, erase the cell B C D …
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.