LSTM状態を初期化する最良の方法


10

LSTMの状態を初期化する最良の方法は何だろうと思っていました。現在、私はそれをすべてゼロに初期化しています。それを初期化する方法についてオンラインで本当に何も見つけることができません。私が考えていることの1つは、初期状態をトレーニング可能なパラメーターにすることです。何かアドバイス?


どこかに紙があり、それが何であったかを思い出せません。彼らは初期状態を訓練し、より良い結果を得ました。それ以外の場合は、すべて0が最良の選択肢であると思います
Frobot

回答:


8

通常、初期状態をゼロに設定しますが、ネットワークはその初期状態に適応することを学習します。

次の記事では、最初の隠された状態を学習したり、ランダムノイズを使用することを提案しています。

基本的に、データに多数の短いシーケンスが含まれている場合、初期状態をトレーニングすることで学習を加速できます。

または、データに少数の長いシーケンスが含まれている場合、初期状態を効果的にトレーニングするのに十分なデータがない可能性があります。その場合、ノイズの多い初期状態を使用すると、学習を加速できます。彼らが言及しない考えは、ノイズジェネレータの平均と標準を学ぶことです。

この記事では、初期状態を学習することを選択した場合、ノイズを追加してもほとんどメリットがないと述べています。


リンクの代わりに完全な参照を追加してください
Antoine

3
参照はどのように見えるべきですか?
jpeg729
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.