ディープニューラルネットワークでドロップアウトを実装する方法を探しています。直感に反するものが見つかりました。フォワードフェーズでは、1と0のランダムテンソルを使用してマスクをアクティブ化し、ネットに重みの平均を学習させます。これは、ネットをより一般化するのに役立ちます。ただし、勾配降下の更新フェーズでは、アクティブ化はマスクされません。これは私には直観に反するようです。dropoutを使用して接続のアクティブ化をマスクする場合、勾配降下フェーズをマスクしないのはなぜですか?
ウェイトをマスクするために使用されるドロップアウトを示す参照をどこで見つけたのかわかりませんか?それは間違いだと思います。
—
Neil Slater
そうですね、私は間違ったコンセプトを使用しました。
—
emanuele 2015