DeepMindは、彼らのディープQネットワーク(DQN)が49のAtariゲームをプレイすることを学びながら、その動作を継続的に適応させることができたと述べています。
同じニューラルネットですべてのゲームを学習した後、エージェントはそれらをすべて「超人的」レベルで同時にプレイできましたか(ゲームの1つがランダムに提示された場合はいつでも)、切り替えたため、一度に1つのゲームだけが得意でした再学習が必要ですか?
「同じニューラルネットですべてのゲームを学習した後」。これは、同じNNアーキテクチャ、または同じアーキテクチャと単一の重みのセットを意味しますか?
—
Ankur 2016年
@Ankurは実際にはわかりません。同じアーキテクチャを使用していて、ゲーム間の重みをリセットしなかったのは私の(限られた)理解です。
—
Dion