論文はこちらです。
ロールアウトポリシー...は、高速でインクリメンタルに計算されたローカルパターンベースの機能に基づく線形のソフトマックスポリシーです...
ロールアウトポリシーとは何か、およびそれが移動を選択するポリシーネットワークとどのように関連するのかわかりません。簡単な説明はありますか?
                  ペーパーはペイウォールの背後にあるようです...
                
                
                  
                    —
                    Vladislavs Dovgalecs 
                    
                  
                
              
                  @xeonどうしようもない。私は論文に完全にアクセスできますが、ここにアップロードすることはできません(著作権法)。誰か他の人がコピーを持っているなら、たぶんググって?
                
                
                  
                    —
                    HelloWorld 2016年