論文はこちらです。
ロールアウトポリシー...は、高速でインクリメンタルに計算されたローカルパターンベースの機能に基づく線形のソフトマックスポリシーです...
ロールアウトポリシーとは何か、およびそれが移動を選択するポリシーネットワークとどのように関連するのかわかりません。簡単な説明はありますか?
ペーパーはペイウォールの背後にあるようです...
—
Vladislavs Dovgalecs
@xeonどうしようもない。私は論文に完全にアクセスできますが、ここにアップロードすることはできません(著作権法)。誰か他の人がコピーを持っているなら、たぶんググって?
—
HelloWorld 2016年