このサイトでよく聞かれる質問の1つは、純粋に自己訓練されたチェスAIの展望に関するものです。
今日、ChessBaseは FIDE Candidatesトーナメントの報道から注意をそらし、新しいAIが初めて、長年チェススタイルのAIに抵抗していた、かなり異なるゲームの主人公を打ち負かしていることを報告しました。レポートの最初の読み物では、新しいgo AIはチェスAIとは異なりますが、より一般的なゲームプレイ(GGP)AIであることが示唆されています。しかしChessBaseの記事ではGGPという用語は使用していませんが、go AIは単純なビデオゲームで勝つことができると言っているようです。
このような勝ち行くAIがチェスでも勝つことができなかった理由はありますか?もしそうなら、そのようなAIショーは、以前は議論されていた以前の質問に対するいくつかの優れた答えがその時点でまだ可能ではなかった、純粋な自己訓練を達成することを約束しますか?なぜですか?
私の質問に対する完全で十分な情報に基づいた答えはまだ入手できないので、関連する専門知識に基づいた部分的な回答でさえ感謝されます。
追加の参照については、この関連する質問と回答も参照してください。
更新
上記の質問が5日前に初めて投稿され、以下のすばらしい回答がいくつか出されたとき、囲go AIの勝利に関する最初のニュースが登場しました。それ以来、追加の情報と解説が出てきました。
それ以降、特に興味深いのは、非常に読みやすい5面の円卓会議で、ジョナサンシェーファーが次のように述べています。
人間のゲームから学ぶことは、プログラムの学習を加速するのに役立ちます。AlphaGoは、人間のゲームを使用せずに、単独で強力なプレイヤーになることを学ぶことができます。学習プロセスには時間がかかります。
円卓会議の主催者によると、シェーファーは「アルバータ大学のコンピューター科学教授であり、チェッカーを解いた男」です。したがって、おそらく、彼はコメントする資格があるかもしれません。
詳細については、別のオープンな議論の記録があります。参加者の多くは通常よりも情報が豊富に見えます。議論は試合中に行われました。
さらに更新、1年半後:コメント者@MarkS。書き込み:
これはチェスではなく囲Goに関するものであるため、AlphaGo Zeroは単なるコメントです。AlphaGoZeroは、勝者(最終スコアではなく)を伝えることで「純粋な自己訓練」を達成し、リー・セドルを破ったAIよりも強力で非常に効率的です。 。詳細については、deepmind.com / blog / alphago-zero-learning-scratchを参照してください