それはされた最近私の注意に持って来らチェスの専門家が動揺のようなものとして、この今の有名な試合の結果を取ったこと。
参照:チェスの新しいベストプレーヤーは、大胆不敵なスワッシュバックリングアルゴリズムです
ChessとChess AIの専門家ではないのと同じように、AlphaGoのパフォーマンスと、組み合わせゲームに関連するそのタイプのメソッドの検証に基づいて、古いAIにはチャンスがないというのが私の仮定でした。
- AlphaZeroの勝利が意外だったのはなぜですか?
それはされた最近私の注意に持って来らチェスの専門家が動揺のようなものとして、この今の有名な試合の結果を取ったこと。
参照:チェスの新しいベストプレーヤーは、大胆不敵なスワッシュバックリングアルゴリズムです
ChessとChess AIの専門家ではないのと同じように、AlphaGoのパフォーマンスと、組み合わせゲームに関連するそのタイプのメソッドの検証に基づいて、古いAIにはチャンスがないというのが私の仮定でした。
回答:
良い質問。
まず第一に、囲碁では、deepmindには挑戦する超人的な対戦相手がいませんでした。囲碁エンジンは、人間のトッププレイヤーの最高レベルの近くにはありませんでした。ただし、チェスでは、エンジンはトップの人間のプレーヤーよりも500 ELOポイント強力です。これは大きな違いです。現代のチェスエンジンに投入された作業量は驚異的です。私たちはプログラミングにおいて数百万時間、数十万回の反復について話しています。それは膨大な知識と仕事です。4時間でそのすべてを克服して超えるのは驚異的です。
第二に、チェスマスターにとって意外なのは結果そのものではなく、AlphaZeroがチェスをプレイする方法です。人間の知識や専門知識のないシステムが私たちのように最もよく機能するのはかなり皮肉なことです。エンジンは醜い動き、調和の取れていない動きなどで有名です。チェス以外のプレイヤーには説明が難しいですが、現代のエンジンが頻繁に思い付くような「人工的な動き」のようなものがあります。AlphaZeroは、このようにまったく再生しません。それは非常に人間のようなスタイルをしており、深い戦略的プレーと見事なポジションの犠牲で相手の駒を支配しています。AlphaZeroは、ポジションの深い理解とエンジン計算の精度を組み合わせて、私たちが目指す方法を実行します。
編集 ああ、私は結果自体について何かを言及するのを忘れていました。あなたがコンピュータのチェスに慣れていない場合、それは驚異的に見えないかもしれませんが、それはそうです。
現代のトップエンジンを分ける勝利のマージンは、かみそりのように薄くなっています。100ゲームの試合では、より良いエンジンを決定するために、85ゲームの引き分け、9勝利、6損失のような結果を期待できます。
AlphaZero 28が勝利し、損失がゼロの72ドローは別世界に押しつぶされ、それが起こった瞬間まではまったく考えられませんでした。
チェス用のMCTSは、ほとんど成功していませんでした。AlphaGoのアプローチはチェスでは機能しないと想定されていました。おそらくGoではチェスでは機能しないでしょう。突然、Googleはこのアプローチが機能していることを発表し、非常に有意義なマージンで世界最強のチェスプログラムを打ち負かしていました。
Googleが登場する以前は、すべてのチェスプログラマーは、機械学習よりも優れた戦略であるエンジンプログラミングのヒューリスティックを作成することを教えられていました。ニューラルネットワークをどのように実装したとしても、64ビットビットボードの命令よりも速く実行されることはありません。AlphaGoの実行速度は非常に遅くなりましたが、最も強力なチェスでした。
私は、あなたが提供した記事に基づいて、勝利における多くのレベルの驚きを見る:
チェスはマスターするのが難しいゲームであり、カウンターパートは世界のベストプラクティスを持っていました、AlphaZeroはtabula rasaを持っていました。
学習には4時間かかり、AlphaZeroは100の試合に負けませんでした。
プレースタイルは人間とコンピューターのような異質な動きでした。攻撃的で、時には分からない犠牲を伴い、間抜けに見えますが、実際には将来のステータスをより強くしています。
移動ごとに考慮される可能性の量は対応物よりも少なく、AlphaZeroには神秘的な直感または直感がありました。
動揺感は、AlphaZeroが作成したトレーニング資料の量と時間制限から来たもので、従来のマシンに十分な時間を与えなかった可能性があります。