チェスの専門家がAlphaZeroの干し魚に対する勝利に驚いたのはなぜですか？

10

それはされた最近私の注意に持って来らチェスの専門家が動揺のようなものとして、この今の有名な試合の結果を取ったこと。

参照：チェスの新しいベストプレーヤーは、大胆不敵なスワッシュバックリングアルゴリズムです

ChessとChess AIの専門家ではないのと同じように、AlphaGoのパフォーマンスと、組み合わせゲームに関連するそのタイプのメソッドの検証に基づいて、古いAIにはチャンスがないというのが私の仮定でした。

AlphaZeroの勝利が意外だったのはなぜですか？

chess alphazero

— デュークシュー
ソース

14

良い質問。

まず第一に、囲碁では、deepmindには挑戦する超人的な対戦相手がいませんでした。囲碁エンジンは、人間のトッププレイヤーの最高レベルの近くにはありませんでした。ただし、チェスでは、エンジンはトップの人間のプレーヤーよりも500 ELOポイント強力です。これは大きな違いです。現代のチェスエンジンに投入された作業量は驚異的です。私たちはプログラミングにおいて数百万時間、数十万回の反復について話しています。それは膨大な知識と仕事です。4時間でそのすべてを克服して超えるのは驚異的です。

第二に、チェスマスターにとって意外なのは結果そのものではなく、AlphaZeroがチェスをプレイする方法です。人間の知識や専門知識のないシステムが私たちのように最もよく機能するのはかなり皮肉なことです。エンジンは醜い動き、調和の取れていない動きなどで有名です。チェス以外のプレイヤーには説明が難しいですが、現代のエンジンが頻繁に思い付くような「人工的な動き」のようなものがあります。AlphaZeroは、このようにまったく再生しません。それは非常に人間のようなスタイルをしており、深い戦略的プレーと見事なポジションの犠牲で相手の駒を支配しています。AlphaZeroは、ポジションの深い理解とエンジン計算の精度を組み合わせて、私たちが目指す方法を実行します。

編集ああ、私は結果自体について何かを言及するのを忘れていました。あなたがコンピュータのチェスに慣れていない場合、それは驚異的に見えないかもしれませんが、それはそうです。

現代のトップエンジンを分ける勝利のマージンは、かみそりのように薄くなっています。100ゲームの試合では、より良いエンジンを決定するために、85ゲームの引き分け、9勝利、6損失のような結果を期待できます。

AlphaZero 28が勝利し、損失がゼロの72ドローは別世界に押しつぶされ、それが起こった瞬間まではまったく考えられませんでした。

— クリス・D
ソース

いい答えだ。AIとチェスの比較についてのあなたのポイントは、チェスのルーピーと勝利/敗北/ドローのトライアドに基づく制限という点で興味深いものです。（おそらく、将来的には、結果に関してより詳細な分析を可能にする、有限で扱いにくいゲームが必要になるでしょう。）私はチェスエンジンの歴史と、それに入る膨大な労力と人間の知識に精通していますが、成功の欠如の背景re：より複雑な19x19 Goは、私とは逆の影響を及ぼしました。

— DukeZhou

具体的には、AlphaGoが非常に複雑なゲームでトップヒューマンを倒すことができる場合、トップヒューマンだけでなく、他のどのゲームでもトップの以前のAIを倒すのは理にかなっているように思われました。

— DukeZhou

人工的な動きについてのビットはかなり重要であり、チェス以外のプレイヤーが話しているのを見たことはありません。+1

— ステラ

4

チェス用のMCTSは、ほとんど成功していませんでした。AlphaGoのアプローチはチェスでは機能しないと想定されていました。おそらくGoではチェスでは機能しないでしょう。突然、Googleはこのアプローチが機能していることを発表し、非常に有意義なマージンで世界最強のチェスプログラムを打ち負かしていました。

Googleが登場する以前は、すべてのチェスプログラマーは、機械学習よりも優れた戦略であるエンジンプログラミングのヒューリスティックを作成することを教えられていました。ニューラルネットワークをどのように実装したとしても、64ビットビットボードの命令よりも速く実行されることはありません。AlphaGoの実行速度は非常に遅くなりましたが、最も強力なチェスでした。

— こんにちは世界
ソース

2

私は、あなたが提供した記事に基づいて、勝利における多くのレベルの驚きを見る：

チェスはマスターするのが難しいゲームであり、カウンターパートは世界のベストプラクティスを持っていました、AlphaZeroはtabula rasaを持っていました。

学習には4時間かかり、AlphaZeroは100の試合に負けませんでした。

プレースタイルは人間とコンピューターのような異質な動きでした。攻撃的で、時には分からない犠牲を伴い、間抜けに見えますが、実際には将来のステータスをより強くしています。

移動ごとに考慮される可能性の量は対応物よりも少なく、AlphaZeroには神秘的な直感または直感がありました。

動揺感は、AlphaZeroが作成したトレーニング資料の量と時間制限から来たもので、従来のマシンに十分な時間を与えなかった可能性があります。

— ミコ
ソース

ああ。つまり、それは新しいAIメソッドへの信頼の欠如から生じました。それは理にかなっている。

— DukeZhou