Alpha-Zeroのプレイは以前のコンピューターチェスプログラムよりも「人間的」であり、反対側のワゴンにジャンプしてAlpha-Zeroのプレイは完全に「エイリアン」であると言うので、時流に乗ってジャンプするのは簡単です。特に擬人化に対する人間の傾向を考えると、アルファゼロのプレイが「より人間的」であることは明らかではありません。
(人間の)心の闘争としてのチェス
しかし、チェスではこの傾向は本当ですか?マグナスカールセンはかつて、「伝統的な」コンピューターは一般に人間の創造性に欠けていることについて次のように語っていました。
「チェスとは人間の心の闘いです。それがエキサイティングなことです。コンピューターのチェスは機械的で、ドライで、当たり障りのないものです。もちろん動きは非常に強いですが、スタイルはありません。チェスのコンピューターと対戦する場合、あなたは非常に高い確実性で失うだけでなく、その過程で退屈するでしょう。
Magnus Carlsenは、伝統的なチェスコンピューターで人間のスタイルのプレーの証拠を見ませんでした。そこで、アルファゼロの最近の業績がこの展望を覆し、私たちをもっと自分自身を連想させる何かに私たちを動かしたかどうかを調べてみましょう。
「人間に似た」とは、「擬人化の感覚に訴える可能性がより高い行動を示す」というプレイを意味する場合、アルファゼロのスタイルはより人間らしく見えますか?この主観的な近視の人間が、人間以外のものに投影するのを好むのをどうやってテストするのでしょうか?聞いてみましょう-アルゴリズムは、そのプレイスタイルで「選択的に優れた選択」または「より人間的な創造的選択」を示しますか?
アルゴリズムのクリエイターがStockfishとは異なりアルファ・ベータ検索アルゴリズムを使用することを示し、アルファ・ゼロは、加重パラメータが〜前回の結果から構築θを入力として受け入れ、モンテカルロ木探索(MCTS)アルゴリズム採用ページ3.マスタリングチェスとを一般的な強化学習アルゴリズムを使用した自己プレイによる将gi)。
そのため、アルゴリズムには選択肢がまったくありません。実際には、ランダムではあるが確率的なモンティ・カルロ検索が行われ、利用可能な検索パスが以前の結果によってますます偏見されています。Alpha-zeroは、このようにプレイスタイルを最適化することを選択しましたか、それともプログラマの選択でしたか?
アルファゼロには、考えられるすべての可能な動きが常に考慮されていますか、または人間が擬人的に解釈できる経験を模倣する方法でアルゴリズム的に偏った動きがありますか?
最初はすべての動きが利用可能でしたので、その「スタイル」は完全にランダムでした。ただし、検索は以前の成功または失敗によってますます最適に制約されるため、そのスタイルは実際にプログラマーが束縛したモードに向かって変化しています。これは「より人間的」ですか?時々ますマグナスCarlesenにこれを比較し、彼らがより創造的であるため、少ない最適な移動を選択してください:
マグナスカールセン:「ユニークなものを作ってくれてありがとう」
(エイリアン)マインドの闘争としてのチェス
人間は、自分のスタイルのプレイを促進する基準を選択できます(たとえば、自分のスタイルで衝動とエラーをしばしば選択しました)。多くの人が両方のチェスでアルファゼロのプレーを見て、明らかにエイリアンとして行きます。MITのコンピューターサイエンスおよび人工知能研究所(CSAIL)の大学院生であるニックハインズは次のように述べています。
「ここで見ているのは、人間の偏見や前提のないモデルです。最適であると判断したものは何でも学習することができます。それは、タイムトラベルのようなことをすることができる独自の数学を発明したエイリアン文明のようなものです...」
同様に、GMピーター・ハイネ・ニールセンはChess.comに語った。
「論文を読んだ後、特に私が考えていたゲームを見て、よく、私は常に、優れた種が地球に上陸し、チェスをする方法を示したとしたらどうなるだろうと思っていました。
ほとんどの場合、Alpha-Zeroの新しいスタイルのプレイには「より人間的」ではなく「エイリアンプレイ」として反応するようです。
したがって、「はい」と言う上記の回答に同意しない理由があります。