純粋に自己訓練されたチェスAI


46

私が理解している限り、移動する前に、すべての強力なチェスソフトウェアが

  1. 数千または数百万の可能な将来のポジションを調べます。
  2. 評価関数と呼ばれるヒューリスティックに従って、各将来の位置を評価します。
  3. 静止の将来の各ポジションを個別に評価し、ポジションから継続を探索するかどうかを決定します。
  4. ミニマックスで利用可能な動きの中から選択しますそして
  5. オープニングブックを使用します。

ここまでは順調ですね。ただし、チェスプログラムの強さは、その評価と静止のヒューリスティックの質に大きく依存しているようです。また、コンピューターの観点からは、もう1つのヒューリスティックなオープニングブックにも依存しているようです。このようなチェスプログラムは、明らかに、ヒューリスティックを作成した人間と同じくらい、ゲームについて正確に知っています。プログラムには独自の洞察がないようです。

独自の洞察を持つチェスプログラムを書いた人はいますか?それはそれ自体でゲームを学びますか?それはそれ自体を訓練しますか?もちろん、このようなプログラムにはゲームのルールが提供され、おそらくさらに未加工のミニマックスおよび静止インフラストラクチャが提供され、強制合致が見つかった場合はそれを認識して起訴することができます。ただし、ヒューリスティックは提供されません。たとえば、ゲームを中心に向けて開くことも、騎士よりルークを好むことも、シチリアの防衛とは何も言われません。そのような原則を(または、おそらく、より良い原則を発見するために)独自に推論する必要があります。

純粋な形では、そのようなプログラムは研究のためのマスターゲームを提供することはなく、自分自身と対戦する独自のゲームのみを提供します。完全に自己訓練された場合にのみ、人間の競争で解き放たれます。

そのような純粋なチェスAIは存在しますか?機械式チェスの独学が登場したことがありますか?確かに、古いトルコ人は自分自身を教えることができますか?

これは、失敗した純粋なチェスAIの簡単な通知のようです。

(チェスのオープニングのコンピューター化された研究に関して、このサイトには以前に接線方向に関連する質問がありました。)

更新

この記事の執筆時点では、@ WesFreeman、@ GregEの3つの異なる回答が質問に回答しています。と@Landei。3つすべてを強くお勧めします。サイトのポリシーに従って、1つを他のものを除外して正式に受け入れた場合、私は罪悪感を覚えます。ここで3つすべてに感謝し、感謝の意を表します。

質問には簡潔さが求められます。ただし、回答への応答には時間がかかる場合があります。そのため、興味のある読者はここから直接回答にスキップでき、まだ興味がある場合は、続く長い更新を読むことができます。

質問したとき、次のようなことを念頭に置いていました。

シャングリラの郊外にある、チェスのことを聞いたことのない仮想的な村を想定してください。短い訪問中、村の長老たちにゲームのルールを教えますが、ゲームの原則を教えてはいけません。2人の長老は、他の長老が見ているようにゲームをプレイしますが、あなたは(口論によってプレイを中断させたくない)あなたのコメントをルールの質問に限定します。あなたがシャングリ・ラにいる間、試合後の事後分析もチェスのプレイも議論もされません。しかし、あなたが出発するとき、決して戻らないために、あなたはチェスを置き去りにします。

あなたの不在では、長老たちは人々にゲームを教える。一部の人々は後で余暇に少し遊んでいますが、熱心になっている人もいます。

そのような村人にとっては、ルークがナイトよりも優れていることはすぐには明らかではないかもしれませんが、人々はまだ多くのゲームのプレイに対するチェスマンの相対的な強さを徐々に試しているかもしれません。同様に、1。a4が不十分なオープニングであることはすぐには明らかではないかもしれません。彼らはそれを試して結果を検討することができました。

村人のゲームに対する理解は、最終的にどの程度まで外の世界の理解に収束しますか?オープニングブックがない場合、彼らは独自の新しいオープニングを開発するでしょうか?もちろん、最初は村人の開口部が非常に良いとは思わないでしょうが、数世紀の孤立を考えると、村人立派な開口レパートリーを開発するかもしれません。

独立して開発された彼らのオープニングのいずれかは、200年後に次の旅行者が彼らに注目するために通り過ぎたときに、外の世界にとって興味深いものになるでしょうか?シャングリラは、世界に新しい小説、シャングリラディフェンスを与えるかもしれません。

もしそうなら、チェスAIに関する私の最初の質問に関して、私が念頭に置いていたのは多かれ少なかれこれでした:チェスAIはシャンルジラの郊外の村人のチェスの進行を多かれ少なかれ複製できますか?

以下の@Landeiの回答のSussmanの話を考えると、私の村人がゲームにある種の先入観をもたらすことは間違いありません。たとえば、有用なものをより多く所有する方が、より少ないものを所有するよりも一般的に優れているため、対戦相手のチェスマンを捕まえることは、おそらく自分の捕獲に苦しむよりもおそらく好ましいという理解をもたらします。シャングリ・ラの架空の人々が元々どのように領土であったかは文学の問題ですが、より多くの空間を指揮した位置を、より指揮をとらない位置よりも優れていると認識したと考えることができます。そして、チェスのセットを見せてゲームのルールで指示された明るい初心者は、クイーンが最大27の動きを持っているということだけで、クイーンはポーンよりも優れている可能性が高いと推測できます。

したがって、私の質問は、あらゆる種類の知識をチェス盤に持ち込むことに対する絶対的なサウスマン式の差し止め命令を意味すると解釈される必要はありません。むしろ、先入観のあるチェス特有の知識に対する一般的な差し止め命令を暗示するためです。結局のところ(ゲームのルールの進化の問題を無視して)、過去のある時点で、チェスの最初のゲームがプレイされました。たぶん、最初のプレイヤーが1を開いたのでしょう。しかし、最終的に彼はよりよく学び、彼が学んだことを弟子たちに教えました。世代ごとに、より多くのことを学び、より多くを教え、私たちにカスパロフを与えてくれました。

AIは、数世紀ではなく、数週間でそのようなことをすることはできませんか?

プラトンは懐疑的だと思う。ヒュームはより楽観的ですが、哲学だけでは問題は解決されません。現在、提案をテストするための電子コンピューターがあり、AI技術の現状を知りたいと思いました。現在の最高のチェスAIは、何も直観せずにすべての人を打ち負かす、完全に非インテリジェントなエキスパートシステムのようです。ある意味では実際にチェスを考えている少し広いAIが、ゲーム自体を教えることにかなりの成功を収めているのではないかと思いました。

答えは「いいえ」、おそらく「いいえ」だと思います。


4
これは、このサイトの優れた質問の1つです。
prusswan 14

5
DeepMindがゼロからトレーニングした最新のチェスAIの研究をリリースしたばかりなので、答えはイエスのようです(自己プレイのみ、リファレンスゲームはありません)。arxiv.org/pdf/1712.01815.pdf
ララランド

1
@Lalalandのコメントに付け加えて、10時間のトレーニングの後、10時間は、ストックフィッシュが初心者であるかのように、ストックフィッシュ(どのバージョンかわからない)を完全に押しつぶしたと思います。エンジン対エンジンゲームではほとんど前代未聞です。alphago zeroはTal
Ariana

2
「AIは数世紀ではなく、数週間でこのようなことをすることができますか?おそらくしないでしょう。」まあ、あなたはある意味で正しかった...それは数時間しかかかりませんでした。
user230452

1
Capablancaなどのかなりの数のプレイヤーは、一度プレイしたことでゲームを理解しているはずです。また、Alpha Zeroには他に考えることは何もないことを忘れないでください。
フィリップロー

回答:


26

非常に興味深い点がいくつかあります。私はAIの研究に少し経験があります(私の学位はこの分野にありました)。

地域の研究

最初に、この分野の研究は確かに行われています- 2001年からこの論文で「進化的アプローチチェス」の検索が戻ってきました。もっと掘り下げることは可能ですが、一般的にこの分野で働いていた何人かの人々を知っています。

理論的可能性

私の意見では、AIをプレイする「純粋な」チェスを作成するための唯一の本当の制限要因は計算時間です。そのようなAIが現在のアプローチを使用して理論的に作成できない理由はまったくありません。

実用性

チェスのヒューリスティック関数を進化させる際に進化的アプローチまたは遺伝的アプローチを使用することには2つの主な問題があります。1つ目は、最も基本的なチェスのヒューリスティック関数でも非常に複雑であることです。私たちは何百ものルール、ピースの評価(位置などに基づいて異なる場合があります)、位置分析などについて話します。これらのルールを記述するための柔軟なコンピューター言語が必要です。変異、互いに交配など。それは確かに可能ですが、数千のエンティティで構成されるルールセットになってしまうと思います。これは、動的に進化する非常に大きなルールセットです。

2番目の問題は、新しく変更されたルールを実際に評価するには、チェスのゲームをプレイし、誰が勝つかを確認する必要があるということです。これを「正しく」実行したい場合は、両方のプレイヤーに十分な思考時間を与えたいと思うでしょう。これは典型的なゲームの長さに似ています。ただし、1人の対戦相手だけをプレイするだけでは十分ではありません。ゲームの強さの向上を本当に確信できる前に、多くの異なる対戦相手、そしておそらく同じ対戦相手でさえ何度もプレイしたいと思うでしょう。これはおそらく、人口の個人ごとに数百のゲームをプレイすることを意味し、1世代のアルゴリズムを提供します。

通常、これらのタイプのアプローチでは、少なくとも数百世代、またはチェスのヒューリスティック、数十万(または数百万)世代などの複雑な機能を使用することになります。いくつかの簡単な数学では、単一世代に数千時間のCPU時間が必要であり、これをかなりの規模のサーバーファームにスケールアウトしても、実際に進化するには数年(場合によっては数百年)が必要になることを確信させるはずです更新で言及します。

その時間の終わりに、あなたはおそらく実際に発見されたことのないゲームに関する多くの洞察を持つ興味深いアルゴリズムを持っているでしょう。それらが人間にとって有用であるか、さらには理解可能であるかどうかを見分けるのは困難です。なぜこのルールが存在するのですか?数千以上のゲームがあるので、うまくいくようでした。

未来

計算能力が向上するにつれて、これらのアプローチの人気が高まることは間違いありません。現在、マシンのインテリジェンスが慎重に手作りされている場合、マシンには(ほとんどすべての)人間を倒すのに十分な計算時間があります。20年後には、プロセッサが移動しすぎて、1つまたは2つの余分な動きが「ハードコーディング」されたマシンに十分なメリットをもたらさなくなる可能性が非常に高くなりますが、それらの背後にある数百万時間の進化。

2018年5月の更新

ロバート・カウチャーが以下のコメントで言及しているように、最近のニュースはここで言及するに値する。具体的には、GoogleのAlphaGoプロジェクトは、これらのタイプのゲームに対する真に実行可能な最初のAIベースのアプローチであると思われ、2017年後半には、タスクに再利用された後、StockFish 2に勝ったと主張しています。


ありがとうございました。リンクする論文は、まずAIを非マスターの人間の対戦相手に対して訓練し、後に現存のチェスソフトウェアに対して訓練することに気付きます。私のようなプラトニストは、あなたと私が話している種類のAIが実用的不可能であることを知っても驚かないでしょう(チェスは理論的にミニマックスによって解くことができるので、理論的不可能ではないことを知っています); しかし、答えが私を驚かせるかどうかは重要ではありません。ポイントすることは、AIが提案された偉業を達成したかどうかを尋ねることです。答えはノーのようです。
thb

2
@thbこのタイプのAIにはかなりの数の試みがあったと思いますが、「失敗」とみなすこともできます。私は、(今日)大成功を収めた試みが、おそらく非常に弱いアマチュアレベルでプレーしているのではないかと疑っています。偉大な成果であり、一般大衆の目ではありません。また、既存のプログラムや人間に対するトレーニング自体は不正行為だとは思いません。進化するAIのプレイスタイルの方向性を変える可能性はありますが、非常に大きな最適化です。
ダニエルB

1
「純粋な」アプローチの詳細を読むことに興味があるなら、おそらく「競争的共進化」アプローチを探すのにもっと幸運があるでしょう。これは、パフォーマンスの外部測定値を提供する良い方法がない場合に使用されるフレーズです(つまり、他のチェスエンジンと対戦することはできません)。したがって、AIトレーニングはそれ自体のさまざまなバージョンを再生することによって進化する必要があります。確かに機能しますが、かなり時間がかかります。それがおそらくあまり追求されていないアプローチです。
ダニエルB

1
@DanielB AlphaZeroはそのようなAIですか?
ハリーウィーズリー

1
回答を更新することもできます。chess.com/news/view/...
ロバートKaucher

17

あなたが求めていることは、ある種の遺伝的アルゴリズムまたは進化的アルゴリズムのアプローチに分類されると思います。プログラマーは位置の静的な特徴(マテリアルカウント、ポーン構造、カラーコンプレックスなど)を定義する必要があるため、基本的なレベルである程度の人間のバイアスを本質的に埋め込むことなく、このようなアルゴリズムを設計する現実的な方法はないと思います。 AIがさまざまなゲームからの位置を分類および比較します。上記のアルゴリズム用語でチェスのコンテキストでGoogle検索を行うと、多くの結果が得られますが、おそらく成功する競争力のあるAIを構築するために実際に使用されてきた本格的な研究ではほとんどありません。

事実は、ムーアの法則の結果として、コンピューターは非常に強力な計算機であるため、非常に高度なAI手法は(最高の人間の対戦相手よりも高いレベルでプレイするという点で)不要であるだけでなく、逆効果になる可能性さえあります。チェスは一種のゲームです-主に、特定の位置での合理的な動きの比較的小さな検索スペースと、強制的な戦術的な組み合わせの存在(チェックのシーケンス、ピースのキャプチャ、メイトの脅威、または材料の壊滅的な損失を含む、など)-保守的な検索ツリープルーニングを使用したブルートフォースアプローチは、同時に最もアルゴリズム的にシンプルで最も効果的なアプローチです。エンドゲームテーブルとオープニングブックの可用性を考慮すると、そのアプローチのロジックは大きくなります。私は理解しています あなたが話している新しい種類のAIには、まだ理論上の大きな関心と潜在的な価値がありますが、チェスはそれを開発する間違った領域だと思います。一方、本質的に戦術的ではなく、ブルートフォースアプローチを非実用的にする非常に大きな検索スペースを含むGoのようなゲームは、最先端のAI研究のより良い候補になる可能性があります。


あなたの答えに照らしてAIの質問を更新しました。更新は短いものではないため、オプションで、時間があれば、興味のある範囲で確認できます。
-thb

2
そのような人間のバイアスは必要ありません。合法的なチェスをプレイできる1000のランダムアルゴリズムを生成し、トーナメントで互いに対戦し、上位20%を獲得し、突然変異とクロスオーバーを適用して次世代を構築します。何世代にもわたって多数の母集団で繰り返してください。最後にまともなものがあるはずです。必要な唯一のフィットネス機能は、勝ち負けです。
超光度

15

一般的なゲームプレイに関するウィキペディアのページを参照してください。それは活発な研究領域です。プログラムには新しいゲームのルールが与えられ、それについてしばらく考えてから、お互いにゲームをプレイするGGPトーナメントが毎年あります。

GGPプログラムにチェスのルールを与えると、人間の初心者よりもはるかに強く、目的に合わせて作成されたチェスプログラムよりもはるかに弱いことがわかると思います。


13

Stockfish 8に対するAlphaZeroの最近の顕著な成功を考慮して、この質問を再検討する価値があります。DeepMindのAlphaGoおよびAlphaGo Zeroプログラムのさらなる進化であるAlphaZeroは、地球上で最も強力な「伝統的な」チェスエンジンの1つに対して+28 = 72 -0の驚異的なスコアで終了しました。

AlphaZeroは、強化学習を通じてプレイすることを学び、一連のゲームを通じてニューラルネットワークアーキテクチャを訓練しました。添付の論文によると:

  1. 位置を記述する入力フィーチャ、および移動を記述する出力フィーチャは、一連の平面として構造化されます。つまり、ニューラルネットワークアーキテクチャは、ボードのグリッド構造に一致しています。
  2. AlphaZeroは、ゲームルールの完全な知識を備えています。これらは、MCTS中に使用され、一連の動きから生じる位置をシミュレートし、ゲームの終了を決定し、最終状態に達するシミュレーションをスコアリングします。
  3. ルールの知識は、入力プレーン(キャスリング、繰り返し、無進行)と出力プレーン(駒の動き、昇進、将shoでの駒の落下)のエンコードにも使用されます。
  4. 法的ノイズの典型的な数は、探査ノイズのスケーリングに使用されます(以下を参照)。
  5. 最大ステップ数(通常のゲームの長さで決定)を超えるチェスと将giのゲームは終了し、描かれた結果が割り当てられました。Goゲームは終了し、前作と同様にTromp-Taylorルールで記録されました(29)。

AlphaZeroは、上記のポイントを超えるドメイン知識を使用しませんでした。

「 -私が使用している1は、異なるハードウェアのようなものについての質問を上げることができると確信していAlphaZeroを ... 4で単一のマシンを使用するTPUStockfish ... [その]最強の64個のスレッドを使用してスキルレベルとハッシュサイズで再生します1GB。」-しかし、いずれにせよAlphaZeroの結果は注目に値するものであり、OPの流れの中で非常に重要です。

チェスでストックフィッシュを破ったことに加えて、AlphaZeroはチェスでドメインフィッシュの知識がほとんどなかったことに対するおそらくより多くのサポートを明らかにし、チャンピオンプログラムエルモを破るポイントまで将giで訓練し、もちろんGoの前任者AlphaGo Zeroを超えました。

これはストックフィッシュに対するゲームの1つです。ベルリンでは、物質的な不均衡が最終的にAlphaZeroであり、司教と騎士、そしてストックフィッシュの4つのポーンがペアになり31.Qxc7ます。その位置では、AlphaZeroの作品はすべてバックランクにあり、司教たちは元の正方形に戻っています。最終的には、女王が黒い駒を脱いだ後、白い駒を拾うためにゆっくりと動き、それがカーテンです。

ストックフィッシュ-AlphaZero、2017-12-04、0-1
1. e4 e5 2. Nf3 Nc6 3. Bb5 Nf6 4. d3 Bc5 5. Bxc6 dxc6 6. OO Nd7 7. Nbd2 O-O 8. Qe1 f6 9. Nc4 Rf7 10. a4 Bf8 11. Kh1 Nc5 12. a5 Ne6 13。 Ncxe5 fxe5 14. Nxe5 Rf6 15. Ng4 Rf7 16. Ne5 Re7 17. a6 c5 18. f4 Qe8 19. axb7 Bxb7 20. Qa5 Nd4 21. Qc3 Re6 22. Be3 Rb6 23. Nc4 Rb4 24. b3 a5 25. Rxa5 Rxa5 26 Nxa5 BA6 27 Bxd4 RXD4 28 NC4 RD8 29 G3 H6 30 QA5 BC8 31 Qxc7 BH3 32 Rg1を RD7 33 Qe5 Qxe5 34 Nxe5 RA7 35 NC4の G5 36.前記Rc BG7 37。 Ne5 Ra8 38. Nf3 Bb2 39. Rb1 Bc3 40. Ng1 Bd7 41. Ne2 Bd2 42. Rd1 Be3 43. Kg2 Bg4 44. Re1 Bd2 45. Rf1 Ra2 46. h3 Bxe2 47. Rf2 Bxf4 48. Rxe2 BE5 49. Rf2と KG7 50 G4 BD4 51 Re2を KF6 52 E5 + Bxe5 53 KF3 Ra1を 54 Rf2と Re1を 55 KG2 + BF4 56 C3 前記Rc 57 D4 Rxc3 58 dxc5 Rxc5 59 B4 RC3 60 H4 Ke5 61 。hxg5 hxg5 62. Re2 + Kf6 63. Kf2 Be5 64. Ra2 Rc4 65. Ra6 + Ke7 66. Ra5 Ke6 67. Ra6 + Bd6 0-1

11

このようなAIを作成することが難しい主な理由は、「トレーニング」を効果的に保存するために必要なスペースのためだと思います。

また、(あなたのセルフトレーニングコメントへの応答として)セルフトレーニングは、そのようなAIを改善しようとしているときに有害になる可能性があります-私はチックタックトー(確かにはるかに簡単)でいくつかの研究を行いました、そしてそれはあらゆる種類を見つけました双方が恐ろしくプレーしたため、勝つための恐ろしい方法の(そしてそれらの恐ろしい方法を訓練する)。三目並べで優れた先読みAIに対するトレーニングよりも、セルフトレーニングで適切なパフォーマンスを得るのにはるかに長い時間がかかりました。

ただし、ディープサーチと「トレーニング」の両方を使用するハイブリッドを見るのは面白いと思います(エンドゲームとオープニングだけでなく、ミドルゲームのポジションのある種の保存されたデータベース)。多くのスペースが必要です。

位置の勝ち/負け/引きではなく位置の概念を学習する、より「リアルな」AIアプローチを考えているかもしれませんが、(強力なエンジンと比較して)非常に効果的ではないと思います。


答えはありがたいです。私が念頭に置いていたと思うのは、(a)ミニマックス機能を備えていたが、(b)事前に決められた評価関数を持たないAIでした。このようなAIは、純粋なミニマックスによって三目並べのような小さなゲームを必然的に解決します。チェスでは、理論的にはミニマックスの影響を受けやすいゲームであるため、AIはボード上の現在の位置ではなく将来の位置を評価し、その後ミニマックスが移動を選択します。Nimzowitschは、既知の評価ヒューリスティックを駆使してチェスに革命をもたらしたとおおまかに言うかもしれません。もしそうなら、マシンは同様に行うことができますか?
THB

1
独自の評価関数を開発すると言っているのですか?
イブフリーマン

2
@thb、プログラマーとして、あなたの考えの問題は、私が見る限り、妥当なチェスAIは評価関数の完全に空白のスレートで開始できないということだと思います。パターンを求めてゲームを分析し、その評価と意思決定を微調整するために統計的/確率的手法(ベイジアン推論など)を使用するAIを作成できますが、プログラマーはどのモチーフ、位置要因、移動シーケンスがパターンを構成するかを特定する必要がありますそして、それらを評価する基準によって。言い換えると、評価関数の基本的なコアは、人間が設計する必要があります。
グレッグE.

1
たとえば、勝ち/負け/引き分けに基づいて同じ素材価値ですべてのピースを開始し、素材価値を変化させる場合など、遺伝的ミニマックスエンジンがどのようなものになるかを見るのは興味深いかもしれません。エンジンクリエーターは、ナイト2.9やビショップ3.1のポーンを作るなど、すでにこれらを調整しようとしているに違いありません。
イブフリーマン

1
@thb、私は専門家ではありませんが、そうだと思います。リンクしたAIでさえ、プログラマーのバイアスに制約されます。元の研究論文を読んだ場合、評価機能をトレーニングする「機能ベクトル」は「手作業で慎重に設計された」ボード機能を含んでいたことに注意してください。つまり、プログラマーはAIが意思決定の基礎とする静的な位置要因のセットを指定する必要があります。この特定のプロジェクトのニューラルネットの主な利点は、トレーニングを並列化でき、大量のゲームを効率的に非同期処理できることです。
グレッグE.

10

グレッグとウェスの答えをここで拡大したいだけです。THBが提案している種類のAIは、このアプリケーションに必要な高度なものではありません。そして、たとえ彼らがやったとしても、私は彼らがこれで失敗すると疑っています。thbは、ゲームの基本的なルールを教えてから送信できる強力な汎用AIを望んでいるかのようです。しかし、開発中の汎用AIを見ると、すべて1〜2歳のレベルでオブジェクトや音声認識などのことを教えられています。汎用AIには、ゲームのプレイ方法を理解する前に、ゲームが何であるかを理解できるようにするために、まず高度な知識が必要です。汎用AIを設計して、狭いまたは特殊なAIのように動作することを期待することはできません。汎用AIは人のようにチェスを教える必要があり、チェスの歴史を知らない2人の初心者プレイヤーをまとめて、自発的にオープニングと戦略テーマを改革することは期待できません。AIが相互にプレイしている何百ものインスタンスが必要になり、それぞれが数十万回の反復にわたるすべてのゲームの履歴データにアクセスできます。また、各AIは、異なるレベルで重み付けされた特定の異なる特性を持つ必要があります。

これは、から入手することはほぼ500年の人間を取ったロドリゴ(ルイ)・ロペス・デ・セグラペドロDamiãoポール・モーフィー、その後のプレーの間で発生したさらなる変更を検討SteinitzAlekhineを。そしてその変化はすべて、スタイルやファッションはもちろんのこと、さまざまな気質や他の影響特性(司教よりも騎士や騎士よりも司教をランダムに好むなど)を持つ数十万人のプレーヤーのダイナミズムによって生じました。これらすべてのことが、何世紀にもわたってチェスに影響を与えた変化のダイナモに貢献しました。弱いAI-弱い汎用AIでさえ、欲求に欠けているため、そのようなダイナモを複製することはできません。欲望だけが、何日も何時間も座って何かを駆り立てて、ライバルが「バスト」した後、それをつぶしたり改善したりする意図でオープニングを分析できます。実際、何世紀にもわたってプレイを改善したのは、この種の分析と準備への意欲であり、同様に弱いプレイヤー同士の何百万ものゲームのブラインドプレイではありません。

英語を話せず、母国語の文学の巨匠を読んだことがない人々をたくさん集めて、英語を第二言語の本として部屋に入れて、シェイクスピアの作品のようなものを思い付くことを期待しているようなものです。それは決して起こりません。

編集:私はそれが起こったので、この主張をするよりもよく知っている必要があります。

「AlphaZeroは、従来の意味でゲームを「教えた」ものではありませんでした」とChess.comは説明します。「つまり、オープニングブック、エンドゲームテーブル、および明らかに、中央のポーンとサイドのポーンのわずかな違いを分析する複雑なアルゴリズムはありません。これは、ロボットが何千もの金属のビットや部品にアクセスするのと似ていますが、燃焼エンジンの知識がなく、フェラーリを組み立てるまで可能な限りあらゆる組み合わせで何度も実験します。…このプログラムは、何度も何度も自分自身でプレイするために4時間あり、それによって独自の教師になりました。」

私の継続的な、明らかに根拠のない発言:

私たちは、私たちが世界について持っている暗黙の知識のすべてを当然のことと考えています。木片や釘が必要な場合、ドライバーよりもハンマーの方が便利であることを理解できるようにするために、特定の状況では、特定のクラスのものが他のものよりも有用であることを最初に理解する必要があります。また、物事には目標に適用できる用途があることを理解する必要があります。これらはヒューリスティックです。特定のピースが他のピースよりも価値があるとAIに伝えることができない場合、どのように合致するかを理解することができますか?特定のヒューリスティックを使用してプログラムできない場合、「価値」や「実用性」のような経験を推測することができなければなりません。そして、それはナローAIの領域ではありません。それは汎用の領域であり、強力なAIです。


1
素晴らしい答え。あなたの最初の段落は、私が理解しようとしていたアイデアを実際に結晶化していると思いますが、それはより明確になります。
グレッグE.

ありがとう、グレッグ。私が付け加えたいのは、私が弱い汎用AIについて話していることです。真のストロングAIは、非常に圧縮された時間枠での多数の反復にわたる多数のインスタンスを介して、このようなことを実行できると考えています。ただし、強力なAIはまだありません。en.wikipedia.org/wiki/Strong_AI
ロバートカウチャー

欲望のセクションを除いてあなたが言ったことすべてに同意します。AIは、デザイナーが望むことを何時間でも行うことができます。コンピューターのパワーでチェスを解決できれば十分ですが、まだ十分なパワーがありません。
イブフリーマン

それは本当です、Wes、しかしその後、私たちは「プログラマー」または何でもバイアスをAIに注入しています。これは、質問の作成者が望んでいないことの1つです。
ロバートカウチャー

@EveFreeman、私が言っていることを誤解していると思います。私はコンピューターが「チェスを解決しない」と言っているのではありません。OPの特定のシナリオは機能しないという点で大げさだと言っています。システムにヒューリスティックがない場合、どのようにしてピースに価値を付けることができますか?
ロバートカウチャー

9

次のAI Koanについて瞑想してください。

Sussmanが初心者だった頃、ミンスキーはかつてPDP-6をハッキングして座っていた。「何をしているの?」とミンスキーは尋ねた。「ランダムに配線されたニューラルネットを訓練して、三目並べをプレイします」とSussmanは答えました。「ネットがランダムに配線されているのはなぜですか」とミンスキーは尋ねました。「プレイ方法についての先入観を持たせたくない」とサスマンは言った。ミンスキーは目を閉じた。「なぜあなたは目を閉じますか?」と、サスマンは彼の先生に尋ねました。「それで部屋が空になるように。」その瞬間、Sussmanは啓発されました。

目を閉じているかどうかに関係なく、当社のアプリケーションには常に先入観があります...


あなたの逸話は最も説得力があります。あなたが興味を持っている範囲で、あなたの逸話は私に質問を更新で拡張するよう促しました。
thb

8

独自の洞察を持つチェスプログラムを書いた人はいますか?それはそれ自体でゲームを学びますか?それはそれ自体を訓練しますか?

はい。Matthew Laiによって書かれたGiraffeチェスエンジンをご覧ください。彼は、コンピューターサイエンスの修士号を取得するための人工知能研究の一環として、チェスエンジンを書きました。

昨年のTalkChessチェスプログラミングフォーラムで、このことについて多くの議論がありました。私が知っているのは、私はチェスエンジンの著者であり、そのエンジンはGiraffeとほぼ同じくらい強いからです。ただし、Giraffeの著者が「ディープニューラルネットワークによる時間差強化学習」を使用してエンジンをトレーニングしたのに対し、従来の手法を使用してエンジンを実装しました。マシューは、従来のアルファ/ベータ検索を実装して、位置を動的に評価する必要がありました。つまり、多くの動きを先読みする必要がありました。彼の革新は、静止位置を評価するためにエンジンをトレーニングすることです。それに比べて、エンジンの静的評価ルーチンに特定の知識を書きました。

粒子スウォームアルゴリズムを使用して評価パラメーターを調整するコードを作成し(技術的な議論へのリンクについてはブログのサンキューページを参照してください)、肯定的な結果をもたらしました-より強力なエンジン。ただし、これは、非常に大きな評価パラメーターのスペース(10 ^ 150の離散パラメーターの組み合わせのオーダー)でエラーを最小化するほどエンジンを「学習」させるタスクではありませんでした。

マシューはTalkChessフォーラムで彼の論文を議論しています。正しく覚えていれば、彼は現在DeepMindでGoogleに勤務しています。

また、Thomas Petzkeのブログもご覧ください。彼は非常に強力なチェスエンジンiCEを作成し、遺伝的アルゴリズムを使用してエンジンの静的評価を改善しました。Population Based Incremental Learningなど、2013年以前の彼の投稿を参照してください。


フォーラムへようこそ!一を足す。
SmallChess


5

以下のようなGoogle検索これは、ような結果上げることができ、これを

特に、この論文をご覧になりたいと思います。エンジンはピース値などの初期データをエンジンに提供するため、正確にあなたが求めているものではありませんが、非常にうまく機能しました。


+1興味深いIEEEの引用に感謝しているからです。NeuroChessのページにすでに精通していました。ただし、どちらも私が思い描いていたものとはまったく違うようです。
thb

3

機械学習で可能です。

チェスエンジンのオープニングブックは機械学習を使用します。エンジンは、ブック内のオープニングラインを再生してテストします。あるラインが他のラインと比較してスコアが高い場合、オープニングツリーでそのラインをプロモートします。やがて、エンジンより良いラインを学習します。

開始フェーズが終了すると、エンジンはブックの使用を停止し、評価機能の使用を開始します。


機械学習を使用して自己学習エンジンを実装する方法は?

評価機能のないを使用するエンジンを想像してください。そして、本は最初は空です。したがって、エンジンにはチェスに関する知識がありません。

エンジンはこの空の本でプレイを開始し、ゲームが終了するまで本を閉じません。ゲームの終わりまでオープニングブックを使用する通常のエンジンのように考えることができます。

やがて、不良ラインは時間の経過とともに悪化するため、エンジンは統計的に最良の継続を見つけます。しかし、もちろん、良い本を入手するには多くのゲームをプレイする必要があります。いくつあるかはわかりませんが、非現実的と言えます。

2017年12月の更新:さて、アルファゼロは、強力なエンジンの1つであるStockfishを実用的な量のゲームで打ち負かすのに十分なほど強力にトレーニングすることで、間違っていることを証明したと思います。


2

この分野で何を試しても、ここで最初のTurryのストーリーを必ず読んでくださいhttp : //waitbutwhy.com/2015/01/artificial-intelligence-revolution-2.html

TL; DR; リクエストごとのスポイラーバージョン

Turryのストーリーでは、Turryの自己学習AIは、素敵な手書きノートを書くという明らかに無害な目標を達成するために必要ではないため、素敵な手書きノートを書き、最終的には人間を取り除く必要があります。アナロジーは、チェスのスキルを向上させるという一見無害な目標を改善する必要がないため、AIを備えた自己学習型チェスエンジンは人間を排除する可能性が高いということです。


あなたの答えは興味深いですが、おそらく説得力がありません。私はあなたのアドバイスに関してリンクされた記事(両方の部分)を読みました。作家はストローの男性を攻撃することで彼の主張を少し弱めていますが、彼は思慮深い仲間です。記事のTurryのようなものを念頭に置いているとは思いません。2人のプレイヤーが40かそこらのターンを取る8 x 8のチェス盤は、非常に基本的に単純なケースです。AIが一般的な方法でチェスについて考えることさえできないことは驚くべきことです。逆の見方として、割り当てられた読書:Feser、Edward。最後の迷信。それでも、興味のために+1。
-thb

1

そしてAlphaZeroがあります。まったく新しい世代のチェスエンジンを祝いましょう


0

コンピューティングシステムを扱う際の擬人化された用語の使用は、専門家の未熟さの症状です

からどのように傷つけるかもしれない真実を伝えるのですか?Edsger W.Dijkstraが、あなたの質問の根底にある誤った仮定をかなり要約しています。人工知能は人工的かもしれませんが、人間の感覚では知性ではありません。

BBCのための1984 Reithの講義アメリカの哲学者ジョン・サールは、ハードAIと間違っているかを正確に説明しています。彼の議論の「長すぎて聞かなかった」要約は「構文はセマンティクスではありません」ですが、それでも、少なくとも講義2「ビール缶と肉機械」を聞くことをお勧めします。

ダイクストラとサールが30年以上前に言っていることを理解したら、あなたはあなたの質問の何が悪いのかを認識するでしょう:

独自の洞察を持つチェスプログラムを書いた人はいますか?それはそれ自体でゲームを学びますか?

人間には「洞察」があり、学ぶことができます。コンピューターはできません。原始人の村は何世紀にもわたってチェスのオープニング理論を再現できましたが、コンピューターは再現できませんでした。


コンピューターは人間レベルの知能に到達しないと主張しますか、それとも「思考」と「理解」が人間に限られていると主張しますか?
BlindKungFuMaster

@BlindKungFuMaster上記のリンクで「ビール缶と肉機械」を聞くのに苦労すると、ジョン・サールが考えていることは明らかです。彼は私を納得させ、私は彼の見解を共有しています。
ブライアンタワーズ

しかし、現代のAIアーキテクチャは人間の心のアーキテクチャのみを模倣しているため、最終的に「思考」を行うものではなく、アーキテクチャのみが構文的に記述されています。「人間の脳の力に相当する力(まだ完全ではありません)」は、「学習」することで大量のデータを摂取することに由来します。このステップでのみ、セマンティックコンテンツがキャプチャされます。
BlindKungFuMaster

したがって、実際には比較的不条理な大きなルールブックだけで理解をシミュレートできると仮定し、代わりに大量のデータから適切なアーキテクチャによってセマンティックコンテンツをキャプチャできる可能性を前提とすることで、チャイニーズルームの議論には欠陥があります。:実際には、これは自然言語処理はすべて、これらの日に約あるものですcs224d.stanford.edu/syllabus.html
BlindKungFuMaster

@BlindKungFuMasterあなたが言うことには、あなたにはわからないように見えるキーワードが1つあります。「シミュレート」という言葉です。私は35年間コンピューターソフトウェアエンジニアでしたが、その間に多くのシミュレーターを所有しており、自分のシミュレーターもいくつか作成しました。シミュレータは多くの場合プロジェクトの重要なコンポーネントですが、リアルタイムプロジェクトではターゲット機器を完全に置き換えることはありません。間違いなくコンピューターは知性と意味理解のシミュレーションに優れていますが、意識、意志、理解を決して達成することはできません。
ブライアンタワーズ

0

この回答は、質問の4年後、元の質問の質問者によって与えられます。以前の回答のほとんどは、これよりも興味深いため、以前に与えられた回答の代わりにはなりません。ただし、この回答により、コンテキストが追加される場合があります。

私の知る限り、ほとんどのAI研究は暗黙的に、思考と理性は単に物質的な現象である、または少なくとも思考と理性と区別できない結果は必然的に物質的なプロセスによってのみ達成可能でなければならないという前提を認めているように思われます。前提に異議を唱えることはありません(そのため、ここでは宣伝しません)。私はそれ前提であるように見えることを単に観察します。

そして、結局のところ、AIの研究において、これはどのように前提とすべきではないのでしょうか?AIの研究者は、彼らがそうであろうとなかろうと、物質的プロセスを経なければなりません。

Duns Scotus、St。Thomas、Aristotle、Platoに戻ったリアリズム哲学の学生たちは、心の理論に関して多くのことを言ってきました。カントのような表現主義者は、言うべきことはかなり異なっていました。AIの研究はおそらくカントに近いでしょうが、これは学校の生徒を間違えさせません。

確かに、現在の種類の会話のこの時点でポップアップする傾向のあるギャップの神の反論がありますが、プロの哲学者はギャップの神の反論がストローマンを攻撃することを教えてくれます、この異議は、哲学を学んでいないために何を話しているのか分からない人に対してのみ有用である傾向があること。アリストテレスによれば、それは正式最終的な因果関係であり、自己訓練されたチェスAIの問題に関係している可能性があります。しかし、アリストテレスの用語では、AIの研究者は純粋に材料、特に効率的な因果関係を処理します(人間のトレーナーが正式に最終的な要素をシステムに持ち込む限り、おそらく斜めを除いて)。理性が正式であり、思考が最終的なものである場合、サールの中国の部屋が存在論的に不可能であることが判明した場合(おそらく)、純粋に自己訓練されたチェスAIは理論的にも達成できない可能性があります。

私は、純粋に自己訓練されたチェスAIが実際に達成できると疑っています。つまり、アリストテレスの用語で言えば、この質問は、単に効率的な因果関係の観点から適切に難解であることがわかります。私は一般的に強力なAIに懐疑的ですが、これらは経験上証明されるべきものではありませんか?まだ誰も知りません。

因果関係の哲学は微妙であり、少数の人が把握している(そして、より実践的な男性であるAI研究者の間でさえ、おそらく少数の人が把握している)。あなたがそのような哲学を学びたいなら、学ぶ価値は十分にあります。しかし、インターネット上で、そしてしばしば印刷物でさえ、未指導の誤解に基づいた誤解を招く説明を見つけることは非常に簡単です。私のお金のために、このテーマについて今日書いている最高の入門教師は、エドワード・フェーザーであり、その本は手頃な価格で印刷されています。彼からもっと多くを学ぶことができます。

しかし、フェーザー博士でさえ、現在の質問に対する権威ある答えを投じることを疑います!答えは、AIの実験室で証明されたままです。


-3

私は彼らにコードをリリースしてもらい、それから話をすることができます。チェスを解くのはそれほど簡単ではありません。アルファは半世紀でもそれを解きません。面白いことに、それはまだ1.d4を再生します。どうして?それは人間のゲームで訓練されており、人間の理論は1.d4で最高のパフォーマンス率を与えるためです。貧しい人は1 ... c5が正確に8手で引き分けを達成することを知りません。今、彼らは、アルファがオープニングの本をシミュレートしていないと信じて欲しいと思っています...彼らは、アルファがオープニングを素晴らしかったと言います。ええ、はい、いくつかの例外はあります。1.d4は確かに、プログラムが達成した知性のレベルをうまく語っていません。幸いなことに、SFはオープニングステージでさらに弱くなっています。:)


3
あなたは1と言って大胆な主張をします... ... c5は8手で引き分けを達成し、Stockfishは最初の段階で弱いです。これらの主張への参照を提供していただけますか?
パブロS. Ocal

1
1.d4は確かに、プログラムが達成した知性のレベルをうまく語っていません。1.d4プレイヤーとして、ここで私の知性がin辱されていると考えるべきかと思います。
エヴァルガロ

彼らは、コードをリリースしたり、論文を発表していないものの、その結果を再現するプロジェクトが発足しました:lczero.orgあなたもで進化する「AlphaZero」で遊ぶことができますplay.lczero.org
Junyan徐
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.