AI:学習と戦略化


16

AIに関する理論があり、それについて「ホワイトペーパー」を書きたいと思っています。AIで検討したいのは、学習と戦略の違いです私の質問は、この主題に関する他の資料どこで読むことができますか?

チェスの例を挙げましょう。チェスAIを最大ツリーとして見てみましょう。敵ユニットをキャプチャすると、そのユニットの値がその決定の「移動スコア」に追加されます(同様に、ピースを失うとその値がスコアに減算されます)。ポーンをキャプチャすると、1ポイント、ナイト4ポイント、ルーク5ポイントなどを獲得できます。

これらのポイントを適用し、次の動きを決定するための戦略はAIです。例えば。10の可能な動きが与えられたら、3つの動きの終わりに最高の(最大スコア)を選びます。

学習は、統計的観察を適用してそれらの値を決定することです。100ゲームをプレイする場合、AIはポーンをキャプチャすると2ポイント、ナイトは7ポイント、ルークは3ポイント(100ゲームに基づく)の価値があると判断する場合があります。

この区別はすでに文学に存在しますか?もしそうなら、どこでそれについて読むことができますか?

編集:このアプローチを利用するチェスゲーム(できればソースコード付き)を知っている人はいますか?たぶんChess960 @ Home


3
エポックベースの学習に対して「ポイント」が調整されたゲーム理論の組み合わせのように聞こえます。
減速

回答:


15

あなたが戦略と呼ぶものは、通常、AIコミュニティでは検索と呼ばれます。A *やDFSなどの単純なアルゴリズムと、A *などの情報に基づいた検索のためのヒューリスティックな設計のためのメソッドが含まれます。

あなたが学習を呼び出すことと呼ばれる機械学習、伝統的に分割、教師あり学習教師なし学習、および強化学習。おそらくゲームにとって最も重要な分野は、遺伝的プログラミングニューラルネットワークサポートベクターマシン、およびベイジアンネットワークです。しかし、機械学習は膨大な分野であり、これは研究対象のツールのごく一部にすぎません。

さまざまな種類のAIアプローチに本当に興味がある場合は、ウィキペディアを読むのではなく、AI:A Modern Approachのような本物の教科書を入手することをお勧めします。


1
モダンアプローチの場合は+1。素晴らしい本。ゲームのニューラルネットワーク自体の有用性には同意しませんが(バーBlack and White)。
レイデイ

私はそれらが有用であるとは言わなかった、ただ重要だ。それらはいくつかのゲームで使用されており、多くのAI技術はそれらに基づいているか、それらと比較されています。たとえば、私が非常に頻繁に使用するデータクラスタリング手法とは異なり、ゲームのk-meansバリエーションよりも複雑なものを見たことはないと思います。

それは公正で十分です、私は、彼らは単に仕事のビットを必要とするものの、彼らはゲームに最も適した領域であることに同意する;)
レイ・デイ

エキスパートシステムと呼ばれる3番目のアプローチ(「戦略化」)があります。このアプローチでは、基本的に一連のif-thenだけで、検索ツリーをまったく必要としないルールベースのアルゴリズムを見つけます。
イアンシュライバー

1
@Ian:エキスパートシステムには精通していますが、一連のif-thenではありません。実際、最新のエキスパートシステムは、上記のツールを使用して実装されています。機械学習を使用して、可能な推論ルールを測定したり、これらのルールを使用して前方または後方チェーンを検索したりできます。おそらく決定木を考えているかもしれませんが、それらもしばしば機械学習によって作成および調整され、検索を使用して複数のパスを探索します。

1

あなたは間違いなくAIを現代的なアプローチで読むべきです。この本は少し高価ですが、基本的な作業ができるまでAIについて真剣に議論することはできません。また、第2版は第3版と同じくらい良いので、より安価な第2版を見つけることができるなら、それを使ってください。

本当に機械学習に興味があれば、ミッチェル博士の本には、動きに関する詳細な情報がたくさんあります。

AIアカデミックへの参入には大きな障壁があるのは残念です。しかし、独自の(間違った)語彙を使用し、学界ですでによく知られている技術について説明しているホワイトペーパーを発行する場合、あなたや他の誰にも役立ちません。

対戦相手の行動を学習して自分の行動を改善する分野には、いくつかの注目すべきエントリがあります。優れたスパムフィルターはこれを行うだけです。Paper Rock Scissors AIを調べる必要があります。PRSのユニークな点は、それが単純であり、検索が含まれていないことです(別名戦略化)。AIが人間を打ち負かすことができる唯一の方法は、彼の好みを学び、それを悪用することです。

NYTimesが作成したこのPRS AIボットをご覧ください。


いいですが、私が探しているものではありません。Joe Wreschnigの答えは、基本的に私が望むものです。それが私が研究/執筆しようとしているものの用語です。また、私は用語と理論的研究にはあまり興味がありません。再利用可能なライブラリを作成して配布し、人々が使用できるようにします。
-ashes999
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.