ナッシュ平衡計算のアルゴリズム。


10

私はこれを以前に尋ねられたことがあるかどうかフォーラムを検索しました。アルゴリズムゲーム理論が議論されている間、私はこの特定の問題に対処することを見つけることができませんでした。私は、有限のn人ゲームで近似(混合戦略)ナッシュ均衡を計算するための最もよく知られているアルゴリズムが何であるかを理解しようとしています。もちろん、このアルゴリズムはPPADです。アルゴリズムの完全な精度よりも速度/効率に関心があります。

ありがとう、フィリップ


詳細をお知らせいただくと、より良いサポートを提供できます。たとえば、のどの値を考えていますか?ペイオフ機能の特別な構造を考えていますか?本当にナッシュ均衡が必要ですか、それとも相関均衡で十分でしょうか?証明可能な範囲の良いものや実用的な性能の良いものを探していますか?n
ウォーレンシュディ10/10/20

回答:


7

簡単に言えば、近似のナッシュ均衡を確実に見つけるための多項式時間アルゴリズムはいくつかありますが、それらはすべて比較的貧弱な近似を見つけます-実際にゲームをプレイするアルゴリズムを見つけようとすると、おそらく十分ではありません。nプレーヤーゲームよりも2プレーヤーゲームの方が知られています。

あなたがやろうとしていることが実際に(おおよその)ナッシュ均衡を見つけているなら、あなたが試すかもしれないコーディングの簡単なことの1つは、ランダム化された加重多数決アルゴリズム(http://en.wikipedia.org/ wiki / Randomized_weighted_majority_algorithm)。これが機能することは保証されていませんが、多くの場合は機能します(ゼロサムゲームなどの特定のクラスのゲームで保証されています)。特に、このプロセスが収束する場合、ナッシュ均衡に収束することが保証されます。危険は、収束せず、永久に循環しないことです。ただし、この場合でも、ゲームプレイの経験的履歴は、相関の粗い一連の均衡に収束します。


私は上記の回答で言及された論文を検討し始めました。私はそれのすべてを理解していませんでした(または一見するとその多くは)...近似が「比較的悪い」理由を説明できますか?また、「粗相関均衡」とは何かについて簡単に説明してもらえますか?私は相関平衡が何であるかを知っていますが、それはそのような方程式にとって何を意味するのでしょうか。粗くなります。最後に、「ゲームプレイの経験的歴史は収束するだろう...」などとはどういう意味ですか?決して収束しないものを一連のCCEに収束させるにはどうすればよいですか?回答ありがとうございます。ウィキペディアの記事を調べています。
フィリップホワイト

粗い相関平衡または相関平衡に収束する分布を生成するアルゴリズムの背景については、ここから始めます。cs.cmu.edu
Aaron Roth

粗い相関均衡ではなく相関均衡が必要な場合は、内部後悔のない学習器を使用できます。たとえば(恥知らずなプラグイン)cs.brown.edu/~ws/papers/regret.pdf。多項式時間で相関平衡を直接計算するアルゴリズムもあります。
ウォーレンシュディ10/10/20


4

実際にソフトウェアに実装されているアルゴリズムに興味がある場合、私が知っているいくつかの方法があります。

  1. GAMBITパッケージ(http://www.gambit-project.org/doc/index.html)は、2プレーヤーおよびnプレーヤーの通常のフォーム、場合によっては広範なフォームゲーム用のいくつかのNash平衡アルゴリズムを実装しています。

  2. GameTracer(http://dags.stanford.edu/Games/gametracer.html)は、nプレーヤー標準フォームゲーム用のGovindan&WilsonのGNMおよびIPAアルゴリズムを実装しています。

  3. 大規模なゲームの場合、プレーヤーの数でサイズが指数関数的に増加するため、通常のフォーム表現は問題があります。代わりに、ゲームのユーティリティ関数に特定の種類の構造がある場合、「簡潔な表現」(たとえば、グラフィカルゲーム、対称ゲーム、アクショングラフゲーム)を使用して、はるかに少ないスペースで表現できます。さらに、この構造はしばしば計算の高速化に利用できます。ソフトウェアに関しては、AGGソルバー(http://agg.cs.ubc.ca)は、GameTracerのGNMアルゴリズムとGAMBITのsimpdivアルゴリズムをアクショングラフゲーム(AGG)表現に適合させます。(免責事項:私はこのソフトウェアパッケージの開発に関わっています。)

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.