ワンショットゲームの混合戦略の説明

13

非協力的なゲーム理論の古典的な紹介では、プレーヤーの混合戦略は、プレーヤーの戦略空間の分布として教えられています。分布は基本的に、プレイヤーがナッシュ均衡で戦略をプレイする確率（離散戦略セットなど）を提供します。

しかし、確率は周波数であるという概念を持ち、これらは基本的にプレイヤーが戦略をプレイするゲームの長期的な割合を意味します。ただし、設定はワンショットゲームであり、これは矛盾です。

混合戦略とは何かを説明するときに、矛盾をどのように解決しますか？

game-theory

— ブラボー
ソース

2

これは、長期的な行動を単一のケースの確率の現れとして見ている確率の傾向解釈をとる人と矛盾していません。

— プバーグ14年

11

アリエル・ルービンスタインは、これらの種類の質問に関して洞察に富む傾向があります。

彼は、この論文のセクション3で混合戦略の解釈に取り組んでいます。

意図的なランダム化以外のいくつかの可能な解釈：

浄化：混合戦略は、モデルで指定されていない情報に基づいた行動計画です。
架空の長期にわたる物語。
人口は平均的であるため、異なるタイプの異なる純粋な戦略をプレイする人口分布からプレイヤーが引き出されることを想像してください。人口分布は、混合戦略分布です。

プレーヤーに関する興味深い引用「の中の混合戦略反映した不確実性の何について」 $i$ $-i$ 行いますが。 $i$

あるいは、混合戦略は、プレーヤーの行動に関する他のすべてのプレーヤーが持っている信念とみなすことができます。混合戦略の均衡は、n組の一般的な知識の期待であり、信念が与えられると、厳密に正の確率が割り当てられるすべてのアクションが最適であるという特性を持っています。プレイヤーの行動は、そうでない場合でも、ランダムなデバイスの結果として他のすべてのプレイヤーに知覚される可能性があります。この解釈を採用するには、多くの応用ゲーム理論の再評価が必要です。特に、それは均衡がプレーヤーの行動の予測（統計的またはその他）につながらないことを意味します。他のプレイヤーについての彼の期待を考えると、最高の応答であるプレイヤーiのアクション動作（他のn-1戦略）はiのアクションの予測として一貫しています（これには、混合戦略のサポート外のアクションが含まれる場合があります）。これは、混合戦略均衡の比較統計学や福祉分析を無意味にし、混合戦略均衡を利用する膨大な経済文献に疑問を投げかけます。

— プブルク
ソース

6

LET 再生に示す戦略そのアタッチ確率、およびlet Aで平衡状態にあるそのような戦略その結果の集合であります二人用の対称ゲーム。 $s_i = \{p_A^i, p_B^i\}$ $A,B$ $s = \{s_i, s_i\}_i$

あなたが言うように、は特定のアクションが再生される確率であると考えます。がシングルトンでない場合は常に、複数の均衡があります。これは、経済学のほとんどの部門が嫌うものです。モデルを解くのが非常に難しく、非一意性を扱うのが難しいためです。どの均衡が実際にプレイされていますか？ $s_i$ $s$

少なくとも、混合戦略均衡では、各均衡が発生する可能性がわかっています。あなたは、それらが周波数を運ぶ範囲で確率を嫌いますが、それはあなたがゲームがワンショットであるという概念と矛盾していると言います。

同時に、ゲームがワンショットであることは、ゲームが一度だけプレイされることを意味しません。多くの個人がいる世界では、誰もがパートナーを見つけて、の戦略の1つをプレイできます。これは、平衡、および分数でそれらのを見つける（同時に！）の次の平衡を演奏者などの $s$ $p_A$ $\{A, A\}$ $p_B$

非シミュレート別の方法として、多くの匿名性を持つ世界では、人々は以前にプレイしたパートナーを忘れていると主張することができます。私たちは、中戦略遊んで多くの人々持っている、時間のし、我々のデカップル彼らは、誰もが新しいパートナーを与え、彼らは再びプレーしましょう。同じ人と再び会う可能性がある場合でも、その可能性はゼロになるため、これを割引率反復ゲームとしてモデル化できます。 $s$ $t$ $\delta\rightarrow 0$

コミットメントの欠如最後に、政府と消費者の間の相互作用など、実際に繰り返されるゲームである状況について考えてください。これは繰り返しのゲームとしてモデル化できますが、政府は戦略シーケンスにコミットすることはできないと考えるかもしれません。そのため、代わりに繰り返しゲームとしてこれをモデル化する、我々はワンショット均衡の繰り返しとして、それをモデル化する：対象期間を考えると、我々がいることがわかります、政府と消費者が平衡果たし、時代のなど $T$ $T\cdot p_A$ $\{A, A\}$

— FooBar
ソース

2

これはPburgの引用の補足です：

Aumann and Brandenburger（1995）の見解の1つは、混合戦略は敵の目だけにあるというものです。では -playerゲーム、世界の状態の集合。状態については、それが下記の仕様： $N$ $\mathbf {S} : = \times_{i \in N} S_i$ $s \in \mathbf S$

プレイヤーのために、聞かせて state'sに投影することが番目の成分。状態が実現すると、プレイヤーは自分のタイプについては絶対に確信しますが、正確な状態については確信が持てません。他の言葉では、彼女は内のどの状態を知りません得られます。代わりに、彼女は上の信念開催、で指定された。 $i$ $\pi_i : \mathbf {S} \to S_i$ $i$ $i$ $s_i$ $\pi_i^{-1}(s_i)$ $\pi_i^{-1}(s_i)$ $s_i$
$A_i$ $i$ $a_i : \mathbf{S} \to A_i$ $\left.a_i\right|_{\pi_i^{-1}(s_i)}$
$i$ $g_i$ $a_i$ $g(s) : \mathbf{A} \to \mathbb{R}$ $s \in \pi_i^{-1}(s_i)$ $s_i$

— メッタワールドピース
ソース

1

さて、これは物理学http://bayes.wustl.edu/etj/articles/prob.in.qm.pdfのこの論文に続いて、答えの私のショットです。私は、その傾向は混合戦略の素晴らしい解釈であると思いますが、より正式にはモデラーの無知を捕らえていると言うべきです。何でもあり、実際にはすべての戦略をとることができます（サポートがどこでも肯定的である場合）が、ソリューションの概念は確かである可能性が高いと言います。ここでの確率は、モデラーの無知を測定し、ゲームに関するゲーム理論家の情報の欠如の結果です。このことを明確にするために、ゲームに関する追加情報を知っている拡張データセットについて考えてみましょう。プレイヤーの1人と話し、何であれ1つの戦略を採用することを保証すると言います。純粋な戦略の形式。ゲームを典型的なゲームと考えると、頻繁に発生します。

— user157623
ソース

0

これはすべてのゲームに適用されるわけではありませんが、（少なくとも一部の）プレーヤーがゲームでランダム化デバイスを実際に使用し、ワンショットと見なされる場合もあります。ここで、確率分布は頻度ではなく、ランダム化デバイスが使用する分布です。混合戦略の均衡は、事前の意味での均衡です（ただし、プレイヤーはランダム化デバイスから一度だけ引き出すことができますが、事後の状況が均衡であるという意味はないかもしれません）。

例は次のとおりです。

— マーティン・ファン・デル・リンデン
ソース