「プレイヤーは戦略を選択することはできず、アクションを選択することしかできない」とは、バッティガッリの実際の意味は何ですか?


9

Youtubeのこのビデオ(7時30分から9時)では、Battigalliがシンプルな3本足のムカデゲームの世界の状態について述べています。

"重要なすべての説明。従来の理論では、アンとボブを特徴付ける戦略を含める必要があります。「アンは戦略を選択する」という言葉は使用しません。理由は非常に単純です。選択の目的はアクションです。態度ではない。プレイヤーは戦略を選択できず、アクションのみを選択できる。アンが戦略を選択できる場合、彼らは別のゲームをプレイしている。」(C,C)

Pierpaolo Battigalliは本当にどういう意味ですか?プレイヤーが選択するアクションが指定されている場合は、純粋な戦略が自動的に指定されます。この方法論により、彼はコミットメントのあるゲーム構造とないゲーム構造を区別したいと思っているようですが、どうやって?

追加: ここでは、ビデオで使用したスライドであり、ここでは対応紙です。

回答:


9

アイデアは、プレイヤーがアクションsを選択せず、他のプレイヤーと自分自身がゲームの将来のノードでプレイする方法に関する信念に基づいて、プレイするすべてのノードで一度に1つのアクションのみを選択するという考え方です(そのノードに至った履歴を条件とします)。

解釈は、プレーヤーに完全にフェッチされた戦略を選択させることは、プレーヤーがコンピュータープログラムに依存して代わりにゲームをプレイさせることと同じです。つまり、このコンピュータプログラムを介して、各ノードで特定のアクションを実行することができます。

コミットメントデバイスを備えたこのようなゲームは、実際のプレーヤーが各決定ノードでアクションを繰り返し選択する必要があるゲームとは本質的に非常に異なります。実際のプレーヤーがノードでプレーするとき、プレーヤーは他のプレーヤーと彼ら自身が将来のノードでプレーする方法について信念を形成する必要があり、これらの信念は将来のノードにつながった履歴に依存する可能性があります

たとえば、Stackelbergゲームでは、リーダーは、リーダーが「低生産」を再生する場合、フォロワーは合理的(つまり、ユーティリティ最大化)であると信じることができますが、リーダーが「高生産」を再生する場合、非合理的(つまり、非ユーティリティ最大化)であると信じることができます。製造"。多分リーダーはリーダーが「高生産」を演じればフォロワーが怒るだろうと予想し、そして彼女の怒りによって盲目にされ、それからフォロワーは報復したいと思います。

フォロワーが戦略を通してコミットできたとしたら、ゲームは完全に異なっていただろう。たぶん、フォロワーは怒る前に報復しないことを約束したかもしれず、彼女はもう報復したいという彼女の欲求を助けることができません。しかし、ここでの考え方は、リーダーがルートノードで選択したものを前提として、実際のフォロワーはゲームの後半でアクションを選択する必要があるということです。したがって、フォロワーがノードでアクションを選択する際の行動規則(ユーティリティの最大と非ユーティリティの最大など)、およびこれらの手順に関するリーダーの信念は、そのノードに至るまでの履歴にも依存する可能性があります。

これは、古典的なゲーム理論から生まれなかったであろうゲームの多くの新しい結果への道を開きます。概念的な観点から、ソリューションの概念から認識論的および行動的仮定(つまり、古典的なゲーム理論から認識論的ゲーム理論)にフォーカスを切り替えます。合理的な結果のセット(例、ナッシュ均衡の結果)を特定する代わりに、これらの結果に一致する戦略を検討する代わりに、プレーヤーの行動と信念の合理的な特性(お互いの信念と行動について)を特定し、次の結論を導き出します。ゲームが展開するにつれて、結果に対するこれらの認識論的および行動的仮定。

さて、これはバッティガッリのフレームワークにいくつかの肉と直感を与えるだけであり、それはフレームワークの豊かさを正当化するものではありません(リンクしたビデオ以外の彼の作品について私があまり知らないためです)。まだご覧になっていない場合は、ビデオ全体をご覧になることを強くお勧めします。Battigalliは彼のフレームワークをアクセシブルにするのに素晴らしい仕事をしていると思います。また、彼の認識論的アプローチを「古典的な」ゲーム理論に結びつけるための役立つ直感的な例を示し、逆帰納などのゲームの古典的な解決策を回復できるようにするプレーヤーの信念と行動の単純な条件を特定します。


非常に役立つ回答をありがとうございました。バッティガッリの原理の解釈、つまり戦略ではなく行動を選択することは、彼の動的な信念体系、戦略に対する信念ではなく条件付き信念を条件とする信念に等しいと思われます。また、あなたは彼の結果、動的な信念を参照しているようですシステムと逆帰納を意味する合理性への強い信念は、逆帰帰帰を意味するオーマンの常識に関する常識よりも魅力的です。
メッタワールドピース

問題は、これらが10年以上前にバッティガッリと彼の共著者によって開発されたことです。しかし、この講義は2013年の彼の仕事についてです。新しいものは何ですか?
メッタワールドピース

「まだ行っていない場合は、ビデオ全体をご覧になることを強くお勧めします。」「強くお勧めする」という言葉は、バッティガッリが作り出した「強く信じる」に似ていますよね?:)
メッタワールドピース

@MettaWorldPeace:私はビデオを見る前にバッティガッリの作品を知りませんでした。そのため、何か新しいものがあるのか​​、彼がこの10年間に開発した作品を紹介しているだけなのかわかりませんでした。
Martin Van der Linden
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.