オズボーン、ナッシュ均衡と信念の正しさ


12

オズボーンの『ゲーム理論入門』では、ナッシュ均衡は次のように説明されています(p。21–22):

最初に、各プレイヤーは、他のプレイヤーのアクションに関する信念を考慮して、合理的な選択のモデルに従ってアクションを選択します。第二に、他のプレイヤーの行動に関するすべてのプレイヤーの信念は正しい。

この定義は、各プレイヤーの戦略が他の戦略に対する最良の応答である戦略プロファイルとしてのナッシュ均衡の通常の定義と完全に同等ではないように思えます。

通常の定義では、信念については何も言及していないため、信念が間違っている可能性を考慮しています。

ささいな可能性をとるために、囚人のジレンマを考​​慮してください。各プレイヤーが、他のプレイヤーが告白しないと信じているとします。告白は支配的な戦略であるため、各プレイヤーは依然として告白します。そのため、プレイヤーの信念は実際の均衡アクションとは完全に反対ですが、アクションはナッシュ均衡を構成します。

オズボーンの定義がナッシュの均衡以外の何かを特徴づけているという理解において、私は正しいのでしょうか?


いない「通常の定義は、信念については何も述べていないため、信念が正しくないかもしれないという可能性を可能にします。」これらの定義には、常に根本的な合理性の仮定があるという事実に単純に依存していますか?
トールスト14年

回答:


9

ここで信念の言語を紹介することは、ゲーム理論の他の部分で信念が非常に特定の意味を持っていることを考えると、少し奇妙です。

実際、オズボーンの説明はベイズ・ナッシュ均衡を連想させます。私たちは、次のように完全な情報ゲームの正常な形に信念の概念を導入することができます:確率であるとし、私は、各プレイヤーは、私は、「戦略的」であるタイプ(ナッシュ)均衡に応じて再生されます、そして確率で1 a i彼は、何らかの戦略を一様にランダムに選択します(たとえば、彼はすべてのアクションに対して無関心であるため)。したがって、信念について考えることがより自然なベイジアンゲームがあります。a1a

Bayes Nashソリューションの概念は、他のプレイヤーの戦略によって誘発される予想されるプレイ{ a j } j iによって暗示されるタイプに対する信念を考えれば、の戦略が最適でなければならないことを示しています。私たちのように制限を見れば1、すべてのための私は、このゲームのベイズナッシュ均衡はオズボーンで説明したソリューションの概念と一致します。{aj}ja1


オズボーンがこのように書いた理由は、これが教育的なものであり、これが序文だからだと思います。学生に静的ゲームを紹介するとき、プレーヤーは他のプレーヤーのアクションに最もよく反応することを伝えます。学生は当然、「戦略がどうなるかを知らずに、同時に選択された戦略にどのように対応できるのか」を知りたがっています。これは、多くの意味で、哲学的な質問です。一般的な答えは

  • ゲームが頻繁にプレイされるゲームである場合(繰り返しのゲームで維持できる他の結果の問題は別として)、ナッシュは、そこに収ifすれば、人々が継続する規範を発展させることができるという意味で均衡であると考えることができますその均衡を無期限にプレイする(そして他の人が同じことをすることを期待する)。
  • ゲームが本当にワンショットである場合、通常、プレイヤーは他のプレイヤーが何をするかを予測しようとするという考えを呼び起こします。そして、私たちの均衡概念はこれらの予測が正しいに違いないという考えを埋め込みます。

2番目のポイントの予測は、Osborneによって呼び出された「信念」に対応しているようです。しかし、これらの予測/「信念」は、平衡状態で起こっていることを概念化するための単なる非公式/直観的なツールであり、そのような平衡状態の定義の一部ではないことを強調することが重要です。オズボーンがしに行くとき、なぜあるナッシュ均衡自体の概念信念の概念に全くとらわれないですが(あなたがコメントに注意して、それが唯一のアクションの上に定義されている)、正式にナッシュ均衡を定義し、彼は起動せずにそうしますすべての信念のアイデア。


4

信念を導入することで、NEの概念はPBEや逐次平衡などの他の改良概念に匹敵しますが、NEの意味は変わりません。

Mas-Colell、Whinston、およびGreen(MWG)による大学院のマイクロ教科書には、この結果があります。

提案9.C.1。戦略プロファイル展開型ゲームのナッシュ均衡であるΓ E場合や信念のシステムが存在する場合にのみ、μようにσΓEμ

  1. 戦略プロファイルPr H | σ > 0となるように、 すべての情報セットH信念システムμが与えられると連続的に合理的です。σμ HPrH|σ>0
  2. 信念体系は、可能な場合はいつでも、ベイズのルールを通じて戦略プロファイルσから導出されます。μσ

したがって、Prisoner's Dilemmaの例では、プレイヤーが対戦相手の実際の戦略が2番目の条件を満たさない場合とは反対の信念を持っている場合、可能な限りベイズの規則から信念を導き出す必要があります。実際、これはオズボーンの定義の2番目の要件と数学的に同等です。つまり、他のプレイヤーの行動に対するプレイヤーの信念は正しいということです。


MWGとOsborneには違いがあると思います。MWGは、ナッシュ均衡には「存在する」という信念体系があり、それが理にかなっていると言っています。プレイヤーが実際にどのような信念を持っているかについては黙っています。オズボーンは、プレーヤーには実際に信念があり、正しい信念だと言っています。通常の定義では信念がまったく言及されておらず、囚人のジレンマの例は戦略が信念を一意に決定しないことを示しているため、後者はNEの概念的な意味を変えると思いました。
Jyotirmoy Bhattacharya 14年

@JyotirmoyBhattacharya:MWGは「プレイヤーが実際に持っている信念があれば、それについては沈黙している」とは思いません。命題の条件2は、実際、可能な限り、ベイズの規則を使用して、この信念が平衡戦略プロファイルから導出されることを必要とします。したがって、PDの例では、1人のプレーヤーが確率1で欠陥を選択した場合、他のプレーヤーの信念もアクション欠陥に確率1を設定し、そのような信念が与えられると最もよく反応する必要があります(これにより、欠陥も選択されます)。
Herr K. 14年

@JyotirmoyBhattacharya:ただし、NEに対する信念は一意である必要はありません。これは、与えられた均衡について、ゲームツリー上のパスが確率ゼロで取得され、ベイズのルールが適用されないため、そのパスに関するすべての信念がNEで「正しい」と見なされるためです。これが、平衡経路からの不合理な信念を排除するために、逐次平衡のような改良が導入される理由でもあります。
Herr K. 14年

@JyotirmoyBhattacharya:また、オズボーンは学部の教科書であるため、教育上の理由から数学的に厳密ではなく直感的な言語を選択した可能性があります。私にとって、オズボーンの定義の2つの条件は、MWGの命題の正確な対応です。
Herr K. 14年

3

囚人のジレンマの例は、それが支配的な戦略を備えたゲームであるためにのみ機能します。オズボーンは正しいです。

あなたが与える定義のように、他のプレイヤーの戦略に最もよく反応するために、私は彼らの戦略を知らなければなりません。言い換えれば、私は彼らが何をしているかについての信念を持たなければならず、それらの信念は正しいものでなければなりません。これは合理化可能性の概念の強化です。

σμ1σμ2μ2σΣσBσ...」これは、信念が戦略プロファイルの正確な評価であるため、信念を定義する必要がないことを意味すると考えています。私の本の1つを参照すると、Nash(1950)引用で通常の定義が得られ、 1つは正しい信念であり、もう1つはそれらの正しい信念が与えられた合理的な遊びです。


しかし、何かを反証するためには、1つのcountrexampleで十分です。オズボーンの定義がナッシュの定義と同等であると主張する場合、囚人のジレンマの反例をどのように扱うのでしょうか。オズボーンの定義は合理化可能性の強化であると理解しています。ナッシュ均衡は信念について完全に沈黙しているのに対し、ここでは均衡が行動と信念の上で定義されているという単純な理由でナッシュ均衡ではありません。
Jyotirmoy Bhattacharya 14年

1
これは定義であり、証明ではありません。
プバーグ14年

けっこうだ。しかし、それはすでに別の広く受け入れられている定義を持っている概念の定義です。したがって、著者が特に言及しない限り、2つの定義は同等であると主張していると思います。
Jyotirmoy Bhattacharya 14年

明確にするために、彼はそれらのコメントを定義または議論に含めていますか?psの私は私の答えに編集
Pburg

私が引用した部分は議論です。その直後に彼は(p.22)「これらの2つの要素は次の定義で具体化されている」と言ってから、信念にまったく言及していない戦略への最良の対応という点で標準的な定義を与える。それでは、定義のどこに信念が具体化されていますか?そして問題は、支配的な戦略を持つゲームだけではありません。支配的な戦略はないが、ナッシュ均衡戦略は均衡プレイとは異なる信念に対する最良の反応である例を構築することはかなり可能です。
Jyotirmoyバッタチャリヤ

2

私は以前に言われたことを繰り返しているかもしれませんが、これについての私の見解です。

2つの異なるモデルを比較するとき、通常の問題に直面すると思います。2つの定義が異なる世界または異なるモデルにあるため、「同等」が何を意味するかは完全には明らかではありません。ただし、「同等」が適切に定義されている場合、オズボーンの定義を理解し、それが実際にNEと「同等」であることを示すことができると思います。

引用されたセクションの根底にあるソリューションの概念は、次のようなものになります。

sb

あなたはs | s=bあなたはs | s=b すべてのために sS
b=s

p

これは難しい部分です。「すべてのNEがBE」とはどういう意味ですか?OPが反例で示したように、「NEと任意の信念プロファイルはBEである」ことは確かではありません。しかし、それは「すべてのNEがBE行うことができることである場合、いくつかのために信念プロファイルを」。この意味で、オズボーンの「同等」の主張を理解する必要があると思います

我々はまた、次のより多くの「等価様」の文を持っていることをお知らせ:「成果ゲームのは、それがBEの結果である場合に限り、NEの成果です」。


しかし、BEコンセプトはNEより厳密に弱い合理化可能性の弱体化であるため、すべてのBEはNEではありません。
Jyotirmoy Bhattacharya 14年

私が書いたように、BEがNEに「ならない」ことの意味を理解するのは困難です。なぜなら、彼らは異なるモデルに住んでいるようだからです。BEでプレイした戦略の中にはNEではないものがありますか?私はそれが間違っていると思ったが、私は何かを見逃したかもしれない。それがあなたの言いたいことなら、反例に向けて私を指摘できますか?それは非常に役立つでしょう。
マーティンヴァンデルリンデン14年

BEが合理性の弱体化であるかどうかはわかりません。私の理解では、BEは合理性と推測が正しいという条件ですよね?それが正しければ、合理性よりも強くはないでしょうか?(もちろん、「より弱い/より強い」ソリューションコンセプトと呼ばれるものに依存する可能性があります)
マーティンヴァンデルリンデン14年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.