「直感的な基準」を直感的に理解する方法は？

25

Cho and Krepsによる直感的な基準は、シグナリングゲームにおける完全なベイジアン均衡のセットを最小化するための改良です。この基準を説明するためのシンプルで直感的な例は何でしょうか？学部生なら誰でも、この例を通して洗練を簡単に理解できるはずだと想定してください。

game-theory

— ブラボー
ソース

23

簡潔で完全に非公式な方法は次のとおりです。直感的な基準は、あるプレーヤーが何か愚かなことをした場合にのみ正しいと考えられる平衡から外れた信念を排除します。

以下は、非公式の例を使用したもう少し長い説明です。

多くのシグナリングゲーム（つまり、1人のプレイヤー（送信者）が別のプレイヤー（受信者）と情報をやり取りできるゲーム）には、多くの場合、信じられないほどの均衡があります。これは、パーフェクトベイジアンソリューションの概念では、送信者が逸脱した場合に受信者の信念がどうあるべきかを指定していないために発生します。したがって、送信者がそれらの均衡から逸脱すると、非常に悪い信念で「処罰される」と言うだけで、多くの均衡をサポートできます。通常、そのような罰は、送信者に、そうでなければ最高の応答ではない戦略を実行させるのに十分です。

たとえば、スペンスの古典的な雇用市場のシグナル伝達ペーパーには、能力の高い個人は教育に投資する均衡があります（学習は彼らにとって簡単です）が、能力の低い個人はそうしません（そうすることは費用がかかりすぎるためです）。その場合、教育は能力のシグナルです。このゲームには、誰も教育を受けようとせず、情報が受信者に送信されないという均衡もありますか？答えは「はい」です。送信者が教育を受けた逸脱が、受信者に送信者が確かに低能力であるという信念を採用させると言うことによって、そのような均衡を支持することができます。教育に能力の低さを伝える効果がある場合は、もちろん、誰もが推定均衡と一緒に遊んで満足し、教育を受けられません。

また、この均衡はあまり妥当ではないことも明らかです。受信者は、高能力のエージェントが低能力のエージェントよりも教育を受ける方が費用がかからないことを知っているので、考えることはあまり意味がありません。低能力を示す教育として。直感的な基準は、信念が次の意味で「合理的」であることを要求することにより、この種の均衡を排除します。

受信者が平衡からの逸脱を観測すると仮定します。次の両方が当てはまる場合、受信者は送信者がタイプであると信じてはなりません。 $t_{\text{bad}}$

彼が何らかの信念のために平衡に固執している場合、偏差はタイプを悪化させる結果になります。 $t_{\text{bad}}$

以外の何らかの信念のために平衡に固執するよりも偏差を再生するほうが良いタイプがあります。 $t_{\text{good}}$ $t_{\text{bad}}$

教育シグナル伝達モデルに戻る：均衡は、誰も教育を受けないということであり、受信者は、教育を受けることへの逸脱が低い能力を示すと信じていると仮定します。これらの信念を予想して、能力の低い労働者は逸脱することにより悪化します。なぜなら、彼は教育の費用を被るだけでなく、結果として悪いタイプと考えられるからです。したがって、条件1が満たされます。

高能力労働者が教育を受けることから逸脱したいと思うような、別の信念を見つけることができますか？答えはイエスです。受け手が教育が高い能力を示すと信じているなら、この逸脱はハイタイプにとって本当に有益です。したがって、条件2も満たされます。

両方の条件が満たされているため、直感的な基準は、信じられないほどのプーリング平衡を除外します。

— ユビキタス
ソース

すみません、これはとても冗長です。不明な場合や、もっとフォーマルなものが必要な場合はお知らせください。それに応じて編集します。

— ユビキタス

詳細な回答をありがとう。「オフバランス」の除去が数学的に明らかな単純なモデルを追加することもできれば幸いです（別の答えとして）。

— ブラボー14年

1

別の回答に（非常に）定型化されたモデルを追加しました。また、この答えの引用ボックスのポイント1を編集して、直観的基準の定義で作成したエラーを修正しました。

— ユビキタス

6

以下は、私のあまり正式ではない答えを補完する簡単なモデルです。

$H$ $L$ $1/2$ $\pi_H>\pi_L$ $i$ $c_i$ $\pi_H-c_L<\pi_L$ $\pi_H-c_H>(\pi_H/2)+(\pi_L/2)$

ゲームは次のとおりです。労働者は自分のタイプを観察し、教育に投資するかどうかを決定します。次に、雇用主は、労働者が投資したかどうかを観察し、生産性に関する信念に基づいて競争力のある賃金を提示します。

ゲームの次の2つの完全なベイジアン平衡（PBE）を考慮してください。

$H$ $L$ $\Pr(H)=1$ $\pi_H$ $\Pr(H)=0$ $\pi_L$

これが均衡であることを確認できます。タイプHのペイオフはです。彼が教育を受けていない場合、彼のペイオフはです。タイプのペイオフはです。彼が教育を受けない場合、彼の報酬はです。したがって、どちらのタイプも逸脱することを望みません。労働市場は競争が激しいため、賃金の申し出は信念を考えると（ごくわずかに）最高の反応です。最後に、信念はベイズのルールとゲームの均衡プレイと一致していることに注意してください。 $\pi_H-c_H$ $\pi_L$ $L$ $\pi_L$ $\pi_H-c_L<\pi_L$
（プール平衡）どちらのタイプも投資しません。教育が観察され、賃金を提供する場合、雇用主は信念を更新します。雇用主は、の事前の信念に固執し、教育が観察されない場合は賃金を提供します。 $\Pr(H)=0$ $\pi_L$ $\Pr(H)=1/2$ $(\pi_H/2)+(\pi_L)/2$

これも平衡であることを確認しましょう。教育は費用がかかりますが、雇用主の平衡に関する信念に悪影響を与えるため、どちらのタイプも教育を受けるのが最適です。ベレイフと労働市場の競争力を考えると、推定賃金の申し出は最適です。教育が観察されない場合、信念 1/2はベイズの規則と一致します（この観察結果には労働者のタイプに関する新しい情報が含まれていないため）。最後に、教育への（均衡から外れた）投資の場合、ベイズの規則は信念を固定しないため、PBEの定義によれば、私たちは好きな信念を自由に指定できます。 $\Pr(H)=1/2$

直感的な基準は平衡数2を除外します。最初に、タイプが教育を受けることから逸脱する場合、彼が得ることができる最良のはです。第二に、タイプが教育を受けることから逸脱し、雇用主がいくつかの事後信念採用すると仮定します。逸脱しているタイプのは、です。偏差が有益になるように。したがって、直観的な基準は、信念が教育への投資への逸脱に対して合理的ではなく、そのような信念に依存する均衡をとることができないという規則です。 $L$ $\pi_H-c_L<\pi_L$ $H$ $\Pr(H)=1$ $H$ $\pi_H-C_L>\pi_L$ $\Pr(H)=0$

実際、このゲームには他のプーリング均衡があります。たとえば、雇用主が教育を遵守するかどうかに関係なく、雇用主が以前の信念に固執するプーリング均衡があります。これ（および他のすべてのプーリング平衡）も直感的な基準によって除外されています。理由は、誰も教育されていない均衡からの逸脱はすべて型に支配されるため、直感的な基準では雇用主が教育を型に関連付けないことを要求するからです。したがって、教育が型に関連付けられることを考えると、型が教育なしの均衡から逸脱することは有益です。 $L$ $L$ $H$ $H$

— ユビキタス
ソース

4

かつて、正準信号モデルとシンプソンズを使用して、Kreps基準の例を書いたことがあります。@Ubiquitousの答えと同じ線に沿っていると思いますが、あまり正確で一般的ではありません。しかし、私はシンプソンズの文脈が教育学的設定に役立つかもしれないと思った。

Hank Scorpioが、観察された教育に応じてGlobex Corporationの従業員の賃金スケジュールを決定しなければならないとします。2件の候補があります：マーティン・プリンス、小学校度を持つ（「高」のための）タイプ、およびホーマー、スプリングフィールド大学から学位を持つ（「低」のための）タイプ（参照のシーズン5 、エピソード3 }）。 $H$ $e_1$ $L$ $e_2 > e_1$

考えられる3番目の信号は、MITから核物理学の博士号を取得することであり、これをと表します。 $e_3 > e_2$

Scorpioが、低学歴レベルに関連する生産性がおよびと考えているとし。これは逐次平衡を形成すると仮定します。つまり、この平衡では、マーティンもホーマーもMITから博士号を取得する価値はありません（Krep基準を説明する時点で、すでに逐次平衡をカバーしていると思います）。 $\rho(e_2) > 0$ $\rho(e_1) = 0$

Martinはを取得するのにそれほど努力する必要はありません（子供の発電所の競争、シーズン8、エピソード23を参照）。場合はそうすることを気にしません。一方、ホーマーは、MITから博士号を取得することは彼にとって大きな痛みになるため、があっても、を使用するよりもを使用する方がはるかに優れています（前述のエピソードを参照）。 $e_3$ $\rho(e_3) = 1$ $e_2$ $e_3$ $\rho(e_3)$ $1$

ので平衡である、彼の博士号を取得からマーティンを阻止するために十分に小さくなければなりません。これは、を選択するがタイプであるという事実に高い確率を付けていることを意味します。この均衡は合理的な信念によって支えられていますか？Kreps基準に従っていない：蠍座はホーマーが取得しようとすることはないことを知っているという仮定の下でマーティンはなって気にしないだろうが蠍座は誰かなって観察した場合、、彼は論理的にこの人がマーティン、であることを推測することができタイプ。 $(e_1,e_2,\rho)$ $\rho(e_3)$ $e_3$ $L$ $e_3$ $e_3$ $e_3$ $H$

— マーティン・ファン・デル・リンデン
ソース