レシーバーはいつシグナリングゲームのアクション間でランダム化する必要がありますか?


10

有限のメッセージ空間M、有限のアクション空間A、および有限の型空間持つシグナリングゲームがあるとしますT。さらに簡単に言えば、すべての送信者タイプの設定は同じです(受信者は異なるタイプに応じて異なるアクションを優先するだけです)。受信機は、応答全体をランダム化することにより、厳密にうまくいくことができますか?レシーバーが純粋なアクションをとるだけの均衡が存在する場合?

ユビキタスは私の質問をうまくまとめました、「最高のレシーバーペイオフを伴う均衡が必然的に混合戦略を伴うということはありますか?」

逐次均衡を見てみましょう。最初にいくつかの表記法が必要な場合。

σt(m)確率であるtT送信するmM

σRm(a)へ受信応答確率であるmA μ メートルΔ Tは、観察した後、受信者の信念を与えるメートルをaA. μmΔTm

逐次均衡が必要ですσt与えられたギブ最適な応答σRσR最適与えられているμμベイズ与えられていますσ。これは実際には弱いシーケンシャルの定義ですが、シグナリングゲームには区別がありません。

私の直感は、レシーバーが純粋なアクションのみを再生する均衡が存在する場合はノーと言いますが、私は常にこの種のものに恐ろしかったです。たぶん、私たちはそれがゼロサムゲームではないことを規定する必要があるかもしれませんが、私はプレイヤーがそれらのゲームでランダム化する能力でより良いことを覚えているのでそれを言っているだけです。おそらくこれはどこかの紙の脚注でしょうか?

送信者の設定が同一でない以下のゲームを考えてみましょう。低品質であることをお詫びします。送信者には3つのタイプがあり、それぞれの可能性は同じです。メッセージ1の受信時にランダム化される場合にのみ、レシーバー(プレーヤー2)の最適な平衡状態であると考えられるものを作成できます。次に、タイプ1と3がを再生し、分離平衡状態を作成します。レシーバーがm 1に応答して純粋な戦略を使用する場合、タイプ1または2は逸脱し、レシーバーを悪化させます。m2m1

σRm1(a)=.5=σRm1(r)=.5

ここに画像の説明を入力してください


タイプの関数として受信者が実行するアクションは、送信者が送信するメッセージに影響を与えますか、それともこれらは独立していますか?
Martin Van der Linden

どういう意味かよくわかりません。レシーバータイプは1つです。彼らの戦略は、メッセージをアクション上の分布にマッピングします。送信者が最良の応答をしている限り、メッセージに影響を与えます。
Pburg 2014年

2
αα

@ユビキタスそれは私には理にかなっていますが、私はいくつかの奇妙な病理学的事例があるのではないかと思っていました。たとえば、「完全な再現を伴う有限大規模ゲームにおけるペイオフの一般的な選択の場合、ペイオフは連続均衡の各接続されたコンポーネントで一定です」という定理を見つけるだけでした。一般的な警告は私を不思議に思いました。
Pburg 2014年

1
@Pburgはい、わかりました。さまざまな質問があったようです。私は、「特定の送信者戦略に対する受信者の一意の最良の応答が混合戦略であるケースはありますか?」と考えていましたが、あなたの質問は、実際には混合戦略?」
ユビキタス

回答:


3

おそらく私は反例を持っています!

m1,m2,m3t1,t2,t3Pr(t=t3)=12ϵPr(t=t2)=14Pr(t=t1)=14+ϵm30

メッセージに対する受信者の応答のセットはm=m1,m2{a,r}

ut(a,m1)=1>ut(a,m2)=β>ut(r,)=0

uR(t1,m1,a)=uR(t2,m2,a)=2、、uR(t3,mi,a)=1

uR(t2,m1,a)=uR(t2,m1,a)=0、、uR(t3,mi,r)=2

uR(t1,mi,r)=uR(t2,mi,r)=1です。

次に、平衡状態では、すべての送信者が同じユーティリティを取得する必要がありますよね?そうでなければ、一方は他方の戦略を真似ることになります。

したがって、唯一の純粋な戦略の均衡は、すべての送信者がを選択すること。またはプーリング平衡では、を選択するのが最良の応答です。とが送信し、受信側が応答する場合を除いて、均衡を分離する純粋な戦略はありません。その場合、はすべてのメッセージに無関心です。なぜなら、ペイオフ確実に満たされるからです。これらすべてにより、レシーバーのペイオフはm3m1m2rt1t2m2rt3032ϵ

次に、およびの場合を考え現在、送信者はこれら2つのメッセージの送信に無関心です。次に、および for。次に、受信者戦略は合理的です。σRm1(a)=βσRm2(a)=1.σt3(m1)=ϵ+1/4ϵ+1/2=1σt3(m1)σti(mi)=1i=1,2

またはが与えられ場合のからの受信者の期待効用は1.5です。与えられからの期待されるユーティリティは1.5をわずかに上回ります。したがって、事前に予想されるペイオフはを上回っており、上記の純粋な平衡状態よりも優れています。さらに、この分離は混合によってのみ維持されます。受信者が採用した他の純粋な戦略は、送信者のプーリングを引き起こします。つまり、純粋な戦略の均衡は、受信者が選択したときだけです。m1arm2a32ϵr

私が持っている必要がありますに左側の差出人のペイオフについては、以下の絵で秒。が重要な要素だと思います。βaβ<1

ここに画像の説明を入力してください


3

これは、リスクを嫌う送信者、リスクが中立的な受信者、そして十分に豊かなは起こり得ないと思います。A

たとえば、標準的なシグナリングモデルに固執するために、が正の実数線であり、送信者のユーティリティがで増加し受信者の線形ユーティリティが減少してと仮定します。Auaa

(確かに、フレームワークは質問のフレームワークよりも一般的ではないため、これは部分的な答えにすぎません。それでは満足できないかもしれません。これらの仮定に問題がなかった場合のために、私はまだ議論を提供します)

矛盾を導き出すために、平衡でおよびがいくつかのについてあると仮定します。しましょうσRm(a)>0σRm(a)>0aaA

aσRm(a)σRm(a)+σRm(a)a+σRm(a)σRm(a)+σRm(a)a.

リスク回避によって

u[a]>σRm(a)σRm(a)+σRm(a)u(a)+σRm(a)σRm(a)+σRm(a)u(a).
[σRm(a)+σRm(a)]u(a)>σRm(a)u(a)+σRm(a)u(a).

いくつかの連続性の仮定の下では、

a<a

そのような

[σRm(a)+σRm(a)]u(a)=σRm(a)u(a)+σRm(a)u(a).

したがって、次のように構築された検討してください。σRm

  • σRm(a)=σRm(a)=0
  • σRm(a)=σRm(a)+[σRm(a)+σRm(a)]
  • 他のすべての場合、a~σRm(a~)=σRm(a~)

受信者は、送信者が送信する信号を変更しない場合、よりもをます。これは、予想される補償が低いためです。ただし、構造上、送信者はとしないため、と同じ信号を送信する必要があります。したがって、は平衡になり得ません。これは、平衡で正の確率で2つの異なるアクションを実行できないことを示しています。σRmσRm σRmσRmσRmσRm


このモデルでは、レシーバは常に選択だけではありませんか?a=0
Pburg 2014年

必ずしもそうではありません。受信機は常にchosesがいる場合は信号を問題では、彼女が「高い」信号谷彼らのタイプを明らかにし、「高い」タイプを奨励しません。これは、プーリング平衡では最適ですが、分離平衡では最適ではありません。たとえば、Mas-Colell、Whinston、Greenのセクション13.Cを参照してください。ただし、セットアップはあなたとは少し異なります(たとえば、異なるタイプの労働者をめぐって競合する2つの会社があります)a
Martin Van der Linden '26

それでは、「レシーバーの線形効用が減少する」とはどういう意味ですか?
Pburg 2014年

すみません、はっきりしていませんでした。私が念頭に置いているSpenceシグナリングモデルでは、受信者が取るアクションは、送信者に賃金wを支払うことです。受信機ユーティリティは、送信機のタイプtから支払われる賃金t-wを差し引いたものに依存します。基本的に、受信者はリスクに中立です。彼女は、彼女が支払う必要のある予想される賃金と、彼女が採用する予想されるタイプのみを気にします。
Martin Van der Linden

さて、私はこれを二次損失として見たと思います提案に感謝しますが、私はもう少し一般的ですが、個別のアクションがあるものを探しています。(tw)2.
Pburg 2014年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.