ベイジアン学習者のマージ率の均一な限界


7

更新。Cross Validatedにクロス投稿されました。

よく知られた論文で、Blackwell&Dubins(1962)は、メジャーイベントに事前確率が一致する2つのベイジアンエージェントの事後確率が0、増加する情報の流れの下で互いに任意に近づくことを示しています。

数学的には、結果は次のようになります。ましょう用いて濾過確率空間である。LET上の確率であると。次に、 PQは強く融合していると 言います。F NF P Ω FQ « PのD P NQ N= SUP A F | P A F nQ A F n| Q  として  0ΩF{F}QFFPΩFQP

dPQ:=supF|P|FQ|F|0 なので Q なので 
PQ

より最近の非常に影響力のある論文で、Kalai&Lehrer(1994)は弱いマージの概念を紹介しています。定義は上記と同じですが、が有限の地平線のイベントをとった場合を除きます。テールイベントは無視されます: sup

wPQ:=supF+1|P|FQ|F|0 なので Q なので 

弱いマージの場合、収束率の均一な境界を見つけることができます(Fudenberg&Levine、1992; Sorin、1999)。この方向で強力なマージの結果があるかどうか疑問に思っています。


これは、Cross ValidatedまたはMathematicsに移動する必要があります。これらの取締役会の人々は、制限機能に収束する一連の機能に関する特定の論文を知っているでしょう。これは私が取り組んでいる質問に関連しているので、私は答えに非常に興味があります。私は何も知りません。
デイブ・ハリス

@DaveHarris残念ながら、MSEのスタッフはこの文献にあまり慣れていないようです。以前、Blackwell&Dubinsについて質問したことがあります。質問をここに残してはいけませんか?弱いマージは、経済学者によって経済学ジャーナルで広く議論されています。もちろん、この件名は、ここに掲載されている平均的な質問よりも少し専門的かもしれないことに同意します。

知りません。このグループにとって少し難解な場合は、ここで有効な質問です。このための狭い聴衆があります。一部には、ゲームのライフだけでなく、情報、好み、インセンティブについても強力で暗黙的な仮定があるためです。地球の進化と真円度の両方について任意の大きなサンプルがありますが、今週はケンハムとフラットアースキャバリエの両方がニュースになりました。無限は長い時間です。
デイブ・ハリス

確かにそれは長い時間です。そして、それがまさに私がマージの割合をよりよく理解したい理由です。とにかく、Cross Validatedに投稿するというあなたの提案は良いものだと私は思います。これは未解決の問題だと思いますが、うまくいけば、いくつかのリードが出​​てくるでしょう。

回答:


0

Acemoglu、Chernozhukov、Yildizによるこの論文(2016)とその中の参考文献は興味深いかもしれません。

彼らが導き出した結果ははるかに限られた環境でのものですが、私はまだあなたが探している方向に向かってジェスチャーをしていると思います。そうでなければ、彼らの文献レビューも有用であると判明するはずです。


簡単な答えをお詫びします-このトピックは私には少し遠く離れています。しかし、それでも多少は役立つと思います。
理論経済学者

これをありがとう。私は数日以内にそれを読んで、関連する結果について報告しようとするでしょう。

すごい; 教えてください。私も知りたいです。そして、私はそれらの結果がどれほど限られているかについて早すぎる話をしたかもしれません-少しスキミングすることは、それが当初考えていたよりもブラックウェルとデュビンの公式に近いことを示唆しています。
理論経済学者

モデルを見て、すべての結果ではないので、彼らは少し異なった現象に興味があるようです。彼らは非公式にp.193で説明しています。それでも、論文は面白そうだし、私はおそらく読み続けます。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.