このサンクトペテルブルクパラドックスに対する決議案の何が問題になっていますか?


8

私たちはあなたのペイアウトがであるゲームを持っています。ここではコインを弾いてヘッドに着地した回数です(最初のフリップがヘッドの場合は)。予想される支払いは次のとおりです k k = 1 E = 12kkk=1E=1+1+1+E=

E=12(2)+14(4)+18(8)+...
E=1+1+1+...
E=

このゲームをプレイするためにいくら払えばよいですか?

まあ、幾何学的分布から、頭が出るまで反転するコインの予想数は次のとおりです。

1P(HEAD)=1.5=2

だから私はで未満のものを支払います: k = 22kk=2

つまり、4ドル未満

参照用にhttps://en.wikipedia.org/wiki/St._Petersburg_paradox


「まあ」は参照が必要です。「期待される」はどこから来るのか-合計を説明する前に単一の例を挙げてください。実際の質問を太字にします。「頭が出るまでの予想時間」を増やす方法を見つける...シミュレーションをお勧めします。頭を数えたフリップはありますか?ひっくり返して頭を出した場合、その前に0ですか、それとも1つ前ですか?「平均」だけでなく「最大」を考慮したことを証明できますか?正しい尾はどこにありますか?ケリー基準?(en.wikipedia.org/wiki/Kelly_criterion
EngrStudent

4
ギャンブルを4 ドルで評価する場合、サンクトペテルブルグギャンブルの短縮版をプレイするために5 ドル払って、最大で10ラウンド行くことができますか?対処?
Matthew Gunn、2016

@EngrStudentフリップの「期待される」数は、幾何確率変数の平均と同じです。私は、{0,1,2、...}または{1,2,3 ...}のどちらを使用しているかについてより明確にする必要があるという点であなたは正しいと思います。
colorlace 2016

@MatthewGunnトウシュ
colorlace

回答:


19
  • してみましょういくつかのランダムな変数です。K

    • あなたの問題では、は頭を出す前にあなたがフリップした回数です。K
  • してみましょう、いくつかのペイオフ関数とします。f(k)

    • あなたの問題ではです。f(k)=2k
  • してみましょうペイオフことf(K)

ギャンブル妥当な評価はによって与えられると言っています。これは、完全にアドホックで、やや原理のないヒューリスティックです。おそらく一部の状況(たとえば、が小さく、線形に近い場合)では問題ないかもしれませんが、意味のない何かを示唆する例を構築するのは簡単です。f(K)f(E[K])Kf

システムがまったく意味をなさない例

LET正規分布から延伸することと利得関数は、であるとする。あなたのシステムは、ため、私はこのギャンブルにを超えて支払うべきではないと言ってい。しかし、あなたはこのギャンブルに正の値を割り当てるべきではありませんか?!ペイオフがゼロより大きい確率は100%です!KN(0,10000000000000)f(K)=K20f(E[K])=02=0

サンクトペテルブルクパラドックスのより古典的な解決策

1つのアプローチは、リスク回避を追加することです。あなたが十分にリスクを嫌うならば、あなたがこの無限の期待ギャンブルをプレイするために支払うことをいとわないものは有限です。あなたが受け入れるとフォン・ノイマン-Morgernstern公理を、そして確実性等価ゲームをプレイするのは、次式で与えられる場所:z

u(w+z)=E[u(w+f(K))]

ここで、は資産で、は凹面関数(専門用語ではベルヌーイ効用関数)であり、リスク回避のレベルをキャプチャします。が十分に凹型である場合、評価は有限になります。u u 2 Kwuu2K

いくつかの素晴らしいプロパティを持つベルヌーイユーティリティ関数は、ことが。最大化期待効用ベルヌーイユーティリティ機能は、あなたの富のログがあなたの富の期待成長率を最大化することと等価であるです。単純なバイナリベットの場合、これはケリー基準の賭けを提供します。u(x)=log(x)

他の重要な点は、リスク回避アプローチでは、ギャンブルのどちら側にいるかによって、同等の確実性がもたらされるということです。


2
(+1)さらに、ペイオフの分布を指定してもと一意に決まるわけではないため、最初の段落で説明したヒューリスティックでは、正規の表現を推定する方法が必要になります。f f K Kff(K)
Juho Kokkala 16

2

その提案された解決策には何の問題もありません。

元のパラドックスでは、無限の利益の期待値(平均)を見ているので、無限の額を賭ける必要があります。ただし、コインを最初に投げた後、50%の確率でお金を失ったため、人々はそれを好まないのです。あなたの決議はこれを形式化するだけで、平均利益を見るのではなく、利益の中央値を見るのです。平均利益とは異なり、中央値の利益は有限であり、パラドックスはなくなります。


2
利益の中央値が関係するのはなぜですか?次のギャンブルを想像してみてください:何も得られない場合の1%、100万を得る場合の1%、1を得る場合の。and98
Daerdemandt

@Daerdemandt過度に依存していることがこの「パラドックス」の原因です。このようなゲームに莫大な額を賭けた場合、破産する可能性が50%あり、数百万人が勝つ可能性があります。破産を避けようとするのは不合理ではない。
Hugh

無制限のお金>巨大なお金。したがって、金銭的には、ゲームに任意の時間をかけて問題がなければ、プレーするのはかなり合理的です。これらは、統計的な問題をより現実的なものとしてフレーム化するために私たちが行う仮定です。現実的には、無制限のお金を取得するためにいくつかの生涯を待つのに苦労します、お金の限界効用はあなたが持っているお金の量に依存する可能性があります(そして、あなたはユーティリティ機能を欠いている可能性もあります)-そしてあなたは見知らぬ人とかなり懐疑的です無制限のお金を獲得するためにギャンブルすることを提供しています。しかし、これらすべては統計の範囲外です。
Daerdemandt 2016

1
一般的にいいえ、私たちはする必要はありません。同様の種類の統計問題では、私たちは期待されています。(ここにゲームがあります、プレイするのにいくらかかりますか?)お金は問題をより退屈にしないための単なる綿毛です。綿毛に挑戦したい場合は自由ですが、それは統計の範囲外です。
Daerdemandt 2016

1
人々が一般的に「パラドックス」という言葉に特定の十分な意味を付けているかどうか正確にはわかりません。これは、使用されている抽象化の一部を拡張する仮想の状況です。これらの抽象化が完全ではないことを示すことは有用です。その読書で、私は個人的に他のいわゆる「パラドックス」でこの状況をひとまとめにします、あなたの用法は異なるかもしれません。
Daerdemandt 2016

2

私が正しく理解していれば、あなたの分析は:

  1. 頭を出すのに必要なコインフリップの予想数を計算します。
  2. 正確に期待される数が得られる結果の支払いを計算します。
  3. そのペイアウトに等しいゲームを評価します。

...さて、そのゲームを少し変更しましょう。元のバージョンと同じように、私はコインを投げ、頭を投げるまで投げ続けます。支払いのみが変更されました:

  • セカンドスローで頭をひっくり返すと、4ドルになります。
  • 上の任意の他の結果、あなたが所有するすべてを失うと自由のために、永遠に私のために仕事を来ています。

頭を出す前にいくつのコインを裏返すと思いますか?2、前とまったく同じ。

2枚のコインをめくって表を出した結果のペイアウトは?$ 4.00、以前とまったく同じです。

75%の確率で破産し、25%の確率で$ 4.00を返すこのゲームに支払う「特権」に対して、いくら支払ってもよいでしょうか。

その答えは「以前とまったく同じ4ドルまで」ではないのではないかと思います。つまり、ロジックに穴があるということです。

より広い見方をすると、予想される賞金は必ずしもこの種の質問に答えるのに十分な情報ではありません。通常、これは追加のコンテキストに依存します。これは1回限りの機会ですか、それともこのギャンブルが何度も提供されることを期待していますか?手持ちのお金はいくらですか?そして、あなたは幸せになるためにどのくらいのお金が必要ですか?

たとえば、私の総資産が100ドルであるが、救命活動に100万ドルを緊急に必要とする場合、サンクトペテルブルクの賭博で一発ですべてのお金を喜んで支払うでしょう。必要なお金を獲得できる確率は1/2 ^ 19ですが、プレーしなければチャンスはまったくありません。

一方、私の総資産が10万ドルで、その操作に100万ドルが必要な場合、1回のゲームに支払う金額の最大は2ドルです(これで確実に勝つことができます)。 。それ以上、そして人生を救うために必要な100万ドルに満たない可能性が1/2あります。

そのようなゲームをプレイする機会がたくさんあると予想している場合は、おそらくすべてのゲームの終わりにたくさんのお金を稼ぐ可能性が高い戦略を選択したいと思うでしょう。例えば:

ゲームAでは、プレイするたびに富が10%増えることが保証されています。(予想勝率:現在の資産の+ 10%)ゲームBには、資産が2倍になる可能性が90%、破産する可能性が10%あります。(予想される勝利:現在の富の+ 70%。)[編集:基本的な計算で失敗するため、実際には+ 80%ですが、議論はまだ続きます。]

ゲームAを100回繰り返してプレイすると、資産を13,780倍に増やすことができます。

ゲームBを100回繰り返すと、0.0027%の確率で想像を絶するほど裕福になる(約10 ^ 30 x最初の数倍)...と99.73%の確率で破産する。にもかかわらず平均はより良いゲームAよりも、それは良い選択肢ではありません。

この種の頻繁に繰り返されるゲームでは、各ゲームで期待される勝利を最大化しようとするのではなく、ln(ゲーム後の総資産/ゲーム前の総資産)の期待値を最大化するほうがよいでしょう。これにより、一掃されることなく長期的な成長が保証されます。

すべてのゲームの賭け金が私の総資産と比較して小さい場合、これは各ゲームの予想される勝利を最大化することとほぼ同じです。

したがって、多くのゲームをプレイしていて、現在の富の大部分を危険にさらすことがない場合は、ギャンブルの期待値から、知っておく必要のあることがすべてわかります。他の状況では、他のことについても考える必要があります。


1
+1基本的な根本的な問題のいくつかに本当に到達する思慮深い回答に感謝します。当サイトへようこそ!
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.