最も興味深い統計的パラドックス


回答:


100

それ自体はパラドックスではありませんが、少なくとも最初は不可解なコメントです。

第二次世界大戦中、アブラハムウォルドは米国政府の統計学者でした。彼は任務から戻った爆撃機を見て、飛行機の弾丸の「傷」のパターンを分析しました。彼は、海軍が飛行機に損傷がなかったエリアを強化することを勧めました。

どうして?職場では選択効果があります。このサンプルは、観察された領域に与えられた損傷に耐えることができることを示唆しています。どちらの飛行機も手つかずの領域で命中することはなく、ありそうもない命題であったか、それらの部分への攻撃は致命的でした。戻ってきた飛行機だけでなく、下がった飛行機も気にかけます。倒れた人々は、生き残った人々に触れられていない場所で攻撃を受けた可能性が高い。

彼のオリジナルのメモのコピーについては、こちらを参照してください。最新のアプリケーションについては、このScientific Americanのブログ投稿を参照してください。

このブログ記事によると、第一次世界大戦中にテーマを拡張して、ブリキのヘルメットの導入により、標準的な布製の帽子よりも多くの頭の傷ができました。新しいヘルメットは兵士にとってより悪いものでしたか?番号; 負傷者は多かったが、死亡者は少なかった。


3
私は以前にこれをいくつかの場所で読んだことを思い出しますが、手元に参考文献はありません。追加できるものはありますか?
枢機

1
@枢機,、私はあなたのためにいくつかのメモを見つけました。調査は実際に米国向けであったようです
チャーリー

どこかに、この例の仮想飛行機の散布図がありますが、私はそれを見つけることができません。
フォマイト

+1。これは、おそらく最も有害なバイアスであるサバイバーシップバイアスの例です。私は答えでそれを拡大しました。
クリフAB

47

もう1つの例は、生態学的な誤acyです。

例では
、我々は(千)状態の平均的な収入に当時のオバマ上院議員のための投票のシェアを回帰することにより、議決権と所得の関係を探しているとします。切片は約20、勾配係数は0.61になります。

多くの人は、この結果を、所得の高い人ほど民主党に投票する可能性が高いと言っていると解釈します。確かに、人気のある新聞はこの議論をしました。

しかし、ちょっと待ってください。金持ちは共和党員である可能性が高いと思いましたか?彼らです。

このリグレッションが私たちに本当に伝えていることは、豊かなが民主党に投票する可能性が高く、貧しいが共和党に投票する可能性が高いということです。特定の州内では、金持ちは共和党に投票する可能性が高く、貧しい人は民主党に投票する可能性が高くなります。Andrew Gelmanと彼の共著者の作品をご覧ください。

さらに仮定がなければ、グループレベル(集計)データを使用して、個人レベルの動作に関する推論を行うことはできません。これは生態学的な誤acyです。グループレベルのデータは、グループレベルの動作についてのみ伝えることができます。

個人レベルの推論に飛躍するには、恒常性の仮定が必要です。ここで、個人の投票の選択は、州の収入の中央値によって体系的に変化することはほとんどありません。裕福な州で$ X を稼ぐ人は、貧しい州で$ X を稼ぐ人と同じくらい民主党員に投票する可能性があります。しかし、コネチカット州の人々は、すべての収入レベルで、ミシシッピ州の同じ収入レベルの人々よりも民主党に投票する可能性が高いです。したがって、一貫性の仮定に違反し、間違った結論に導かれます(集約バイアスにだまされます)。

この話題は故デビッドフリードマンの頻繁な趣味でした; たとえば、このペーパーを参照してください。その論文では、Freedmanはグループデータを使用して個人レベルの確率を制限する手段を提供します。

シンプソンのパラドックスとの比較
このCWの他の箇所では、@ Michelleはシンプソンのパラドックスを実際の良い例として提案しています。シンプソンのパラドックスと生態学的誤fallは密接に関連していますが、はっきりしています。2つの例は、与えられたデータと使用された分析の性質が異なります。

シンプソンのパラドックスの標準定式化は、双方向表です。ここの例では、個人データがあり、各個人を高所得または低所得に分類するとします。合計の投票ごとの2x2分割表を取得します。低所得者の割合と比較して、高所得者の割合が民主党に投票した方が高いことがわかります。各状態の分割表を作成する場合、逆のパターンが表示されます。

生態学的な誤acyでは、収入を二分(または多分)変数に崩壊させません。州レベルを取得するには、州の平均収入(または中央値)と州の投票シェアを取得し、回帰を実行して、所得の高い州が民主党に投票する可能性が高いことを確認します。個人レベルのデータを保持し、状態ごとに個別に回帰を実行すると、逆の効果が得られます。

要約すると、違いは次のとおりです。

  • 分析モード:SAT準備スキルに従って、シンプソンのパラドックスは分割表に対するものであり、生態学的な誤acyは相関係数と回帰に対するものであると言えます。
  • 集約の程度/データの性質:シンプソンのパラドックスの例では2つの数値(高所得者の民主投票率と低所得者の同じ値)を比較しますが、生態学的誤りは50個のデータポイント(つまり、各州)を使用して相関係数を計算します。シンプソンのパラドックスの例から完全なストーリーを得るには、50の状態のそれぞれからの2つの数字(100の数字)が必要です。一方、生態学的な誤inの場合には、個人レベルのデータが必要です状態レベルの相関/回帰スロープ)。

一般的な観察
@NeilGは、これは単に、回帰における観測不可能な変数または省略された変数バイアスの問題を選択できないと言っているように見えるとコメントしています。そのとおり!少なくとも回帰の文脈では、ほぼすべての「パラドックス」は、省略された変数バイアスの特殊なケースにすぎないと思います。

選択バイアス(このCWに関する他の応答を参照)は、選択を駆動する変数を含めることで制御できます。もちろん、これらの変数は通常観察されず、問題/パラドックスを引き起こします。スプリアス回帰(他の応答)は、時間傾向を追加することで克服できます。これらのケースは、本質的に、十分なデータはあるが、より多くの予測子が必要であると言います。

生態学的な誤acyの場合、それは本当です、より多くの予測子が必要です(ここでは、状態固有の勾配と切片)。ただし、これらの関係を推定するには、グループレベルではなく個別レベルの観測値も必要です。

(ちなみに、私が提供する第二次世界大戦の例のように、選択変数が治療と制御を完全に分割する極端な選択がある場合、回帰を推定するためにより多くのデータが必要になる場合があります。


一貫性の仮定を形式化するにはどうすればよいですか?モデルから欠落している(因果関係の)交絡因子がないと仮定するように聞こえます。
ニールG

2
また、州の条件付けは所得と政党の相関を逆転させるため、提供された例はシンプソンのパラドックスの例でもあります。生態学的な誤acyはシンプソンのパラドックスとはいつ違うのですか?
ニールG

また、個人レベルの関連性または因果関係に基づいて、グループレベルの関連性または因果関係について推論を行うことも悪いことです。 (1998)。コンテキストを疫学に戻す:マルチレベル分析における変数と誤fall。American Journal of Public Health、88(2):216–222。
アレクシス14

43

私の貢献はシンプソンのパラドックスです:

  • パラドックスの理由は多くの人々にとって直感的ではないため、
  • 調査結果が人々を平易な英語で横たわらせる方法である理由を説明するのは本当に難しい場合があります。

    tl; drバージョンのパラドックス:結果の統計的有意性は、データの分割方法によって異なるように見えます。原因はしばしば交絡変数によるものと思われます。

パラドックスの別の良い概要はこちらです。


4
+1、私はそれを自分で置くことを考えました。興味のある方のために、SimpsonのパラドックスについてもCVで説明しています。stats.stackexchange.com
gung

3
このmath.SEの質問で言及されたシンプソンのパラドックスの例がいくつかあります。
マイクスパイビー

32

統計にはパラドックスはなく、解決されるのを待っているパズルだけです。

それにもかかわらず、私のお気に入りは2つの封筒「パラドックス」です。私はあなたの前に2つの封筒を置き、1つが他のものの2倍のお金を含んでいると言ったと仮定します(しかしどちらはどちらではありません)。次のように推論します。左エンベロープが含まれているとし、次いで、50%の確率で正しいエンベロープに含まれる、50%の確率でそれが含むの期待値は、。しかし、もちろん、エンベロープを単純に反転して、代わりに左エンベロープに右エンベロープの値の倍の値をことができます。どうした?2 x 0.5 x 1.25 x 1.25x2x0.5x1.25x1.25


素晴らしいパラドックス-興味深いことに、ウィキペディアで「2番目」の解釈を行ってを計算しようとすると、切り替えの優先順位を防ぐために必要になることがわかります。ここで、です。を解くことは、を取得することを意味します。同様に、を計算できます。ここで、を取得し、 .... Bizzare!E [ B | A = a ] = a = 2 a p + aE[B|A=a]p=PrA<B|A=app=1E[B|A=a]=a=2ap+a2(1p)p=Pr(A<B|A=a)pp=13E[A|B=b]=b=2bq+b2(1q)q=Pr(B<A|B=b)q=13
確率論的

6
ゲームが実際に観客と実際の金額でプレイされるこのパラドックスについてプレゼンテーションを行いました(通常、ホスト機関への小切手)。それは...彼らの注意を取得します
whuberの

私はこれを解決したと思います...パラドックスは、2つのエンベロープパラドックスが間違って提案していることを認識したときに解決されます1)3つの可能な量があります:0.5x、x、および2x 2x)、および2)左エンベロープにxが含まれていることをアプリオリに知っていること(この場合、右エンベロープには100%の確実性で2xが含まれます!)。2つのエンベロープにランダムに割り当てられたxおよび2xの可能な値を考えると、正しい答えは、左エンベロープまたは右エンベロープのどちらを選択した場合でも1.5xの期待値です。
ロバートF

3
@RobertF状況はより複雑です。次のようにお金が2つの封筒に分配されていることがわかっているとします。それが頭に着くまで公正なコインを投げ、コインが投げられた回数nを数えます。1つの封筒に2 ^ nドル、もう1つの封筒に2 ^(n + 1)を入れます。これで、非常に正確な期待値計算を実行しても、パラドックスを保持できます。
Ittay Weiss

31

眠れる森の美女の問題

これは最近の発明です。過去10年間で、哲学ジャーナルの小さなセット内で頻繁に議論されました。2つの非常に異なる答え(「Halfers」と「Thirders」)に対する堅実な支持者がいます。それは信念、確率、および条件付けの性質についての質問を提起し、人々を量子力学的な「多くの世界」解釈(他の奇妙なことの中でも)を引き起こさせました。

ウィキペディアの声明は次のとおりです。

眠れる森の美女ボランティアは、次の実験を経験し、次のすべての詳細を伝えられます。日曜日に彼女は眠りにつく。次に、公正なコインを投げて、どの実験手順を実施するかを決定します。コインが頭に浮かんだら、月曜日にビューティーが目覚め、インタビューを受け、実験が終了します。コインが尾を引くと、彼女は月曜日と火曜日に目覚め、インタビューを受けます。しかし、彼女が月曜日に再び眠りにつくとき、彼女は彼女の以前の目覚めを思い出すことができないことを保証する記憶喪失誘発薬の投与量を与えられます。この場合、火曜日にインタビューを受けた後、実験は終了します。

眠れる森の美女が目覚め、インタビューを受けたときはいつでも、彼女は尋ねられます、「コインが上陸したという命題に対するあなたの信用は今何ですか?」

サードポジションは、SBが「1/3」(これは単純なベイズの定理計算です)に応答することであり、ハーフマーポジションは「1/2」と言う必要があることです(明らかに、公正なコインの正しい確率だからです! )。私見、全体の議論は確率の限られた理解にかかっていますが、それは明らかなパラドックスを探求する全体のポイントではありませんか?

フロリモンド王子は眠れる森の美女を見つける

Project Gutenbergのイラスト。)


これはパラドックスを解決しようとする場所ではありませんが、それらを述べることだけを目的としていますが、私は人々をぶら下げたままにしたくないし、このページのほとんどの読者は哲学的説明を歩き回ることを望まないでしょう ET Jaynesからヒントを得ることができます。ETJaynesは、「人間の常識の数学モデルを構築するにはどうすればよいか」という質問に取って代わることができます。理想的な常識を表現する明確に定義された原則に従って、どれが有用なもっともらしい推論を実行しますか?」クローンできます実験の火曜日の部分にこのロボット(架空の記憶処理薬を投与する代わりに)を使用して、明確に分析できるSBセットアップの明確なモデルを作成します。統計的決定理論を使用してこれを標準的な方法でモデル化すると、ここで2つの質問が実際にあることがわかります(公正なコインが頭に着く可能性はどれくらいですか?また、コインが頭に着く可能性は何ですか?誰が目覚めたクローン?)。答えは、1/2(最初の場合)または1/3(2番目の場合、ベイズの定理を使用)です。このソリューションには量子力学的原理は含まれていませんでした:-)。


参照資料

Arntzenius、フランク(2002)。 眠れる森の美女への反省。分析62.1 pp 53-62。エルガ、アダム(2000)。自己発見の信念と眠れる森の美女の問題。分析60 pp 143-7。

フランチェスキ、ポール(2005)。 眠れる森の美女と世界縮小の問題。プレプリント。

グロイスマン、ベリー(2007)。 眠れる森の美女の悪夢の終わり

ルイス、D(2001)。 眠れる森の美女:Elgaへの返信。分析61.3 pp 171-6。

パピノー、デビッドビクターデュラビラ(2008)。 サードとエベレッティアン:ルイスの「クォンタムスリーピングビューティー」への返信

Pust、Joel(2008)。 眠れる森の美女のホーガン。合成160 pp 97-101。

Vineberg、スーザン未定、おそらく2003)。 美の注意書き

すべてはWeb上で見つけることができます(少なくとも数年前に見つかりました)。


1
「基本単位」の観点からソリューションを定式化することも同様に効果的だと思いますか?つまり、ベースユニットが人なのかインタビューなのかを考慮する必要があります。半数の人が頭を抱えていますが、面接の三分の一は頭を抱えています。次に、ベースユニットを選択するために、「このインタビューが「ヘッド」結果に関連付けられる可能性はどのくらいですか?」として質問とフレーズを再検討できます。
ジョナサン

1
SBはありましたどのように多くのインタビューを知っていないとの質問は約ある彼女の確率の評価ではなく、実験者の評価。彼女の観点からは、インタビューの数を決定することはできません。
whuberの

2
アーロン、最初に文学の議論を読むべきだと思います。(私は第三者であることを告白しますが、ハーフマーはあなたの推論が納得できるとは思わないでしょう。少なくとも、彼らの議論に欠陥がある理由を示す必要があります。)
whuber

1
フェアポイント、@ whuber、私は今、さらに文献を見てきました。私はエリスの眠れる森の美女を読んでいます:エルガへの返信。セクション4の冒頭で心配しているのは、この文です。私の議論」。「中心的または非中心的な新しい関連する証拠のみが信in性の変化を生み出します」。私はさらに考えて、それについて再びブログを書くでしょう。他の7人の博士課程の学生とこれについて長い議論をしました!
アーロンマクデイド

1
眠れる森の美女は、目覚めたときにカレンダーを見ることができますか?月曜日の場合、P(X = head)= 0.5と返信する必要があります。火曜日の場合、P(X = head)= 0。
ロバートF

25

サンクトペテルブルグのパラドックスあなたがの概念と意味で異なると思わせる、期待値。直感(主に統計のバックグラウンド持つ人々向け)と計算によって異なる結果が得られます。


5
ここで私はそれがとても不十分、それはそれに接続されている名前のないことが知られているようだが好きという別のですが、似た味で興味深い統計レッスンがあります:独立した確率変数の列が存在すると平均ゼロと一様にが分布で標準正規(CLTと同様収束するような有界分散 。ただし、(または好みの正​​の数)。X1,X2,nX¯nN(0,1)Var(nX¯n)17
枢機

@cardinal別の回答としてこの詳細を投稿できる可能性はありますか?
シルバーフィッシュ

@Silver各平均ゼロと分散正規分布を持たせます。何だろうのために漸近的に見えるように持っているに収束するには? f n f Var Xif(n)fVar(nX¯n)
whuberの

@whuberおそらく、分散を持つとして読む必要があります。その場合(独立性を使用して)がありますが収束する場合、シーケンスをCesàro加算可能にする必要がありますか? f i X i V a rXif(i)XifiVarVar(nX¯n)=1ni=1nf(i)f(i)Var(nX¯n)
シルバーフィッシュ

22

ジェフリーズ・リンドレーのパラドックスいくつかの状況下では仮説検証のfrequentistとベイズ法をデフォルトことを示し、完全に矛盾した答えを与えることができます。ユーザーは、これらの形式のテストが何を意味するのかを正確に考え、それが本当に必要なものかどうかを検討する必要があります。最近の例については、この説明を参照してください


20

有名な二人の女の子の誤fallがあります:

子供が2人いる家族で、子供の1人が女の子の場合、両方の子供が女の子である可能性はどのくらいですか?

ほとんどの人は直感的に言っています1/2が、答えはそう1/3です。問題は、基本的に、「1人の兄弟姉妹を持つすべての女の子から」1人の女の子をランダムに選択することは、「2人の子供と少なくとも1人の女の子を持つすべての家族から1人の家族」を均一に選択することと同じではないことです。


これは、理解すれば直観に合致するほど簡単ですが、理解するのがより難しい複雑なバージョンがあります。

子供が2人いる家族で、子供の1人が火曜日生まれた男の子である場合、両方の子供が男の子である可能性は何ですか? (回答:13/27)

子供が2人いる家族で、子供の1人がフロリダという名前の女の子である場合、両方の子供が女の子である可能性はどのくらいですか?(回答:「フロリダ」が非常にまれな名前であると仮定して、1/2に非常に近い)


これらのパズルのすべてに関する詳細は、この回答に記載されています
(また、火曜日生まれ男の子に関する詳細情報、フロリダという名前の女の子に関する詳細情報)


3
答えは確かではあり1/3ませ2/3んか?そのうち1つのみGB, BG, GG
マーティンスミス

3
「火曜日に生まれた少年」記事は良いです。非常に明確にされている(「問題は未定義」)主なポイントは、答えは採用する確率モデルに依存するということです。「その」答えが13/27であると言うのは誤解を招く(せいぜい)。
whuberの

@マーティン:ふふふ:)
BlueRaja-ダニーPflughoeft

2
これらの問題が非常に混乱している理由は、質問が言葉で表現されているため、仮説空間が何であるかを確認するのが非常に難しいからです。これにより、「同等の」ケースが実際に何であるか(したがって、何をカウントすべきか)がわかりにくくなります。
確率論的

1
私は生意気であるように感じます、そして質問の言葉遣いの方法は実際に子供たちが順序の点で交換可能であることを示しているだけであることに注意してください。これは、ことを意味します。しかし、他には何もありません!つまり、他の女の子の確率は、等しいということだけです。数値を取得するには、確率を割り当てる必要がありますが、これは与えられた情報ではできません。p(B1G2)=p(G1B2)p(G1G2)2p(B1G2)+p(G1G2)
確率論的

12

申し訳ありませんが、私は自分自身を助けることができません(私も統計的なパラドックスが大好きです!)

繰り返しますが、逆説自体ではなく、省略された変数バイアスの別の例です。

偽の因果関係/回帰
時間傾向のある変数は、時間傾向のある別の変数と相関します。たとえば、出生から27歳までの私の体重は、出生から27歳までのあなたの体重と高い相関があります。明らかに、私の体重はあなたの体重が原因ではありません。もしそうなら、もっと頻繁にジムに行くようお願いします。

省略された変数の説明は次のとおりです。私の体重を、あなたの体重をとします。ここで、 xtyt

xt=α0+α1t+ϵt andyt=β0+β1t+ηt.

次に、回帰 は、含まれている変数と相関する変数が省略されています。したがって、係数はバイアスされます(この場合、時間の経過とともに重みが大きくなるため、正になります)。X T γ 1

yt=γ0+γ1xt+νt
xtγ1

時系列分析を実行する場合、変数が定常的であることを確認する必要があります。そうでない場合、これらの偽の因果結果が得られます。

ここで与えられた自分の答えを盗用したことを完全に認めます。)


11

私のお気に入りの1つは、モンティホールの問題です。 二人とも信じられなかったので、私は乱数をシミュレートし、問題を試しました。驚いたことに、それは真実でした。

基本的に問題は、ゲームショーに3つのドアがあり、その1つが賞品で、残りの2つが何もない場合、ドアを選択し、残りの2つのドアのうちの1つが賞品ドアではなかった場合選択した場合は、現在のドアを残りのドアに切り替える必要があります。

Rシミュレーションへのリンクもここにあります:LINK


7

パロンドのパラドックス:

ウィキデディアから:「ゲーム理論のパラドックスであるパロンドのパラドックスは、次のように説明されています。負けた戦略の組み合わせが勝ち戦略になります。 :

ゲームのペアが存在し、それぞれが勝つよりも負けの確率が高く、ゲームを交互にプレイすることで勝ち戦略を構築することが可能です。

パロンドは、物理学者のリチャード・ファインマンが普及させたランダムな熱運動からエネルギーを引き出すことができる機械についての思考実験であるブラウンラチェットの分析に関連して、パラドックスを考案しました。しかし、厳密に分析するとパラドックスは消えます。」

パラドックスが経済的な群衆に聞こえるかもしれませんが、魅力的なのは、金融の時系列では容易に利用できない要件があります。いくつかのコンポーネント戦略が失われる可能性がありますが、相殺戦略は、ラチェット効果が発動するために、50%をはるかに上回るまたは下回る不平等で安定した確率を必要とします。およびその他、、長期間にわたって。PB(W)=3/4+ϵPA(W)=1/10+ϵ

アリソン混合」と呼ばれる最近の関連するパラドックスもあります。これは、2つのIIDおよび非相関シリーズを取得し、ランダムにスクランブルして、特定の混合が非ゼロの自己相関を持つ結果シリーズを作成できることを示しています。


6

ツーチャイルド問題とモンティホール問題が、パラドックスの文脈で頻繁に一緒に言及されるのは興味深いことです。どちらも、1889年に最初に示されたBertrandのBox Paradoxと呼ばれる見かけのパラドックスを示しています。同じ非常に教育された、非常に知的な人々がこのパラドックスに関して反対の方法でそれらの2つの問題に答えるので、私はそれを最も興味深い「パラドックス」と見つけます。また、ブリッジのようなカードゲームで使用されている制限付き選択の原則として知られる原則と比較され、その解決策はタイムテストされています。

ランダムに選択したアイテムがあり、これを「ボックス」と呼びます。可能なすべてのボックスには、2つの対称プロパティのうち少なくとも1つがありますが、一部には両方があります。プロパティを「ゴールド」と「シルバー」と呼びます。箱が金だけである確率はPです。また、プロパティは対称であるため、Pは箱が単なる銀である確率でもあります。これにより、ボックスに1つのプロパティ2Pのみが含まれる確率と、1〜2Pの両方に含まれる確率が決まります。

箱が金であると言われても、それが銀であるかどうかではない場合、金だけである可能性はP /(P +(1-2P))= P /(1-P)であると言いたくなるかもしれません。しかし、それはあなたがそれが銀だと言われたなら、あなたは1色の箱のために同じ確率を述べなければならないでしょう。そして、この確率が1色だけと言われたときにP /(1-P)である場合、色を言わなくてもP /(1-P)でなければなりません。それでも、最後の段落からは2Pであることがわかります。

この見かけ上のパラドックスは、ボックスの色が1つだけの場合、どの色が表示されるかについてあいまいさがないことに注意して解決します。ただし、2つある場合は、暗黙の選択肢があります。質問に答えるためには、その選択がどのように行われたかを知る必要があり、それが見かけのパラドックスの根本です。指示がない場合は、色がランダムに選択されたと仮定して、答えをP /(P +(1-2P)/ 2)= 2Pにすることができます。P /(1-P)が答えであると主張する場合、それが唯一の色でない限り、他の色が言及される可能性はないということを暗黙のうちに仮定しています。

モンティホール問題では、色の類推はあまり直感的ではありませんが、P = 1/3です。もともとにも同様にそうされている2つの未開封のドアに基づいて回答してい賞は、彼が選択した場合でも、モンティ・ホールは、彼がした扉を開くために必要とされたと仮定しています。その答えはP /(1-P)= 1/2です。彼がランダムに選択できるようにする答えは、スイッチングが勝つ確率のために2P = 2/3です。

Two Child Problemでは、私の例えの色は性別と非常によく似ています。4つの場合、P = 1/4。質問に答えるには、家族の中に女の子がいたとどのように判断されたかを知る必要があります。その方法で家族の男の子について学ぶことができた場合、答えはP /(1-P)= 1/3ではなく2P = 1/2です。フロリダという名前、または「火曜日に生まれた」という名前を考えると、もう少し複雑ですが、結果は同じです。選択肢があった場合の答えは正確に1/2であり、問​​題のほとんどの記述はそのような選択肢を意味します。そして、1/3から13/27に、または1/3から「ほぼ1/2」に「変わる」理由は、逆説的で直感的ではないように思われます。

制限付き選択の原則では、同じスーツのジャック、クイーン、キングなど、同等のカードのセットが不足していると言います。特定のカードが特定の対戦相手に属している場合でも、チャンスが始まります。しかし、対戦相手が1つをプレイした後、他のプレイヤーがいれば、そのカードをプレイできた可能性があるため、他のプレイヤーがいる可能性は減少します。


私はあなたの確率に従っていません。「対称」とは、を意味する場合(これが意味すると思います)、両方の確率がではなくであってはなりませんか?(それは明示的な状態に役立つだろうが、これは、私はあなたが意味すると思う独立性を、前提としています。)また、私は箱の確率があることでもないされるべきだと思う、というよりも、shouldn」それ?これらは P_S --then&場合を考えると簡単に見ることができますただし、「対称」とは&プロパティは完全に依存しています。ごめんなさい。PG=PSP22P(1P)212PPG=PS=.8PGS=1.6PGS=.6P=.5
グン

申し訳ありませんが、できるだけ簡潔にするために、うまく説明できなかったのかもしれません。私のPは、ボックスが金色である確率ではなく、だけの確率でした。金色の確率は1-Pです。また、2つのプロパティは対称的ですが、独立している必要はないため、確率を単に乗算することはできません。また、「どちらでもない」ボックスはありません。Bertrandは3つのボックスを使用し、それぞれに2つのコインがあります:金+金、金+銀、および銀+銀。任意の数の金貨の入った箱は、私の一般化では「金」です。
ジェフジョ

+1、それが役立ちます。私は今、「少なくとも2つのうちの1つ」というフレーズと、「ただ」という単語を見ています。
GUNG

6

私は次が好きです:ホストは、未知の分布を使用して、2つの数値個別に選択しています。分布についてプレイヤーに知られている唯一のものは、です。次に、プレーヤーには数字表示され、またはかどうかを推測するように求められます。明らかに、プレイヤーが常に推測する場合、プレイヤーは確率で正しいでしょう。しかし、少なくとも驚くべきことに、逆説的でないとしても、プレイヤーはその戦略を改善することができます。私は問題へのリンクを持っていないのではないかと心配しています(何年も前にワークショップで聞いたことがあります)。X Yの[ 0 1 ] P X = Y = 0 のX 、Y > X 、Y < X 、Y > X 0.5[0,1]x,y[0,1]P(x=y)=0xy>xy<xy>x0.5


2
Ittay様、Tom Coverがこの問題の元々の原因だと思います。彼のコミュニケーションと計算の解決の問題にもリストされていると思いますが、確認するのは便利ではありません。いい問題です。、またはランダムな(または)に対する制限は重要ではありません。乾杯。Y X[0,1]yx
枢機

2

生態学的な誤simplified(ここでは豊かな州/貧しい州の投票パラドックス)の簡略化されたグラフィカルな図解が、州の人口を集計するときに投票パターンの逆転を見る理由を直感的なレベルで理解するのに役立ちます:

ここに画像の説明を入力してください


3
これは良い例ですが、これはシンプソンのパラドックスだと思います。en.wikipedia.org
Nick

1
@Nick:この特定の例は、実際にはシンプソンのパラドックスとは異なりますが、統計的には同じように見えるため、特定の状況でどの誤り/パラドックスが適用されるかを知るのは困難です。違いは、SPはサブグループの分析時にのみ表示される「誤った効果」であるということです。ただし、この傾向は、サブグループの分析時にのみ表示される「真の効果」であると考えられます。この場合、生の数値としての収入は総体的に投票パターンに影響を与えないが、隣人(あなたの州)に関連する収入は投票パターンに影響を与えることを示唆している。
ジョナサン

以下で説明する生態学的な誤、です。
チャーリー

3
@Charlie 'below'および 'above'は、ページのリーダーが並べ替える方法(アクティブ/最も古い/投票)の関数であり、いずれの場合でも、並べ替え基準の一部の順序は時間とともに変化します(デフォルトを含む) 。そのため、参照するディスカッションを投稿した人、またはそれにリンクする人に言及する方がおそらく良いでしょう。
Glen_b

2

ある王国の王室の出生に関するデータを取得したとします。家系図では、それぞれの誕生が記録されました。この家族に特有なのは、最初の男の子が生まれてからもう子どもがいなくなって初めて両親が赤ちゃんを産もうとしているということです。

したがって、データは次のようになる可能性があります。

G G B
B
G G B
G B
G G G G G G G G G B
etc.

このサンプルの男の子と女の子の割合は、男の子を産む一般的な確率を反映していますか(0.5など)。答えと説明はこのスレッドにあります


2
この答えは、パラドックスではなくパズルのように見えます。なぜそのように投稿したいのか想像できますが、この答えがパラドックスと見なされ、このスレッドに適合するためには、より明確にする必要があると思います。
アメーバ

2
この質問(男の子と女の子を入れ替えたもの)はstats.stackexchange.com/questions/93830で尋ねられましたが、多数の回答が寄せられましたが、完全には一致していません!(問題を真剣に受け止め、現実的な方法で問題について考え、それを行うために必要な仮定を探ることで何かを学びました。)
whuber

@whuberリンクをありがとう!説明に追加しました。
ティム

2

これは再びシンプソンのパラドックスですが、「後方」と「前方」は、Judea Pearlの新しい本「Causal Inference in Statistics:A primer [^ 1]」から来ています。

古典的なSimponのParadoxは次のように機能します。2人の医師から選択することを検討してください。最良の結果が得られるものを自動的に選択します。しかし、最良の結果をもたらすものが最も簡単なケースを選択すると仮定します。相手の貧弱な記録は、トリッキーな仕事の結果です。

今、あなたは誰を選びますか?難易度によって層別化された結果を見てから決定する方が良い。

コインにはもう1つの側面があり(別のパラドックス)、層別化された結果は間違った選択につながる可能性があると述べています。

今回は、薬物を使用するかどうかを選択することを検討してください。この薬には毒性の副作用がありますが、治療作用のメカニズムは血圧を下げることです。全体として、この薬は人口の結果を改善しますが、治療後の血圧を層別化すると、低血圧グループと高血圧グループの両方で結果が悪化します。どうしてこれが本当ですか?なぜなら、我々は結果について意図せずに層別化しており、各結果の中で観察すべき残っているのは毒性副作用のみだからです。

明確にするために、薬が傷ついた心を固定するように設計されていると想像してください。血圧を下げることでこれを行い、血圧を階層化する代わりに、固定された心臓を階層化します。薬が効くと、心臓は固定されます(そして血圧は低くなります)が、一部の患者は毒性の副作用もあります。薬が効くため、「固定心臓」グループには、「壊れた」心臓グループに薬を服用している患者よりも、薬を服用した患者が多くなります。薬を服用している患者が増えると、副作用を起こす患者が増え、薬を服用しなかった患者の結果が明らかに(しかし誤って)改善されます。

薬を服用せずに良くなる患者は幸運です。薬を服用して改善した患者は、薬を改善するのに必要な人と、とにかく幸運だった人の混合です。「心が固定された」患者のみを検査するということは、薬物を服用していた場合に固定されていた患者を除外することを意味します。このような患者を除外するから害を除く意味取っていない順番に、我々は唯一の害を参照してください意味の薬剤服用薬を。

シンプソンのパラドックスは、主治医がトリッキーなケースのみを行うなど、治療以外の結果の原因がある場合に発生します。一般的な原因(トリッキーなケースと簡単なケース)を制御することで、真の効果を確認できます。後者の例では、原因ではなく結果を意図せずに階層化しているため、真の答えは階層化されたデータではなく集計にあります。

[^ 1]:Pearl J.統計における因果推論。ジョン・ワイリー&サンズ; 2016年


2

私の「お気に入り」の1つ、つまり多くの研究の解釈(そしてメディアだけでなく著者自身による解釈)に夢中になるのは、サバイバーシップバイアスです。

それを想像する一つの方法は、被験者に非常に有害な何らかの影響があり、そのため、被験者を殺す可能性が非常に高いと仮定することです。被験者が研究の前にこの効果さらされた場合、研究が始まるまでに、まだ生きている暴露された被験者は異常に回復力がある可能性が非常に高くなります。職場での文字通り自然な選択。これが発生すると、研究では、(すべての不健康なものはすでに死亡したり影響にさらされて停止することを確認しましたので)暴露被験者が異常に健康であることを確認します.Thisは、多くの場合、露出が実際にあることを意味していると誤解されて良いの被験者について。これは、切り捨てを無視した結果です (すなわち、死亡して研究に参加しなかった被験者を無視する)。

同様に、研究中に影響にさらされるのをやめる被験者は、信じられないほど不健康なことがよくあります。これは、継続的な暴露がおそらく彼らを殺すことに気付いたからです。しかし、この研究では、やめた人は非常に不健康であることがわかりました。

第二次世界大戦の爆撃機に関する@Charlieの答えは、この例と考えることができますが、現代の例もたくさんあります。最近の例は、1日 8杯以上のコーヒーを飲むことを報告している研究です(!!)は、55歳以上の被験者の心臓の健康状態がはるかに高いことと関連しています。博士号を持つ多くの人々は、これを「コーヒーを飲むことはあなたの心に良い!」と解釈しました、研究の著者を含みます。私はこれを読みました、あなたが55歳の後にまだ1日8杯のコーヒーを飲んでいて、心臓発作を起こさないためにあなたが信じられないほど健康な心臓を持たなければならないので。たとえそれがあなたを殺さないとしても、あなたの健康について何かが心配に見える瞬間、あなたを愛している誰もが(そしてあなたの医者も)すぐにあなたがコーヒーを飲むのをやめることを勧めます。さらなる研究により、若いグループではあまりコーヒーを飲むと有益な効果は得られないことがわかりました。それでも、多くの博士号が走り回っていて、「


私はあなたの解釈がよくわかりません。ノルウェーでは、1日に8杯のコーヒーを飲むことは通常ありません。平均値(子供や他の非飲酒者を含む)は1日に約2杯です。フィンランドでは、平均は1日あたり約2.5カップです。私はかつて1日10杯を飲んでいましたが、もうそうではありませんでした。
kjetil bハルヴォルセン

1

NewcombeのParadoxについてはまだ誰も言及していないことに驚いていますが、意思決定理論でより詳しく議論されています。それは間違いなく私のお気に入りの一つです。


-2

x、y、およびzを無相関ベクトルとします。それでも、x / zとy / zは相関します。


2
なぜこれは矛盾ですか?それは直感的なようです。
lcrmorin

2
これが通常そうでない場合、私は驚いたでしょう。
Glen_b

1
と「相関」が何を意味するのかは不明です。(おそらく「」要素ごと部門である-のないコンポーネントと仮定!ゼロではない)の意味で解釈されるべきで、「相関」である相関係数(本質的に標準化されたドット積)またはれる我々が扱うためにおよびをランダム変数として、その意味でそれらの相関係数を考慮しますか?x / z z X Y Zx/zx/zzX,Y,Z
whuberの
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.